La IA Mythos supera uno de los retos más difíciles de la ciberseguridad :»Las vulnerabilidades más peligrosas suelen esconderse justo donde nadie está mirando»

Escrito por

en

​​

Seguro que has escuchado o leído el nombre de Claude Mythos. Hablamos de un modelo de IA, de la compañía Anthropic, creado para encontrar fallos graves en cualquier sistema con una precisión casi infalible. El problema es que esta, de ser abierta al público, también podría usarse para crear todo tipo de vulnerabilidades. Por eso se decidió restringir.

La parte negativa es que, detrás de esta decisión, más allá del miedo que ha generado en población, empresas y gobiernos de todo el mundo, muchos consideran que hay más marketing que realidad.

Sin ir más lejos, el creador de cURL, una de las herramientas más importantes de Internet, quiso hace unos meses desmontar el miedo al apocalipsis de la nueva IA de Anthropic. Afirma que es una increíble campaña de publicidad.

«El gran revuelo en torno a este modelo hasta ahora fue principalmente marketing. No veo ninguna evidencia de que esta configuración detecte problemas con mayor precisión o agudeza que las herramientas anteriores a Mythos. Quizás este modelo sea un poco mejor, pero incluso si lo es, no lo suficiente como para marcar una diferencia significativa en el análisis de código», comenta.

Con dos bandos muy diferenciados (los que afirman que es una eminencia para la ciberseguridad y los que lo tachan de puro humo), un desarrollador independiente ha querido ponerlo a prueba. El experto ha creado un banco de pruebas utilizando código limpio y real para medir las capacidades de los modelos de inteligencia artificial que cualquiera puede usar hoy en día.

El experimento consiste en coger varios errores informáticos muy difíciles que Mythos descubrió en su día, buscar cómo estaba escrito ese programa justo antes de que se arreglara el fallo y ponérselo delante a otras inteligencias artificiales del mercado para ver si son capaces de encontrarlos.

Los primeros datos que consiguió extraer son un tanto agridulces, ya que se dio cuenta de que encontrar fallos dentro de un solo archivo de texto es algo más o menos sencillo, pero la cosa se complica cuando el error está escondido en una maraña de documentos. Lo que sí que pudo comprobar es que estos modelos demostraron tener bastantes puntos flacos, lo que da bastantes puntos a la idea de que Mythos está bastantes pasos por delante.

¿Qué modelos de inteligencia artificial son los mejores para buscar fallos de seguridad según las pruebas?

Tal y como pudo comprobar, y para sorpresa de muchos, los modelos de IA más top del mercado no es que hayan salido especialmente bien parados. No ha ocurrido lo mismo con los modelos chinos y los que son totalmente gratuitos.

En concreto, el modelo GPT-5.5 Pro de OpenAI consiguió un buen porcentaje de aciertos, pero la gran sorpresa la han dado herramientas mucho más baratas como MiMo o DeepSeek, que han conseguido cazar la misma cantidad de errores graves por una décima parte del dinero que cuesta usar los servidores de las marcas americanas.

Por otro lado, destaca algunas inteligencias artificiales como Qwen 3.6, un modelo que el experto pudo ejecutar de forma local en su propio ordenador con 128 gigabytes de memoria RAM. A pesar de funcionar en un PC de casa y ser un poco más lento, encontró más fallos reales y se inventó menos peligros falsos que Gemini 3.1 Pro.

Pero esto no es todo, porque parece que Europa no sale muy bien parada en este experimento. Mistral Medium, el modelo creado por esta empresa de inteligencia artificial de la Unión Europea, demostró ser un auténtico desastre.

Con todo esto, y volviendo al tema que nos compete, las pruebas dejan bien claro que, si bien no es una IA que vaya a tirar por completo la ciberseguridad mundial tal y como muchos quieren hacer ver, sí que es cierto que está un paso por delante de cualquier otro modelo tope de gama del mercado.

 

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *