Cargando precios...

Anthropic Restringe Acceso a su IA Claude Mythos Preview Tras Descubrir Miles de Fallos Críticos

Arturo Trenard Arturo Trenard · · 4 min de lectura

Anthropic Restringe Acceso a su IA Claude Mythos Preview Tras Descubrir Miles de Fallos Críticos

Anthropic ha limitado el acceso a su nuevo modelo de inteligencia artificial, Claude Mythos Preview, tras descubrir que puede identificar miles de vulnerabilidades críticas y antiguas en software global. Ante el riesgo de que estas capacidades sean mal utilizadas, la empresa ha formado una coalición defensiva, el Proyecto Glasswing, con más de 40 gigantes tecnológicos y financieros para parchear proactivamente los fallos.

Una Capacidad de Doble Filo

Las pruebas internas de Anthropic revelaron que Claude Mythos Preview posee una capacidad sin precedentes para auditar código de seguridad, identificando autónomamente miles de vulnerabilidades de alta gravedad en todos los sistemas operativos y navegadores web principales.

Esta capacidad generó una preocupación de seguridad a escala global. La compañía advirtió en un comunicado que, dada la velocidad del progreso de la IA, no pasará mucho tiempo antes de que tales capacidades proliferen más allá de actores comprometidos con su uso seguro. Esta advertencia se produce en un contexto donde, según el informe de AllAboutAI, los ciberataques potenciados por IA aumentaron un 72% interanual en 2025.

Nace el Proyecto Glasswing

Como respuesta, Anthropic tomó dos medidas cruciales: restringir el acceso al modelo a un grupo selecto y lanzar el Proyecto Glasswing. Esta iniciativa colaborativa reúne a más de 40 compañías, incluyendo a Amazon Web Services (AWS), Apple, Cisco, Google, JPMorgan, la Linux Foundation, Microsoft y Nvidia.

El objetivo de la alianza es utilizar las capacidades de Claude Mythos Preview de forma controlada para identificar fallos, compartir datos de manera segura y coordinar esfuerzos para parchear vulnerabilidades antes de que los actores maliciosos puedan explotarlas.

El Desafío de las Vulnerabilidades “Ancestrales”

El descubrimiento pone de relieve el problema de las vulnerabilidades de día cero. La IA promete cambiar radicalmente la escala y velocidad de su detección, un proceso que tradicionalmente ha requerido expertise humano escaso y costoso.

La profundidad del análisis es alarmante. Anthropic señaló que los fallos encontrados son a menudo sutiles y muchos tienen 10 o 20 años de antigüedad, permaneciendo ocultos en el código base de software esencial. Entre los ejemplos citados se encuentran:

  • Un error de 27 años en OpenBSD (ya parcheado).
  • Un fallo de 16 años en la biblioteca de procesamiento de medios FFmpeg.
  • Una vulnerabilidad de ejecución remota de código de 17 años en FreeBSD.
  • “Numerosas” vulnerabilidades en el kernel de Linux.

El alcance también incluye debilidades en protocolos criptográficos fundamentales como TLS, AES-GCM y SSH, y vulnerabilidades comunes en aplicaciones web como cross-site scripting (XSS) e inyección SQL.

La razón principal para el secretismo es abrumadora: aproximadamente el 99% de las vulnerabilidades descubiertas no están parcheadas. “Sería irresponsable por nuestra parte divulgar detalles sobre ellas”, justificó la compañía.

Una Transición Llena de Riesgos Hacia un Futuro Más Seguro

Anthropic advierte que este episodio probablemente marque solo el comienzo de una tendencia transformadora y peligrosa. La empresa prevé un largo período de adaptación, señalando que “el trabajo de defender la infraestructura cibernética del mundo podría llevar años”.

“A la larga, esperamos que las capacidades defensivas dominen: que el mundo emerja más seguro, con un software mejor reforzado—en gran parte por código escrito por estos modelos. Pero el período de transición estará lleno de riesgos”.

La inteligencia artificial se consolida así como una herramienta de doble filo, con el potencial de endurecer fundamentalmente el software global, pero solo después de superar una fase de vulnerabilidad sin precedentes.

Click to rate this post!
[Total: 0 Average: 0]