Cargando precios...

La eliminación de barreras en modelos de IA de código abierto en minutos expone los límites de la regulación actual

Arturo Trenard Arturo Trenard · · 5 min de lectura

La eliminación de barreras en modelos de IA de código abierto en minutos expone los límites de la regulación actual

Las barreras de seguridad de los modelos de inteligencia artificial de código abierto de empresas como Meta y Google pueden ser eliminadas en menos de diez minutos utilizando herramientas públicas, según pruebas realizadas por el Financial Times en colaboración con el grupo de seguridad AI Alice. Los modelos modificados respondieron a consultas sobre bioweapons y malware que los originales bloqueaban, generando dudas sobre la efectividad de la regulación centrada únicamente en la etapa de creación de los modelos. El caso expone la dificultad de controlar sistemas que pueden ser descargados, alterados y redistribuidos fuera del control de sus desarrolladores originales.

Los hallazgos, publicados este lunes, revelan que las salvaguardas incrustadas por los desarrolladores en los modelos de código abierto pueden no persistir una vez que los pesos del modelo son liberados y modificados, desafiando así los marcos regulatorios actuales.

Hallazgos clave de la investigación: Seguridad eliminada en minutos

Metodología de las pruebas

El Financial Times y el grupo de seguridad AI Alice utilizaron herramientas disponibles en repositorios públicos de código para llevar a cabo las pruebas. El proceso, que no requirió hardware especializado, tomó menos de diez minutos para eliminar las barreras de seguridad de modelos de Meta y Google, así como de otros grupos tecnológicos importantes.

Resultados obtenidos

Antes de la modificación, los modelos originales rechazaron consultas sobre malware y peligros químicos. Sin embargo, las versiones modificadas de los mismos modelos respondieron a esas mismas consultas prohibidas, incluyendo la generación de contenido relacionado con bioweapons y otras áreas restringidas. Esto demuestra que las barreras impuestas por los desarrolladores pueden ser fácilmente sorteadas una vez que el modelo está en manos de terceros.

El dilema de la gobernanza: ¿Quién es responsable?

Regulación actual y sus limitaciones

Los reguladores globales están desarrollando marcos como la Ley de IA de la Unión Europea y enfoques de seguridad para modelos frontera en Reino Unido y Estados Unidos. Sin embargo, los hallazgos de esta investigación muestran que las suposiciones actuales de gobernanza son limitadas, ya que no consideran la modificación posterior a la liberación de los modelos. El caso revela que las barreras de seguridad pueden ser eliminadas rápidamente, lo que pone en tela de juicio la efectividad de una regulación centrada exclusivamente en la etapa de construcción del modelo.

Voces de la industria

Expertos del sector han manifestado su preocupación ante estos hallazgos. Markus Levin, de XYO, señaló que la rápida eliminación de salvaguardas muestra «cómo el control se desplaza rápidamente una vez que los modelos abiertos son liberados». Levin criticó que la mayoría de las propuestas regulatorias se centran demasiado en la etapa de construcción del modelo, ignorando lo que sucede después.

Por su parte, David Minarsch, de Olas y Valory, advirtió que los gobiernos difícilmente evitarán que actores determinados accedan o modifiquen modelos una vez que los pesos estén ampliamente espejados en línea. Minarsch propuso regular el despliegue, la distribución y el uso dañino en el mundo real, en lugar de centrarse únicamente en la creación del modelo.

El control se traslada «río abajo»: Del desarrollador al usuario y la infraestructura

Gobernanza en múltiples capas

Ronghui Gu, de CertiK, explicó que la gobernanza en la capa del desarrollador sigue siendo importante, pero se vuelve insuficiente una vez que los modelos se pueden descargar y redistribuir libremente. Gu propuso que los formuladores de políticas tienen más influencia sobre el alojamiento comercial, el despliegue empresarial y los canales de distribución. Además, señaló la necesidad de estándares de seguridad que identifiquen comportamientos maliciosos en herramientas de IA de terceros antes del despliegue.

Lecciones del software de código abierto y las criptomonedas

Tanto Levin como Minarsch compararon el problema con el software de código abierto y las redes de criptomonedas, donde los intentos de suprimir la distribución han sido históricamente difíciles una vez que el código es público. Minarsch destacó que las capas de seguridad pueden disuadir el uso casual, pero no deben confundirse con una protección robusta contra actores sofisticados. La analogía subraya que, una vez que la tecnología se libera, el control efectivo se traslada del desarrollador al usuario y a la infraestructura de distribución.

Contexto y antecedentes

La diferencia clave entre los modelos propietarios y los de código abierto radica en que estos últimos pueden ser descargados, alterados y redistribuidos libremente. Mientras que los marcos regulatorios como la Ley de IA de la UE y los enfoques en Reino Unido y Estados Unidos están en desarrollo, los hallazgos de esta investigación sugieren que deben adaptarse para abordar los riesgos posteriores al lanzamiento.

Además, se ha identificado una tendencia creciente hacia los agentes de IA autónomos, lo que, según Gu, requerirá medidas para contener amenazas en tiempo de ejecución. Un artículo relacionado citado en la investigación, titulado «AI agents must be treated as untrusted systems: Researchers», refuerza esta perspectiva, señalando que los sistemas de IA deben ser tratados como potencialmente no confiables.

Click to rate this post!
[Total: 0 Average: 0]