La empresa estadounidense Anthropic, creadora de los modelos de inteligencia artificial Claude, ha puesto a disposición del público general la versión más potente de su tecnología, aunque con restricciones en áreas sensibles como la ciberseguridad y los riesgos de ataques biológicos. Este nuevo modelo, denominado Fable 5, es el primero de la clase Mythos, la gama más avanzada de la compañía, que fue presentada en abril pero inicialmente limitada por motivos de seguridad.
Versiones limitadas y sin restricciones
Fable 5 está disponible para el público con limitaciones, mientras que Anthropic ofrece una versión sin restricciones, Claude Mythos 5, a empresas, organizaciones y agencias estatales que ya tienen acceso a esta familia de modelos. Esta versión es capaz de detectar y explotar fallos de seguridad a una velocidad y precisión sin precedentes.
A principios de abril, Anthropic había anunciado la existencia de Mythos y su decisión de restringir su acceso a socios de confianza para mejorar la protección contra ciberataques. Esta medida generó críticas de "marketing del miedo" y provocó inquietud entre gobiernos e instituciones globales, que evaluaron el nivel de amenaza sobre infraestructuras críticas como bancos y sistemas energéticos.
Pruebas y reacciones gubernamentales
Desde entonces, varias empresas que probaron Mythos confirmaron sus capacidades. Incluso el gobierno de Estados Unidos, a pesar de estar en litigio con Anthropic, terminó evaluando el modelo. La Casa Blanca implementó un sistema de evaluación opcional para los modelos de IA estadounidenses más potentes antes de su comercialización. Por su parte, OpenAI, el principal competidor de Anthropic, se prepara para lanzar la versión 5.6 de su ChatGPT.
Riesgos biológicos y medidas de seguridad
Anteriormente, Anthropic justificaba las restricciones de Mythos solo por riesgos de ciberseguridad. Sin embargo, con Fable 5, la compañía amplió la vigilancia a los riesgos de ataques biológicos, sin especificar amenazas concretas como armas químicas o bacteriológicas. La mayoría de las solicitudes relacionadas con ciberseguridad o biología son respondidas por el modelo inferior Opus 4.8, lanzado a finales de mayo.
El sistema de seguridad se basa en filtros automáticos que analizan las solicitudes en tiempo real y bloquean aquellas que tratan temas sensibles. Anthropic encargó a expertos externos que intentaran sortear estos filtros, ofreciendo recompensas por encontrar fallos. Según la empresa, en mil horas de pruebas nadie logró un "bypass universal" que desbloqueara completamente el modelo, aunque no se informó si se identificaron bypass puntuales.



