¿Se acuerdan de la alharaca que desató Anthropic en marzo pasado tras “accidentalmente” revelar su modelo Claude Mythos al mundo?
Para quienes no siguen estos temas tan de cerca, o simplemente están abrumados con todo lo que ocurre en el ámbito tecnológico, vale la pena refrescar la memoria. Mythos fue expuesto por la propia Anthropic debido a una supuesta mala configuración de su sistema de gestión de contenidos. La ocasión sirvió además para que la compañía reforzara un mensaje que ya venía construyendo: que este modelo es tan poderoso y avanzado que podría resultar peligroso en las manos equivocadas. Por esa razón, su acceso quedó restringido a grupos específicos mediante una iniciativa conocida como Project Glasswing.
¿Y qué hace a Mythos tan especial? La respuesta pasa por una combinación de capacidades que, según Anthropic, representan avances sin precedentes en ingeniería autónoma de software y ciberseguridad ofensiva. Mythos es capaz de identificar fallos en sistemas, detectar vulnerabilidades e incluso descubrir potenciales ataques de día cero. Más inquietante aún es que no se limita a señalar estos hallazgos, sino que también puede proceder a ejecutarlos por cuenta propia. A esto se suma un componente recursivo: observa los resultados de sus acciones, aprende de sus errores y ajusta su comportamiento para mejorar continuamente. En otras palabras, no se comporta únicamente como un chatbot que responde preguntas, sino como un agente capaz de formular hipótesis, proponer cursos de acción y ejecutar código con un elevado grado de autonomía.
Todas estas capacidades, aunque limitadas por un conjunto de salvaguardas diseñadas por Anthropic, están ahora disponibles para el público general a través de Claude Fable 5, una especie de versión “PG” de Mythos. Pero si Mythos llamó la atención por lo que podía hacer, Fable 5 lo está haciendo por las decisiones que Anthropic tomó para controlar esas capacidades.
Al tratarse de una versión controlada, Claude Fable 5 restringe algunas de las funcionalidades más extremas de Mythos. Cuando detecta consultas o instrucciones que podrían derivar en situaciones de riesgo, el sistema reduce automáticamente sus capacidades y delega la respuesta a un modelo anterior, Claude Opus 4.8. Esta medida aplica especialmente a áreas como la ciberseguridad y la investigación científica avanzada, precisamente donde muchos investigadores consideran que el acceso a las capacidades completas del modelo sería más valioso.
Es aquí donde surge uno de los principales focos de conflicto. Diversos investigadores en inteligencia artificial sostienen que Anthropic está saboteando activamente ciertos esfuerzos de investigación al negar acceso a lo que ellos consideran su modelo más brillante y avanzado cuando las consultas involucran desarrollos de IA de avanzada
La acusación no surge de la nada. En la tarjeta de sistema de Fable 5, un documento de 319 páginas que detalla el funcionamiento, rendimiento, riesgos y medidas de seguridad del modelo, se establece de forma explícita que cualquier tema relacionado con inteligencia artificial avanzada puede recibir deliberadamente respuestas simplificadas. Lo más llamativo es que esta degradación ocurre sin advertir al usuario que el sistema ha sido revertido a un modelo anterior. Dado que este comportamiento no se replica de la misma manera en otros ámbitos, muchos interpretan la medida como una forma de limitar selectivamente el acceso al conocimiento más avanzado.
Las controversias no terminan ahí. En nombre de la seguridad y la integridad de la plataforma, Anthropic también ha confirmado que recopilará y almacenará datos durante al menos 30 días. La pregunta inevitable es si esta práctica responde únicamente a consideraciones legítimas de seguridad o si existen intereses adicionales detrás de una política que inevitablemente despierta inquietudes sobre privacidad y control.
Por supuesto, tampoco faltan las críticas relacionadas con el consumo de tokens. Numerosos usuarios se quejan de que Fable 5 agota los recursos disponibles mucho más rápido que su predecesor, una situación que, en la práctica, termina encareciendo el uso de la plataforma.
Todo esto resulta particularmente interesante porque Anthropic ha construido buena parte de su reputación sobre una imagen de prudencia y moderación. Dentro del ecosistema de la inteligencia artificial, la compañía se ha posicionado como una de las voces más conservadoras, insistiendo una y otra vez en la necesidad de reducir la velocidad del desarrollo, establecer regulaciones y aplicar salvaguardas que garanticen que esta tecnología beneficie a la humanidad.
Sin embargo, esta es también la misma empresa que no pierde oportunidad para destacar las capacidades extraordinarias de sus modelos, la misma que continúa acelerando el desarrollo de nuevas generaciones de IA y la misma que ha logrado superar a OpenAI en varios frentes estratégicos, incluyendo la carrera por llegar primero al mercado mediante una oferta pública inicial. La contradicción es difícil de ignorar. Si la tecnología es tan peligrosa como afirman, ¿por qué seguir empujando sus límites? Y si no lo es tanto, ¿por qué tantas restricciones? Al final, la pregunta sigue siendo la misma: ¿a quién creerle?






