in

Anthropic aprueba el regreso de Fable 5 tras años de retraso

Anthropic ha anunciado que reinstaurará el acceso a Claude Fable 5 a partir de mañana, tras la retirada de las restricciones de exportación impuestas por el Departamento de Comercio de Estados Unidos. La decisión llega después de semanas de negociaciones con la administración de Trump y se acompañará de la reactivación progresiva de los servicios en la nube de AWS, Google Cloud y Microsoft Foundry, aunque sin una fecha exacta para estos últimos.

El bloqueo, que se había aplicado en junio, prohibía que cualquier persona ajena a EE. UU., incluidos empleados internacionales de Anthropic y usuarios de clientes corporativos, pudiera interactuar con los modelos Fable 5 y Mythos 5. La medida se adoptó bajo la sospecha de que el modelo podía ser vulnerado mediante técnicas de “jailbreak”, una vulnerabilidad que, según un informe de investigadores de Amazon, permitía eludir los filtros de seguridad. Para contrarrestar la amenaza, Anthropic entrenó un nuevo clasificador de seguridad que intercepta y bloquea la técnica descrita en el reporte, logrando una tasa de bloqueo superior al 99 %. Cuando una solicitud es retenida, el sistema la redirige automáticamente a Opus 4.8, manteniendo la experiencia del usuario sin interrupciones visibles.

En el comunicado publicado en su blog, la compañía detalla una serie de cambios estructurales destinados a reforzar la resiliencia del modelo. Entre ellos, la creación de un equipo de vigilancia 24 horas que monitorea los canales de reporte de jailbreak, y la apertura de un programa en HackerOne para que investigadores externos presenten posibles vulnerabilidades. Además, Anthropic está desarrollando un marco colaborativo, bajo el nombre de Project Glasswing, que aglutina a Amazon, Microsoft, Google y otros socios para definir criterios de gravedad en los jailbreaks: ganancia de capacidad para el atacante, alcance de esa ganancia, facilidad de weaponisation y descubribilidad del método.

La política de acceso a Mythos 5 también ha evolucionado. El gobierno ha autorizado su uso exclusivamente a organizaciones preaprobadas, permitiendo a los miembros no estadounidenses de esas entidades —y a los propios empleados extranjeros de Anthropic— volver a utilizar el modelo. Este esquema de despliegue restringido se ha aplicado recientemente a GPT‑5.6 de OpenAI, lo que sugiere una tendencia a priorizar evaluaciones controladas antes de una disponibilidad más amplia.

Anthropic subraya que seguirá cooperando estrechamente con la administración para expandir el acceso tanto a socios locales como internacionales. La empresa propone ofrecer “acceso gubernamental previo a la publicación” y evaluaciones independientes de los modelos, particularmente los que tengan implicaciones de seguridad nacional. En esas fases preliminares, los funcionarios podrán contar con el apoyo directo del personal técnico de Anthropic, facilitando pruebas de guardias y auditorías de desempeño antes del lanzamiento comercial.

Otro punto focal del blog es el intento de crear un estándar voluntario y compartido para la evaluación de modelos frontera. La iniciativa busca consolidar a los principales laboratorios de IA en un cuerpo regulador informal que establezca pautas de seguridad y métricas de evaluación, reduciendo la fragmentación actual del sector. Anthropic también ha prometido destinar recursos computacionales significativos para la investigación y pruebas de los socios gubernamentales, y poner a disposición su experiencia en red‑team y seguridad para elevar el nivel de la evaluación de IA a nivel global.

A pesar de los avances, la compañía reconoce que la robustez absoluta contra jailbreaks es inalcanzable. En su publicación advierte que seguirán surgiendo vulnerabilidades, desde fallos menores hasta incidentes con potencial de daño más serio, y que los equipos de seguridad continuarán red‑teamando el modelo de forma continua. La postura proactiva, combinada con la vigilancia constante y la colaboración interindustrial, pretende mitigar los riesgos sin frenar la innovación en el campo de la inteligencia artificial.

El anuncio de la reapertura de Claude Fable 5 tiene importantes repercusiones para los usuarios de soluciones basadas en IA, tanto en entornos empresariales como en proyectos de investigación. Al eliminar la restricción de exportación, se abre la puerta a una mayor adopción de la tecnología en aplicaciones de generación de texto, asistencia al cliente y desarrollo de software, mientras que el refuerzo de los mecanismos de seguridad intenta equilibrar la expansión con la necesidad de proteger contra abusos. En este cruce entre regulación y desarrollo, la industria de la Tecnología parece estar trazando un nuevo paradigma de cooperación público‑privada, donde la seguridad y la innovación avanzan de la mano.

¿Qué opinas?

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

EE.UU oferta $10 millones por datos grupo detrás hackeo a Signal y WhatsApp

Getty y Shutterstock abortan fusión, revelan tensiones regulatorias y estratégicas