Claude Fable 5: por qué Anthropic lanzó un modelo que se consideró demasiado peligroso durante meses

Actualizado:
Claude Fable 5: por qué Anthropic lanzó un modelo que se consideró demasiado peligroso durante meses
En resumen: El 9 de junio de 2026, Anthropic lanzó Claude Fable 5, el primer modelo público de la clase Mythos, que anteriormente estaba restringido debido a riesgos de ciberseguridad. La misma base tecnológica que Mythos 5, pero con clasificadores de seguridad activos. Precio: $10 / $50 por millón de tokens. Benchmarks: 80,3% SWE-Bench Pro, #1 en FrontierCode Diamond.

Claude Fable 5: por qué Anthropic lanzó un modelo que durante meses se consideró demasiado peligroso

En abril de 2026, Anthropic presentó Claude Mythos y restringió inmediatamente su acceso: solo para organizaciones seleccionadas dedicadas a la protección de infraestructuras críticas. El 9 de junio, la misma empresa anunció Claude Fable 5, una versión pública del modelo con la misma base tecnológica. ¿Qué ha cambiado en dos meses y por qué ahora?

¿Qué es Claude Fable 5?

Claude Fable 5 es el primer modelo de la nueva clase Mythos de Anthropic disponible para el público general. El nombre no es casual: fable del latín — fabula, "lo que se cuenta" — comparte la misma raíz que el griego mythos. No es un juego de marketing, sino una señal: Fable 5 y Mythos 5 se basan en los mismos pesos del modelo. La diferencia no está en la arquitectura, sino en la capa de seguridad.

Anthropic posiciona la clase Mythos como un nivel superior a Opus. El primer modelo de esta clase, Claude Mythos Preview, se lanzó en abril de 2026 a través del programa cerrado Project Glasswing, y no estuvo disponible para el público general hasta el 9 de junio.

¿Por qué se ocultó el modelo Mythos al público general?

La razón principal fue la ciberseguridad. Ya en abril, Anthropic describió las capacidades de Mythos como tales que podían "detectar y explotar vulnerabilidades en el software de manera extremadamente efectiva". Precisamente esta característica impresionó tanto a Wall Street como a las estructuras gubernamentales de EE. UU., y precisamente por eso la empresa no planeaba lanzar el modelo al público.

El esquema de acceso se desarrolló por etapas:

  • Abril de 2026 — Mythos Preview disponible solo para unos pocos socios dentro del Project Glasswing, exclusivamente para la protección de infraestructuras críticas.
  • Finales de mayo de 2026 — El programa se amplió a varios cientos de organizaciones en 15 países, pero nuevamente solo para tareas de defensa.
  • 9 de junio de 2026 — Lanzamiento de Claude Fable 5 para el público general.

Paralelamente, la empresa advirtió públicamente: los modelos de vanguardia se están volviendo tan potentes que en los próximos meses podrían alcanzar el nivel de auto-mejora recursiva (RSI), es decir, la mejora autónoma de su propio código sin intervención humana. A primera vista, esto contradice la decisión de lanzar Fable 5 precisamente ahora. Pero la lógica de Anthropic es diferente: no esperar a que el modelo se vuelva aún más potente, sino lanzarlo con una capa de protección probada, mientras el control aún sea posible.

Fable 5 vs Mythos 5: ¿Cuál es la diferencia?

El punto clave: es el mismo modelo. La diferencia radica exclusivamente en la configuración de los clasificadores de seguridad. Fable 5 tiene una capa de protección activa; Mythos 5 es la misma arquitectura, pero con restricciones parcialmente eliminadas para los socios verificados del Project Glasswing.

La siguiente tabla muestra ExploitBench: un benchmark de la industria que mide la capacidad del modelo para encontrar y explotar vulnerabilidades reales en el software. Precisamente este indicador fue la razón principal del lanzamiento restringido de Mythos.

Parámetro Claude Fable 5 Claude Mythos 5
Base tecnológica Clase Mythos Clase Mythos
Acceso Público (API, suscripciones) Solo Project Glasswing
Ciberseguridad Bloqueado → fallback a Opus 4.8 Eliminado para socios verificados
Biología / química Bloqueado → fallback a Opus 4.8 Se abrirá para socios de confianza en versiones futuras
ExploitBench ~0% (bloqueado por clasificador) 78,0%
Precio $10 / $50 por millón de tokens $10 / $50 por millón de tokens

Anthropic confirmó: en benchmarks que no se relacionan con dominios bloqueados, la diferencia en los resultados de Fable 5 y Mythos 5 es de 1-3 puntos porcentuales, dentro del margen de ruido estadístico.

Claude Fable 5: por qué Anthropic lanzó un modelo que se consideró demasiado peligroso durante meses

Benchmarks: cifras y lo que hay detrás

A continuación se presentan los puntos de referencia clave del anuncio oficial de Anthropic y pruebas independientes a partir del 9 y 10 de junio de 2026. Las marcas ★ indican que el resultado pertenece a Mythos 5; Fable 5 cae al nivel de Opus 4.8 en estas categorías debido a un fallback.

Benchmark Fable 5 / Mythos 5 Opus 4.8 GPT-5.5 Gemini 3.1 Pro
SWE-Bench Verified 95,0% ~83%
SWE-Bench Pro 80,3% 69,2% 58,6% 54,2%
FrontierCode Diamond 29,3% 13,4% 5,7%
Terminal-Bench 2.1 88,0% ★
GDPval-AA (Elo) 1932 1890
Humanity's Last Exam 59,0%
ExploitBench ★ ~0% (Fable) / 78,0% (Mythos) 40,0%

Qué entender de las cifras:

  • SWE-Bench Pro es un punto de referencia más fiable que SWE-Bench Verified. OpenAI reconoció la contaminación de datos en la versión Verified; la versión Pro prueba tareas reales en repositorios cerrados.
  • FrontierCode es el más representativo para código de producción. 29,3% frente a 13,4% en Opus 4.8 significa que Fable 5 resuelve más del doble de tareas de ingeniería complejas.
  • ExploitBench es un espejo de la solución arquitectónica. Mythos 5 obtiene 78%, Fable 5 alrededor de cero. Esta es la esencia de la diferenciación entre los dos modelos.

Un análisis más detallado de los puntos de referencia de la generación anterior y cómo se veía Opus 4.8 antes del lanzamiento de Fable 5 se encuentra en nuestro artículo Claude Opus 4.8: puntos de referencia, cifras y lo que hay detrás.

¿Qué limitaciones tiene la versión pública?

Anthropic ha implementado una capa de clasificadores que intercepta las consultas en cuatro categorías y las redirige a Claude Opus 4.8:

  • Ciberseguridad: búsqueda y explotación de vulnerabilidades, desarrollo de software de ataque
  • Biología: síntesis de sustancias peligrosas, diseño de patógenos
  • Química: síntesis de sustancias de doble uso
  • Destilación de modelos: intentos de reproducir pesos internos a través de inferencias

Técnicamente: cuando se activa el clasificador, la API devuelve un HTTP 200 con stop_reason: "refusal" y un campo stop_details.category con el valor "cyber", "bio", "reasoning_extraction" o null. Si no hubo inferencia, la consulta no se factura.

Según Anthropic, los clasificadores se activan en menos del 5% de las sesiones en promedio. La empresa reconoce la existencia de falsos positivos y promete reducirlos con el lanzamiento de nuevas versiones.

Antes del lanzamiento, Anthropic realizó un bug bounty externo: más de 1.000 horas de pruebas no revelaron ningún jailbreak universal.

¿Para qué tareas recomienda Anthropic Fable 5?

Escenario Por qué Fable 5 es adecuado
Programación y revisión de código 80,3% SWE-Bench Pro, #1 FrontierCode: ideal para tareas de agente largas y migraciones
Análisis de datos y finanzas #1 en Hebbia Finance Benchmark para nivel senior: tablas, gráficos, análisis de causa raíz
Tareas de agente (Claude Code) Funcionamiento autónomo durante una semana sin intervención humana; en la prueba de Stripe, comprimió 2 meses de trabajo del equipo en un día
Visión por computadora Estado del arte: recreación de una aplicación web a partir de una captura de pantalla, lectura precisa de gráficos científicos
Investigación científica Generación de hipótesis en biología molecular (a través de Mythos 5); Fable 5 para análisis de literatura y genómica sin restricciones
Trabajo legal En una revisión a ciegas, los abogados calificaron las redacciones de Fable 5 como iguales o mejores que el modelo anterior en el 100% de los casos

Para tareas rutinarias donde no se requiere el nivel de complejidad de SWE-Bench Pro, Claude Opus 4.8 sigue siendo una opción más racional: el doble de barato por los mismos tokens.

Claude Fable 5: por qué Anthropic lanzó un modelo que se consideró demasiado peligroso durante meses

Cómo acceder a Claude Fable 5

Método de acceso Detalles
Claude Pro / Max / Team / Enterprise (suscripciones) Gratis hasta el 22 de junio de 2026; a partir del 23 de junio, se necesitarán créditos de uso; más adelante se planea volver a los planes estándar
Claude API ID del modelo: claude-fable-5; disponible ahora
Amazon Bedrock Disponible desde el día del lanzamiento
Google Cloud / Microsoft Foundry Disponible desde el día del lanzamiento
GitHub Copilot Disponible; requiere hasta 30 días de retención de prompt+output para el funcionamiento de los clasificadores (desactivado por defecto en el administrador de Copilot)
Claude Code (CLI) Disponible desde el día del lanzamiento

Punto práctico: si el modelo aún no aparece en tu lista, te recomiendo simplemente actualizar la página o cerrar sesión y volver a iniciarla. En mi caso, Claude Fable 5 apareció después de reiniciar la interfaz, sin ninguna configuración adicional.

¿Cuánto cuesta Claude Fable 5?

Parámetro Fable 5 / Mythos 5 Opus 4.8 Mythos Preview (antes del lanzamiento)
Entrada (por millón de tokens) $10 $5 >$22 (estimado)
Salida (por millón de tokens) $50 $25 >$110 (estimado)
Entrada por lotes $5 $2,5
Salida por lotes $25 $12,5
Caché de prompts -90% -90%
Ventana de contexto 1M entrada / 128K salida 200K / 32K

Si utilizas LLMs para programar, vale la pena no solo mirar el precio por token, sino también el costo condicional de obtener un resultado correcto. En este tipo de evaluaciones, Fable 5 puede parecer más rentable que Opus 4.8 debido a una mayor tasa de éxito, lo que reduce el número de reinicios y los costos generales para resolver la tarea.

¿Qué significa el lanzamiento de Fable 5 para el mercado de IA?

En mi opinión, la cuestión principal aquí no es técnica. Si en primavera un modelo de la clase Mythos se consideraba demasiado arriesgado para el acceso general, ¿qué ha cambiado exactamente en unos pocos meses? La respuesta de Anthropic no es que el modelo sea menos potente, sino que la empresa ha empezado a confiar en su propio capa de protección. Según Anthropic, el programa externo de recompensa por errores no pudo eludir estos mecanismos incluso después de más de 1.000 horas de pruebas y intentos de ataque. De hecho, estamos viendo el primer gran precedente en el que un modelo de vanguardia se hace público con un sistema de restricciones claramente documentado y un fallback automático a un modelo menos arriesgado para categorías de consultas específicas.

Tras analizar el lanzamiento de Fable 5, he observado varias tendencias que pueden ser importantes para las empresas que implementan soluciones de IA o evalúan la estrategia de los grandes proveedores de IA.

  • Los mecanismos de protección en lugar de las prohibiciones se están convirtiendo en el nuevo estándar. OpenAI, Anthropic y Google se están alejando gradualmente del enfoque de "lanzar o no lanzar". En su lugar, están construyendo sistemas de control multinivel que permiten el acceso a modelos potentes, pero restringen escenarios de riesgo específicos. Fable 5 es actualmente uno de los ejemplos más transparentes de este enfoque.
  • La brecha entre la versión pública y la privada de los modelos se está volviendo estructural. Mythos 5 y Fable 5 demuestran un nuevo modelo de distribución de IA. Formalmente, es la misma plataforma tecnológica, pero con diferentes niveles de acceso y diferentes capacidades en dominios específicos. Es muy probable que veamos un esquema similar en las próximas generaciones de modelos de vanguardia.
  • La comercialización y la seguridad ya no son contradictorias. Para Anthropic, el lanzamiento de Fable 5 no es solo un logro tecnológico, sino también una señal de negocio. La empresa demuestra que puede lanzar al mercado los modelos más potentes sin renunciar por completo a sus principios de seguridad. Para los inversores, este es un indicador importante de la madurez de la plataforma.
  • El nivel de capacidades de Mythos se convertirá gradualmente en la nueva norma. En mi opinión, en los próximos 6 a 12 meses, las capacidades que hoy se asocian con la clase Mythos comenzarán a percibirse como el estándar para los modelos insignia. Un proceso similar ya ocurrió tras la aparición de GPT-4: lo que inicialmente parecía un avance, un año después se convirtió en la expectativa básica del mercado.

Si consideramos el lanzamiento de Fable 5 no como otro lanzamiento de modelo, sino como una señal para toda la industria, la principal conclusión para mí es la siguiente: las grandes empresas de IA ya no intentan ocultar sus modelos más potentes al público en general. En su lugar, invierten en mecanismos de control que permiten abrir el acceso a modelos de vanguardia sin perder el control sobre los escenarios de uso más arriesgados.

Preguntas frecuentes: preguntas comunes sobre Claude Fable 5

¿Se puede ejecutar Claude Fable 5 localmente?

No. Fable 5 es un modelo en la nube, disponible exclusivamente a través de la API de Anthropic, Claude.ai y plataformas asociadas (Amazon Bedrock, Google Cloud, Microsoft Foundry). Anthropic no publica los pesos de los modelos y no planea hacerlo. Si necesitas un modelo local, se trata de otra clase de soluciones.

¿Reemplazará Fable 5 a Claude Opus 4.8?

No, al menos no de inmediato. Opus 4.8 sigue en la línea y cuesta la mitad. Además, Fable 5 cambia automáticamente a Opus 4.8 para consultas en categorías bloqueadas. Para la mayoría de las tareas rutinarias, Opus 4.8 es una opción más racional. Fable 5 justifica su precio en tareas de agente largas y código complejo, donde la tasa de éxito es fundamentalmente diferente.

¿En qué se diferencia Fable 5 de Mythos 5?

Nada a nivel de arquitectura: es el mismo modelo con los mismos pesos y el mismo precio. La diferencia radica exclusivamente en la configuración de los clasificadores: en Fable 5 están activos y redirigen consultas de riesgo (ciberataques, síntesis de sustancias peligrosas) a Opus 4.8. En Mythos 5, algunas de estas restricciones se han eliminado, pero el modelo en sí solo está disponible para organizaciones verificadas a través del Proyecto Glasswing.

¿Está Claude Fable 5 disponible a través de la API?

Sí. ID del modelo: claude-fable-5. Disponible a partir del 9 de junio de 2026 sin cola. Admite 1 millón de tokens de contexto de entrada y hasta 128K tokens en la respuesta. API por lotes: $5 / $25 por millón de tokens. Cuando el clasificador de seguridad se activa, devuelve un HTTP 200 con stop_reason: "refusal", no es un error y no se factura si no hubo salida.

¿Es Fable 5 seguro para producción ahora mismo?

Depende del dominio. Para código, análisis, tareas legales y financieras, sí, Anthropic realizó una recompensa externa por errores sin resultados después de más de 1.000 horas de pruebas. Pero los clasificadores todavía están configurados de forma conservadora: los falsos positivos son posibles en menos del 5% de las sesiones. Si tu producto se relaciona con la ciberseguridad o la bioquímica, algunas consultas se dirigirán a Opus 4.8, esto debe tenerse en cuenta en la arquitectura.

¿Cuándo formará parte Fable 5 de las suscripciones estándar?

Hasta el 22 de junio de 2026, gratis para todos los suscriptores de pago (Pro, Max, Team, Enterprise). A partir del 23 de junio, a través de créditos de uso. Anthropic promete devolver el modelo a los planes estándar tan pronto como la capacidad lo permita; aún no hay fechas concretas.