Claude Fable 5: Características, Benchmarks y Guía de Claude Code

Claude Fable 5: Características, Benchmarks y Guía de Claude Code visto en herramientas de Inteligencia Artificial en CIBERED

Anthropic acaba de hacer que su clase de modelo más capaz esté disponible para todos. Claude Fable 5 se lanzó el 9 de junio de 2026, y es el primer modelo público de la misma familia que Mythos, el sistema cuya capacidad de ciberseguridad asustó a los gobiernos a principios de este año. Fable 5 se sitúa un nivel por encima de Opus 4.8 y es, según el propio enfoque de Anthropic, el estado del arte en casi todos los benchmarks de capacidad que ha probado.

El giro es que Anthropic lo lanzó como dos modelos. Fable 5 es el público con los clasificadores de seguridad activados. Mythos 5 son los mismos pesos pero con las barreras de seguridad levantadas, bloqueado detrás de un programa solo por invitación.

Esta guía cubre qué es realmente Fable 5, cómo se compara en benchmarks con Opus 4.8 y la competencia, cuánto cuesta, los IDs exactos del modelo, cómo llamarlo desde la API y desde Claude Code, y si el salto vale el doble de precio. Los IDs de los modelos, los precios y las llamadas a la API a continuación se comprobaron contra la documentación de junio de 2026 de Anthropic y se ejecutaron en vivo contra el endpoint claude-fable-5.

¿Qué es Claude Fable 5 y la división con Mythos?

Fable 5 es un modelo de “clase Mythos”. Mythos es el nombre interno para el nivel más poderoso de Anthropic, un paso más allá de la línea Opus. A principios de 2026, Anthropic dio a un pequeño grupo de socios acceso a Mythos Preview bajo el Proyecto Glasswing porque el modelo era lo suficientemente bueno para encontrar y explotar vulnerabilidades de software como para que un lanzamiento amplio pareciera imprudente.

Fable 5 es cómo esa capacidad llega al público sin entregarle a todos una herramienta de ciberataque ofensivo. Es el modelo Mythos con tres categorías de clasificadores incorporadas. Cuando una solicitud activa uno de ellos, Fable 5 la rechaza.

Anthropic dice que esos rechazos retroceden (fallback) a Opus 4.8 y ocurren en menos del 5% de las sesiones, por lo que más del 95% del tiempo estás hablando con el modelo completo de clase Mythos. En la API sin procesar, esa retrocesión es opcional en lugar de automática, lo cual se cubre en detalle en la sección de seguridad más abajo.

Mythos 5 es el gemelo sin restricciones. Mismos pesos, salvaguardas eliminadas en algunas áreas, y según Anthropic tiene las capacidades de ciberseguridad más fuertes de cualquier modelo en el mundo. No está en autoservicio. El acceso se gestiona a través del Proyecto Glasswing para proveedores de infraestructura verificados e investigadores de ciberseguridad, con una pista de acceso de confianza separada planificada para biología.

Claude Fable 5 vs Claude Mythos 5

A efectos prácticos, la diferencia es el acceso y las barreras de seguridad, no la inteligencia bruta. La siguiente tabla es la versión corta.

AspectoClaude Fable 5Claude Mythos 5
DisponibilidadGeneral, autoservicio desde el lanzamientoSolo por invitación (Proyecto Glasswing)
Clasificadores de seguridadActivados (ciber, bio/químico, destilación)Levantados en algunas áreas
Solicitudes marcadasRetroceden a Opus 4.8Se sirven directamente
Pesos subyacentesModelo idénticoModelo idéntico
ID de la API de Claudeclaude-fable-5claude-mythos-5
Usuario objetivoDesarrolladores, empresas, usuarios Pro/MaxSocios de ciber y bioseguridad defensiva

Anthropic también endureció la política de datos para todo lo de esta clase. Todo el tráfico de Fable 5 y Mythos 5 conlleva una ventana de retención obligatoria de 30 días, incluso para empresas que anteriormente tenían acuerdos de retención cero. Los datos no se utilizan para el entrenamiento, el acceso humano se registra y los registros se eliminan después de 30 días en casi todos los casos.

Si trabajas bajo reglas estrictas de manejo de datos, ten en cuenta ese piso de retención en tu decisión antes de enrutar tráfico de producción a Fable 5.

Benchmarks de Fable 5 vs Opus 4.8, GPT-5.5 y Gemini 3.1 Pro

El anuncio de lanzamiento de Anthropic comienza con resultados de clientes en lugar de una cuadrícula limpia de benchmarks, y esos resultados son los puntos de prueba más concretos hasta ahora. Stripe ejecutó una migración de Ruby en todo el código base de 50 millones de líneas en un solo día, trabajo que estimaron tomaría más de dos meses a un equipo completo.

Hebbia dijo que Fable 5 fue el primer modelo en superar el 90% en su benchmark central de análisis financiero, un salto de diez puntos sobre Opus. Cognition reportó la puntuación más alta de FrontierCode de cualquier modelo fronterizo en esfuerzo medio, y Replit dijo que genera aplicaciones en un solo intento (one-shot) que hace un año requerían cien prompts.

Las comparaciones numéricas a continuación combinan las cifras publicadas por Anthropic con pruebas independientes tempranas. Trátalas como una instantánea de la semana de lanzamiento en lugar de una tabla final y completamente auditada. La cifra con asterisco refleja la puntuación de clase Mythos sin restricciones; en dominios de ciber y bioseguridad protegidos, los clasificadores de Fable 5 pueden reducir el número hacia Opus 4.8.

BenchmarkFable 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-Bench Pro (codificación agentiva)80.3%69.2%58.6%54.2%
Terminal-Bench 2.1*88.0%82.7%83.4%70.7%
FrontierCode Diamond29.3%13.4%5.7%n/a
GDPval-AA (trabajo de conocimiento, Elo)1932189017691314
OSWorld-Verified (uso de computadora)85.0%83.4%78.7%76.2%
Blueprint-Bench 2 (espacial)38.6%14.5%36.2%26.5%

La brecha de codificación agentiva es la señal individual más clara. En SWE-Bench Pro, el benchmark estándar de ingeniería de software del mundo real, Fable 5 abre una ventaja de once puntos sobre Opus 4.8 y deja atrás al competidor más cercano:

Puntuación de SWE-Bench Pro de Claude Fable 5 del 80.3 por ciento en comparación con Opus 4.8, GPT-5.5 y Gemini 3.1 Pro

El patrón es consistente. Las mayores ventajas de Fable 5 están en las tareas agentivas y de razonamiento fronterizo más difíciles, donde prácticamente duplica a Opus 4.8 en FrontierCode y Blueprint-Bench.

En benchmarks ya saturados como OSWorld, el margen es pequeño. Se mantiene fuera del código también: en la calificación de trabajo de conocimiento GDPval-AA, Fable 5 lidera a Opus 4.8 por 42 Elo, una ventaja real pero más estrecha que su ventaja en codificación. La conclusión para la pregunta de precios más adelante es la misma en todas partes: pagas la prima por la cima de la curva de dificultad, no por el trabajo rutinario.

Precios, IDs de modelos y disponibilidad

Fable 5 cuesta exactamente el doble que Opus 4.8. Ese es el número más importante para decidir hacia dónde dirigirlo.

ModeloEntrada / MTokSalida / MTok
Claude Fable 5$10.00$50.00
Claude Opus 4.8$5.00$25.00
Claude Sonnet 4.6$3.00$15.00
Claude Haiku 4.5$1.00$5.00

El almacenamiento en caché de prompts sigue aplicándose, y las lecturas de caché se facturan a aproximadamente una décima parte de la tasa de entrada, alrededor de $1 por millón de tokens, lo que suaviza el costo en ejecuciones agentivas largas que reutilizan un contexto grande. En el lado de las suscripciones, Fable 5 está incluido gratis en los planes Pro, Max, Team y Enterprise basados en asientos hasta el 22 de junio de 2026.

Después de eso, pasará a créditos de uso en esos planes. Si tienes una suscripción Pro o Max, esa ventana gratuita es la oportunidad más barata que tendrás para probarlo a fondo.

Los identificadores del modelo son instantáneas estables y fijadas. Usa estas cadenas exactas dependiendo de dónde lo llames.

PlataformaID de Fable 5
Claude APIclaude-fable-5
Amazon Bedrockanthropic.claude-fable-5
Vertex AIclaude-fable-5

Fable 5 está generalmente disponible en la API de Claude, Claude Platform en AWS, Amazon Bedrock, Vertex AI y Microsoft Foundry desde el día del lanzamiento. Las especificaciones principales: una ventana de contexto de 1 millón de tokens, hasta 128,000 tokens de salida por respuesta, pensamiento adaptativo siempre activo (no hay un interruptor separado de pensamiento extendido) y un corte de conocimiento de enero de 2026, el mismo que Opus 4.8.

Una advertencia sobre el número de contexto: esta generación usa el tokenizador introducido con Opus 4.7, por lo que el mismo texto produce aproximadamente un 30% más de tokens que los modelos más antiguos, lo que consume ese millón más rápido de lo que podrías esperar y añade a la factura de salida.

El acceso es inmediato para cualquiera con una clave API de Claude y para suscriptores Pro y Max. En Amazon Bedrock y Vertex AI, es posible que necesites solicitar acceso al modelo en la consola primero, y como en lanzamientos pasados de Claude, la habilitación regional puede retrasarse unos días respecto al lanzamiento. Si una llamada a claude-fable-5 devuelve un error de modelo no encontrado en una plataforma en la nube, revisa la página de acceso a modelos para tu región antes de asumir que algo está roto.

Llamar a Claude Fable 5 desde la API

La llamada a la API es idéntica a la de cualquier otro modelo de Claude. Solo cambia la cadena del modelo. Pon tu clave en una variable de entorno primero para que nunca termine en el historial del shell o en un archivo comprometido:

export ANTHROPIC_API_KEY="tu-clave-api-de-anthropic"

Una solicitud mínima con curl:

curl -s https://api.anthropic.com/v1/messages \
  -H "x-api-key: ${ANTHROPIC_API_KEY}" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Write a hardened systemd unit for a Go web service running as a non-root user on port 8080."}
    ]
  }'

Ejecutamos exactamente ese prompt contra el endpoint en vivo de claude-fable-5. Los metadatos de la respuesta volvieron con la etiqueta "model": "claude-fable-5", y la unidad que produjo ya llevaba el espacio de nombres y el endurecimiento de capacidades que la mayoría de la gente copia y pega desde una publicación de blog días después:

Terminal mostrando la salida de la llamada a la API de claude-fable-5, un archivo de unidad systemd endurecido

Aquí está el núcleo de esa unidad generada como texto copiable:

[Service]
Type=simple
User=webapp
Group=webapp
ExecStart=/usr/local/bin/webapp
Restart=on-failure

# Filesystem hardening
ProtectSystem=strict
ProtectHome=true
PrivateTmp=true
ProtectKernelTunables=true
ProtectKernelModules=true
ProtectControlGroups=true
ReadWritePaths=/var/lib/webapp

# Privilege hardening
NoNewPrivileges=true
CapabilityBoundingSet=
RestrictSUIDSGID=true
LockPersonality=true
RestrictAddressFamilies=AF_INET AF_INET6 AF_UNIX

La llamada del SDK de Python es igual de corta. El paquete anthropic no necesita fijación de versión para la cadena del modelo:

from anthropic import Anthropic

client = Anthropic()  # reads ANTHROPIC_API_KEY from the environment
msg = client.messages.create(
    model="claude-fable-5",
    max_tokens=8192,
    messages=[
        {"role": "user", "content": "Plan and implement the refactor in this repo."}
    ],
)
print(msg.content[0].text)

Fable 5 admite los mismos niveles de esfuerzo que Opus 4.8, y tienen un costo real. En las pruebas del día del lanzamiento de Simon Willison, el mismo prompt de SVG de “pelícano en una bicicleta” produjo unos 1,900 tokens de salida con esfuerzo bajo (aproximadamente $0.10) y unos 14,400 tokens con esfuerzo máximo (aproximadamente $0.72) en la misma tarea.

Un mayor esfuerzo compra más pensamiento y una mejor respuesta, pero se te factura por cada uno de esos tokens a $50 por millón, así que establece el esfuerzo deliberadamente en lugar de dejarlo en el máximo.

Dos comportamientos específicos de Fable 5 te harán tropezar si portas código desde Opus 4.8. El pensamiento adaptativo siempre está activo, por lo que no puedes desactivar el pensamiento.

Ajusta su profundidad con el parámetro effort en su lugar. Y la cadena de pensamiento sin procesar nunca se devuelve: thinking.display tiene el valor predeterminado omitted, por lo que los bloques de pensamiento llegan vacíos a menos que lo establezcas en summarized. La visión, la herramienta de memoria y la compactación de contexto funcionan desde el lanzamiento.

¿Cómo usar Claude Fable 5 en Claude Code?

Claude Code añadió soporte para Fable 5 en la versión 2.1.170. Actualiza primero para que el modelo aparezca:

claude update
claude --version

Inicia una sesión fijada a Fable 5 con la bandera de modelo:

claude --model claude-fable-5

O cambia a mitad de sesión sin reiniciar, lo que mantiene tu caché de prompts caliente:

/model claude-fable-5

Opus 4.8 sigue siendo el predeterminado en Claude Code, y esa es la decisión correcta para la mayoría del trabajo. Cambia a Fable 5 para los trabajos donde su ventaja es mayor: una migración autónoma de varias horas, una refactorización en todo el repositorio, una investigación profunda a través de cientos de archivos, o una ejecución de agente de largo plazo que tiene que mantenerse coherente a través de millones de tokens.

Debido a que Claude Code puede quemar muchos tokens de salida en una sesión larga, vigila la factura a la tasa doble. Si el costo es la preocupación, las técnicas en nuestra guía sobre cómo reducir el uso de tokens de Claude Code se aplican directamente, e importan el doble en Fable 5. La hoja de trucos de Claude Code cubre el resto de los comandos de modelo y sesión.

Los clasificadores de seguridad y la retrocesión (fallback) a Opus 4.8

El comportamiento de rechazo es lo único genuinamente nuevo para lo que los desarrolladores de la API deben planificar. Tres familias de clasificadores pueden declinar una solicitud:

  • Ciberseguridad: tareas de explotación y ciberataque ofensivo. En pruebas externas a través de 30 técnicas públicas de jailbreak, Fable 5 cumplió con cero solicitudes dañinas de un solo turno sobre planificación de ataques, desarrollo de exploits o evasión de defensas.
  • Biología y química: amplia cobertura de solicitudes de doble uso, incluidas capacidades como el diseño de vectores virales.
  • Extracción de razonamiento: prompts que intentan hacer que el modelo reproduzca su cadena de pensamiento interna, la ruta que usan los competidores para destilar un modelo.

Cuando un clasificador declina, la API de Messages no lanza un error. Devuelve un HTTP 200 normal con stop_reason establecido en refusal, y nombra al clasificador que se activó en stop_details.category, uno de cyber, bio, o reasoning_extraction. Así que la forma de detectar un rechazo en tu propio código es ramificar en stop_reason en cada respuesta, no envolver la llamada en un try/except.

El monitoreo construido sobre tasas de error nunca lo ve, porque un rechazo es un 200. La retrocesión a otro modelo es opcional, no automática: pasa el parámetro fallbacks (en beta) para que la API reintente en un modelo que elijas, o usa el middleware del SDK de Anthropic para reintentar desde el cliente. No se te cobra por una generación rechazada, y en un reintento, el crédito de retrocesión reembolsa el costo de caché de prompt del cambio. La guía de rechazos y retrocesiones de Anthropic tiene las formas exactas de respuesta.

Para el trabajo normal de software, nada de esto se activa, pero explica por qué un prompt adyacente a la seguridad ocasionalmente se comporta de manera diferente.

Escribir un escáner de puertos, hacer ingeniería inversa a un binario o hacer fuzzing a un parser puede caer en el clasificador ciber y volver rechazado. El programa de recompensas por errores externo de Anthropic no encontró jailbreaks universales en más de 1,000 horas de pruebas, y un socio calificó las salvaguardas de Fable 5 como las más duras de cualquier modelo que había probado, así que no esperes poder hablar más allá del clasificador.

¿Deberías cambiar a Fable 5?

Para la codificación del día a día, Opus 4.8 a la mitad de precio y con esfuerzo alto por defecto sigue siendo el modelo al que recurrir. Fable 5 gana su prima en la cola difícil: migraciones grandes, agentes autónomos de varias horas, razonamiento fronterizo e investigación profunda donde una ejecución correcta de largo plazo vale más que una pila de intentos más baratos.

Las brechas de benchmarks respaldan esto, con las mayores ventajas de Fable 5 situadas exactamente en esas tareas fronterizas y encogiéndose a casi nada en las rutinarias.

Haz las matemáticas en un trabajo real. Una refactorización en todo el repositorio que quema 2 millones de tokens de entrada y 200,000 de salida cuesta unos $30 en Fable 5 contra unos $15 en Opus 4.8. Si esa única ejecución reemplaza un día del tiempo de un ingeniero, la brecha de $15 es ruido. Dispara miles de llamadas baratas y rutinarias y no es ruido en absoluto: la tasa doble se acumula rápido, y Sonnet 4.6 o Haiku 4.5 es la herramienta correcta. Omite Fable 5 para chat, ediciones simples, trabajo sensible a la latencia y clasificación de alto volumen.

Una regla simple: si el trabajo encaja cómodamente en una sola sesión enfocada, mantén Opus 4.8. Si es el tipo de tarea que normalmente dividirías a lo largo de todo un sprint, apunta Fable 5 hacia ella y déjalo correr. Y si estás en un plan Pro, Max o Team, pruébalo antes del 22 de junio mientras es gratis, porque una vez que pase a créditos de uso, el experimento dejará de ser barato.

Este es el tercer lanzamiento fronterizo de Anthropic en rápida sucesión después de Opus 4.7 y Opus 4.8, y la cadencia es la verdadera historia: la frontera se está moviendo tan rápido que el “modelo más capaz” ahora viene con una etiqueta de precio y una barrera de seguridad adjunta.

Vistas: 0
Scroll al inicio