Contenido del curso
Adaptive thinking y control de effort
Benchmarks y comparativa Fable vs Opus
Contexto tokens y modelo real de costos
Safeguards de Fable 5 en producción
Lineup de modelos IDs y matrix por plataforma
Resumen
El mismo modelo puede comportarse distinto según dónde lo ejecutes, y ahí está la trampa con Claude Fable 5. La elección de plataforma define qué features tienes disponibles, qué model IDs debes escribir y hasta si tu primer request devolverá un error silencioso. Si trabajas con la API de Anthropic, Amazon Bedrock, Vertex AI o Microsoft Foundry, este mapa te ahorra horas de depuración a ciegas.
¿Qué diferencia hay entre Claude Fable 5 y Mythos 5?
Ambos comparten el mismo modelo subyacente, pero no la misma puerta de entrada.
Fable 5 es el modelo de propósito general con una capa de clasificadores de safety encima [0:32]. Piénsalo como un edificio con un guardia en la puerta: el edificio es el mismo, pero el guardia decide quién entra. Ese guardia intercepta requests en categorías como ciberseguridad y biología, y cuando se activa, redirige a un fallback. Con esta arquitectura, Stripe migró 50 millones de líneas de código en un día [0:57].
Mythos 5 es ese mismo edificio sin el guardia: modelo idéntico, sin clasificadores [1:05]. Solo está disponible para organizaciones aprobadas en Project Glasswing, sin acceso self-serve.
¿Existe Claude Haiku 5? No. No hay model ID confirmado ni disponibilidad publicada en esta generación. Si lo ves mencionado, no hay documentación que lo respalde.
Ambos modelos comparten precio: 10 dólares por millón de tokens de input, 50 por millón de output [1:26]. Ventana de contexto de 1 millón de tokens, con máximo de 128 mil tokens de output por request.
¿Por qué importa la retención de datos en Fable 5?
Fable 5 requiere retención de datos de 30 días [1:39]. Si tu organización tiene zero-data-retention habilitado, cada request devuelve un error 400. La salida en ese caso es usar Opus 4.8 como alternativa.
¿Cómo se escriben los model IDs en cada plataforma?
Aquí es donde la gente se equivoca en silencio, porque un ID incorrecto no siempre explota con un error claro. Cada superficie tiene su convención y mezclarlas rompe la integración.
- Claude API directa y Claude Platform on AWS: el ID es limpio,
claude-fable-cinco, sin prefijos ni sufijos de versión, y va en el body del request como parámetromodel[2:04]. - Amazon Bedrock: necesitas el prefijo del proveedor,
anthropic.claude-fable-cinco. Para cross-region inference agregas el prefijo regional, por ejemplous.anthropic.claude-fable-cinco,euoglobal[2:16]. - Vertex AI: el ID es
claude-fable-cinco, pero va en el URL path, no en el body [2:40]. - Microsoft Foundry: el parámetro
modelapunta a tu deployment name, no al modelo directamente [2:53].
A diferencia de IDs anteriores como los de Sonnet, que llevaban fecha y sufijo v1.0, Fable no lleva sufijo de versión. Detalle delicado: en Foundry puedes nombrar el deployment como quieras en el portal, pero una vez creado, el nombre no se puede cambiar. Nunca [3:01]. Piénsalo bien antes de escribirlo.
¿Qué features funcionan en cada superficie?
Aquí es donde duele. Thinking y effort funcionan igual en todas: thinking siempre activo, effort con cinco niveles desde low hasta max, display en modo omitted o summarized [3:08]. Hasta ahí, parejo.
Las diferencias aparecen en fallbacks y herramientas.
¿Dónde están disponibles fallbacks y tool calling?
Los server-side fallbacks solo existen en Claude API y Claude Platform on AWS [3:27]. Bedrock, Vertex y Foundry dependen de SDK middleware o del patrón manual de detect-and-retry.
Programmatic tool calling y code execution están en GA solo en la API directa. Bedrock no los tiene. Vertex tampoco. Foundry los tiene en beta.
¿Qué pasa con el prompt caching? En la API directa y Vertex el mínimo es 512 tokens con automatic caching. En Bedrock sube a 1024 tokens y sin automatic caching. En Foundry, todo es beta.
Un edge case que te puede morder: en Foundry, el fallback de Fable 5 a Opus 4.8 baja la ventana de contexto de 1 millón a 200 mil tokens [4:08]. Esto no pasa en ninguna otra plataforma.
¿Cómo accedo a Project Glasswing?
Glasswing tiene cuatro caminos de acceso, y solo uno es self-serve.
- Partnership con tu account team.
- Claude for Open Source para mantenedores.
- Cyber Verification Program, el único self-serve hoy en
claude.com/form/cyber-use-case[4:41]. - Biology Trusted-Access Program, planeado pero no activo.
Si tu equipo golpea el clasificador de forma recurrente porque hace pentesting o red-teaming, Glasswing tiene sentido. Para todos los demás, Fable con fallback handling correcto es el camino.
¿Qué deberías revisar antes del primer request?
Haz el ejercicio mental ahora: ¿en qué plataforma vive tu producción actual? ¿Qué features de esta lista necesitas y cuáles no están disponibles ahí? Esa respuesta define si estás en la superficie correcta o si vas a descubrir limitaciones cuando ya tengas código corriendo.
En la siguiente clase tomamos estos IDs y esta matrix para ejecutar tu primer request real en cada superficie, verificar que Fable 5 efectivamente respondió y no un fallback silencioso, y dominar el orden de precedencia en Claude Code. ¿Tú en qué plataforma estás corriendo Claude hoy? Cuéntalo en los comentarios.