Primer request real en cada superficie

Resumen

El modelo que pediste y el modelo que te respondió no siempre son el mismo. Suena inquietante, pero es exactamente lo que pasa con los fallbacks silenciosos en Claude Fable 5: llegan como HTTP 200, con una respuesta válida, sin error y sin warning. Tu código no se queja, tu monitoreo no parpadea, y aun así no estás usando lo que crees que estás usando.

¿Cómo se activa Fable 5 sin guardarlo como default permanente?

En claude.ai y Claude Desktop activas Fable 5 escribiendo el comando /model fable. Parece simple, pero hay una trampa de persistencia que muerde a casi todos.

Si presionas Enter normalmente, ese cambio se guarda como tu default personal permanente. Las sesiones futuras arrancan en Fable 5 sin que lo pidas de nuevo. Si solo quieres el cambio para esta sesión, presionas la letra s en lugar de Enter [0:48].

¿Enter o tecla s al cambiar de modelo? Enter guarda Fable 5 como tu default permanente en todas las sesiones. La tecla s aplica el cambio solo a la sesión activa.

La diferencia entre una tecla y otra es la diferencia entre una preferencia temporal y una configuración que te persigue semanas.

¿Qué mecanismos de selección usa Claude Code y cuál gana?

En Claude Code hay cuatro mecanismos de selección que funcionan como capas de pintura: la de arriba siempre gana [1:05].

  1. El comando /model durante la sesión activa, con prioridad máxima.
  2. El flag --model al arrancar.
  3. La variable de entorno ANTHROPIC_MODEL.
  4. El campo model dentro de tu archivo de settings.

Si alguien ejecutó /model hace tres semanas presionando Enter, eso se guardó y ahora está pisando silenciosamente lo que dice tu archivo de proyecto. Para equipos, el truco documentado es usar el alias best en el settings file del proyecto: los ingenieros con acceso a Fable 5 obtienen Fable 5, y los demás caen a Opus sin errores. Nadie se rompe.

¿Por qué el primer request puede gatillar un fallback sin que escribas nada raro?

Cuando envías tu primer mensaje, el request no viaja solo. Lleva contexto del workspace: el contenido de tu archivo CLAUDE.md, estado de git y nombres de directorio. El clasificador de safety lee todo eso junto [2:10].

Entonces tu primer request puede gatillar un fallback sin que hayas escrito nada sensible, simplemente porque tu directorio se llama exploit-dev o tu CLAUDE.md describe un proyecto de pentesting. Es como enviar una carta inocente dentro de un sobre que dice "paquete sospechoso": el guardia mira el sobre, no la carta.

¿Para qué sirve la flag safe-mode?

Con --safe-mode stripeas las customizaciones antes de que el request salga. Es tu herramienta de diagnóstico:

  • Si el fallback desaparece, ya sabes que tu CLAUDE.md era la causa.
  • Si persiste, revisas nombres de directorio.
  • Si aún así sigue, el mensaje mismo es el problema.

¿Qué parámetros producen un 400 en la API de Fable 5?

Para la API directa, el payload mínimo lleva model: claude-fable-cinco, max_tokens y tu mensaje. Tres cosas producen un 400 si las incluyes [2:57]:

  1. thinking configurado como disabled, porque thinking es siempre activo en Fable 5.
  2. temperature, top_p o top_k.
  3. Assistant prefill.

Todas prohibidas en Fable 5. Si vienes de versiones anteriores, este es el lugar donde más fácil te tropiezas.

¿Cómo desactivo thinking en Fable 5? No puedes. Thinking es siempre activo. Si envías thinking: disabled la API responde con un error 400.

¿Cómo verifico que Fable 5 realmente respondió y no un fallback?

Tres señales trabajando juntas te confirman quién respondió en cada turno [3:13]:

  • El campo model en el top level de la respuesta te dice qué modelo sirvió.
  • Un bloque de tipo fallback en el array de content te dice que hubo un switch.
  • La señal más confiable: usage.iterations, que lista cada intento. El modelo que declinó aparece con cero output tokens; el que respondió aparece como fallback_message.

Existe algo llamado sticky routing: después de un fallback, el sistema rutea los turnos siguientes al modelo de fallback durante aproximadamente una hora sin dejar bloque fallback visible. Solo usage.iterations te salva ahí.

¿Qué es el sticky routing en Fable 5? Tras un fallback, el sistema mantiene los turnos siguientes en el modelo de respaldo durante alrededor de una hora, sin marcar el bloque fallback en la respuesta.

Ahora tienes Fable 5 activo y verificado. Sabes qué modelo responde en cada turno y sabes detectar cuando un fallback interviene sin avisarte. En la siguiente clase entramos en adaptive thinking [4:01]: por qué es siempre activo, por qué configurarlo explícitamente como en Opus 4.8 produce errores 400, y la diferencia entre los tokens que ves y los tokens que te cobran.

¿Ya te pasó que un fallback silencioso te cambió la respuesta sin darte cuenta? Cuéntame en los comentarios cómo lo detectaste.