Control de costos y modelos en Claude Code

Resumen

¿Sabes cuánto cuesta realmente generar código con inteligencia artificial? Aprender a hacer el manejo de costos en Claude Code te permite entender el consumo de tokens, comparar modelos y elegir el más rentable según la tarea, algo clave si trabajas con la API de Anthropic.

Y aquí viene lo interesante: un curso completo puede generarse con 19 millones de tokens y costar menos de 16 dólares. La clave está en saber leer los datos.

¿Cómo veo el costo de una sesión activa en Claude Code?

Dentro de la terminal, mientras estás en una conversación con Claude, puedes consultar el costo exacto de esa sesión en curso. La CLI te muestra el monto en dólares, el tiempo que ha tomado la API, cuánto has esperado y la cantidad de tokens de input procesados.

Esto sirve para sesiones largas, pero tiene un límite: no puedes ver el histórico de conversaciones anteriores desde ahí. Para eso necesitas otra herramienta.

¿Cómo veo el costo de mi sesión actual en Claude Code? Dentro de la conversación activa, la CLI muestra el costo en dólares, los tokens de input y el tiempo de uso de la API. Solo aplica a la sesión en curso, no a las anteriores.

¿Qué es CC Usage y cómo se usa para auditar tokens?

Cuando trabajas en múltiples repositorios y conversaciones, necesitas una vista global. Ahí entra CC Usage, una herramienta que se ejecuta con npx y te entrega un reporte tabulado del consumo en un rango de fechas.

La tabla te muestra varios datos por día y por modelo:

  • Tokens de input y output.
  • Caché creado y caché leído.
  • Total de tokens consumidos.
  • Costo en dólares.

En el ejemplo del curso, se usaron dos modelos (Sonnet 4.5 y Haiku 4.5) durante dos días, con un consumo de 19.453.000 tokens por solo $15,99 dólares. ¿Cómo es posible ese precio?

¿Por qué Claude Code resulta tan barato pese al volumen de tokens?

La respuesta está en el caché. Claude Code guarda en caché parte del contexto cuando ejecuta tareas. La primera vez que se almacena un token, te cobra el monto completo, pero cada lectura posterior desde el caché cuesta una fracción mínima del precio original.

Por eso puedes mover millones de tokens sin que la factura se dispare. El sistema está diseñado para reutilizar contexto y abaratar las iteraciones largas.

¿Cuánto cuesta cada modelo de Claude y cuál debo elegir?

Dentro de Claude Code, el comando /model te lista los modelos disponibles con su precio por millón de tokens. La unidad estándar siempre es un millón de tokens, dividido entre input (lo que envías) y output (lo que el modelo genera).

Estos son los precios y casos de uso:

  • Sonnet 4.5: $3 input / $15 output. Es el recomendado por defecto. Equilibra capacidad, velocidad y costo.
  • Opus: $15 input / $75 output. El más caro, pensado para tareas de razonamiento profundo y problemas complejos.
  • Sonnet con 1M de contexto: $6 input / $22,50 output. Útil cuando necesitas ventanas de contexto enormes.
  • Haiku: $1 input / $5 output. Modelo pequeño y rápido para tareas simples y análisis ligeros.

La lógica es sencilla: si tu tarea exige razonamiento avanzado, Opus rinde mejor aunque cueste más. Si necesitas algo veloz y barato, Haiku basta. Para el día a día, Sonnet 4.5 cubre la mayoría de los casos sin gastos excesivos.

¿Cuál es el modelo más rentable de Claude Code? Sonnet 4.5, con $3 por millón de tokens de input y $15 por millón de output. Ofrece capacidad para tareas complejas a un costo mucho menor que Opus.

¿Cómo afecta tu plan de autenticación al control de costos?

Claude Code te deja autenticarte de dos maneras y cada una cambia tu relación con el precio.

La suscripción a Claude no cobra por millón de tokens. Te asigna una cantidad predeterminada de uso con un límite diario. Si trabajas aquí, no debes preocuparte tanto por el dinero, sino por no chocar con el tope diario.

La consola de Anthropic, en cambio, sí cobra por millón de tokens y no impone un límite de uso. Aquí el control de costos sí importa, porque cada token cuenta directamente en tu factura.

¿Cuándo conviene cada método de autenticación?

Elige según tu patrón de uso:

  1. Si haces uso intensivo y constante, la suscripción te da previsibilidad mensual.
  2. Si tu uso es variable o profesional con clientes distintos, la consola te da flexibilidad sin topes.
  3. Si combinas modelos como Opus y Haiku según la tarea, la consola te permite optimizar gasto por proyecto.

Con el comando de costos dentro de Claude Code y la herramienta CC Usage tienes un panorama completo: sabes cuánto gastas hoy, cuánto consumiste ayer y qué modelo te conviene mañana.

Déjame en los comentarios cuántos tokens has gastado tú haciendo las prácticas.