Control de costos y modelos en Claude Code

Clase 15 de 18Curso de Claude Code

Resumen

Controlar costos en Claude Code es más simple de lo que parece. Aquí aprenderás a leer el gasto de tokens en la CLI, usar la herramienta ccusage para reportes diarios y elegir el modelo ideal (Sonnet 4.5, Opus, Haiku) según precio y complejidad. Conoce cómo el caché reduce el costo por millones de tokens y qué cambia al autenticarte por suscripción o por consola de Anthropic.

¿Cómo ver y controlar costos con Claude Code y ccusage?

La sesión actual en la terminal muestra cuánto costó la conversación en dólares y estadísticas como input de tokens, output y tiempos en la API. No permite ver sesiones pasadas, pero sí controlar sesiones largas y su costo acumulado.

  • La vista de sesión actual muestra costo en dólares y uso de tokens.
  • Para varias conversaciones en múltiples repositorios, usa la herramienta ccusage con npx.
  • ccusage genera una tabla con uso diario entre dos fechas.
  • Se listan tokens de input y output, caché creado y leído, y total de tokens.
npx ccusage
  • En el caso mostrado, se usaron 19,453,000 tokens con un gasto de 15 dólares con 99 centavos gracias al caché.
  • El caché cobra el guardado completo del token, pero la lectura posterior cuesta una fracción mínima.
  • Resultado: muchos millones de tokens a un costo bajo por reutilización de contexto.

¿Qué ofrece la vista de sesión en la terminal?

  • Costo de la conversación activa en dólares.
  • Input y output de tokens.
  • Tiempo en la API y tiempo de espera.

¿Cómo ayuda ccusage en la CLI?

  • Control de costos diario entre fechas específicas.
  • Tabla por modelo con tokens de input/output y caché.
  • Panorama de gasto total por día y por modelo.

¿Qué modelos y precios convienen según la tarea?

Claude Code permite gestionar modelos con el comando de model para ver opciones y precios por millón de tokens. La unidad de cobro es por millón de tokens de input y de output.

  • Sonnet 4.5 (recomendado por defecto): 3 dólares por millón de input, 15 dólares por millón de output.
  • Opus (tareas muy complejas): 15 dólares por millón de input, 75 dólares por millón de output.
  • Sonnet 1M de contexto: 6 dólares por millón de input, 22 con 50 por millón de output.
  • Haiku (rápido y simple): 1 dólar por millón de input, 5 dólares por millón de output.

¿Cómo elegir el modelo según la necesidad?

  • Mucho razonamiento y alta complejidad: Opus, con mayor costo por input/output.
  • Análisis simple y rápido: Haiku es suficiente.
  • Balance entre capacidad, velocidad y precio: Sonnet 4.5 como elección práctica.

¿Por qué el caché reduce tanto el gasto?

  • Guarda contexto una vez con costo completo.
  • Lecturas posteriores del caché cuestan solo una fracción.
  • Permite usar millones de tokens con gasto bajo cuando el contexto se reutiliza.

¿Cómo afecta la autenticación al control de precio?

Claude Code ofrece dos métodos de autenticación que impactan el control de costos y el límite de uso diario.

  • Suscripción a Claude: no cobra por millón de tokens, tiene una cantidad predeterminada con límite diario.
  • Consola de Anthropic: cobra por millón de tokens, sin límite.
  • Si usas suscripción: enfócate en el límite diario más que en el precio.
  • Si usas consola Anthropic: monitorea el control de costo con la vista de sesión y ccusage.

¿Ya mediste tu gasto de tokens? Comparte en los comentarios cuántos tokens has consumido al practicar y qué modelo te funcionó mejor.