Eficiencia en ejecución y gestión de Tokens

Resumen

Cuando trabajas con Codex en proyectos reales, cada token cuenta. Codex Exec es la forma de ejecutar Codex desde la terminal en modo no interactivo: le das una tarea, devuelve una respuesta y termina, sin abrir una conversación completa. Esto es clave para automatizar flujos y medir eficiencia en proyectos como AI Radar.

¿Qué es Codex Exec y cuándo conviene usarlo?

Hasta ahora probablemente has trabajado en modo interactivo: abres Codex, escribes una tarea, revisas lo que hace y sigues conversando. Pero muchas veces no necesitas una conversación, solo ejecutar una instrucción y obtener una salida.

Con codex exec le mandas un prompt directamente desde el terminal. Al ejecutarlo, ves el directorio de trabajo, el modelo, los permisos, el sandbox, el nivel de reasoning y, al final, la respuesta junto al consumo de tokens. En una prueba simple con un saludo, el agente reportó un gasto de 7551 tokens [00:54].

¿Qué es Codex Exec? Es un comando que ejecuta Codex desde la terminal en modo no interactivo. Le envías una tarea, devuelve una respuesta y cierra la sesión.

¿Cómo se controlan los permisos con el sandbox en Codex?

El sandbox es el ambiente donde tu agente trabaja, y define qué puede hacer dentro del repositorio. Controlarlo es la forma más directa de evitar acciones no deseadas.

Si agregas la bandera sandbox read-only al comando, el agente solo puede leer archivos. Al pedirle que cree un archivo en ese modo, responde con un error claro: el workspace está en modo lectura y no tiene permisos para escribir [01:50]. Esto te permite probar prompts sin riesgo de modificar el proyecto.

¿Por qué los tokens también significan dinero?

Cada archivo que lee el agente, cada esquema que interpreta y cada skill que carga ocupa contexto. En proyectos pequeños no se nota, pero en proyectos grandes el contexto se llena rápido.

Cuando eso pasa, el agente tiene menos espacio para razonar sobre la tarea actual. Entonces el problema no es solo el costo: también es la capacidad de trabajo del modelo.

¿Cómo reducir el consumo de tokens en AI Radar?

En una prueba real con AI Radar, le pidieron al agente traer las últimas dos noticias guardadas. El agente leyó la skill, analizó el JSON, revisó la información del día y entregó la respuesta. El gasto fue de 15 597 tokens [02:27].

Para responder algo aparentemente simple, Codex tuvo que cargar instrucciones, leer archivos, interpretar estructuras y gastar tokens en contexto. Funciona, pero tiene un costo evidente.

¿Cuándo conviertes una tarea en una herramienta del proyecto?

La regla práctica: si una tarea es repetible, determinística y validable, no debería gastar tokens cada vez que el modelo la descubra. Conviértela en una tool.

Para probarlo, abres Codex y le pides crear un script en Python que lea el JSON diario de AI Radar y devuelva n señales en JSON, con opciones para elegir día, cantidad y orden. Además, le pides crear un skill que se active cuando alguien quiera consultar señales y que llame automáticamente al tool [03:36].

¿Qué diferencia hay entre usar prompts largos y herramientas dedicadas?

Al repetir el mismo comando después de crear el tool y el skill, el modelo encontró la skill, llamó al tool en solo dos intentos y entregó la misma respuesta. Esta vez gastó únicamente 5228 tokens [04:18].

La comparación es contundente:

  • Antes: 15 597 tokens cargando contexto y razonando.
  • Después: 5228 tokens delegando a una herramienta.
  • Ahorro: cerca de dos tercios del consumo.

La diferencia importante no es solo gastar menos tokens. Es que el agente dejó de gastar razonamiento en una tarea mecánica, lo que hace el proceso más rápido y más confiable.

¿Cuándo conviertes una tarea en herramienta? Cuando es repetible, determinística y validable. Si el resultado se puede verificar y siempre sigue la misma lógica, conviértela en tool y deja al modelo solo para decidir cuándo usarla.

¿Qué herramienta puedes crear para practicar en AI Radar?

El reto es construir una herramienta pequeña para tu proyecto. Algunas ideas:

  • Detectar señales duplicadas.
  • Contar señales por estado.
  • Validar evidencia vacía.
  • Listar fuentes primarias.

Luego, escribe un skill corto que le diga a Codex cuándo usar esa herramienta. La idea es que el modelo no tenga que redescubrir el patrón cada vez.

Comparte en los comentarios tres cosas: qué tool creaste, qué skill la activa y cuántos tokens aproximadamente ahorraste comparando el antes y el después.