Eficiencia en ejecución y gestión de Tokens

Curso de Codex

Contenido del curso

Fundamentos y Configuración de Codex

Optimización de Contexto

Persistencia e Integración de Datos

Desarrollo y Despliegue en Codex

Plugins y Control Remoto

Tomar examen

Eficiencia en ejecución y gestión de Tokens

Resumen

Cuando trabajas con Codex en proyectos reales, cada token cuenta. Codex Exec es la forma de ejecutar Codex desde la terminal en modo no interactivo: le das una tarea, devuelve una respuesta y termina, sin abrir una conversación completa. Esto es clave para automatizar flujos y medir eficiencia en proyectos como AI Radar.

¿Qué es Codex Exec y cuándo conviene usarlo?

Hasta ahora probablemente has trabajado en modo interactivo: abres Codex, escribes una tarea, revisas lo que hace y sigues conversando. Pero muchas veces no necesitas una conversación, solo ejecutar una instrucción y obtener una salida.

Con codex exec le mandas un prompt directamente desde el terminal. Al ejecutarlo, ves el directorio de trabajo, el modelo, los permisos, el sandbox, el nivel de reasoning y, al final, la respuesta junto al consumo de tokens. En una prueba simple con un saludo, el agente reportó un gasto de 7551 tokens [00:54].

¿Qué es Codex Exec? Es un comando que ejecuta Codex desde la terminal en modo no interactivo. Le envías una tarea, devuelve una respuesta y cierra la sesión.

¿Cómo se controlan los permisos con el sandbox en Codex?

El sandbox es el ambiente donde tu agente trabaja, y define qué puede hacer dentro del repositorio. Controlarlo es la forma más directa de evitar acciones no deseadas.

Si agregas la bandera sandbox read-only al comando, el agente solo puede leer archivos. Al pedirle que cree un archivo en ese modo, responde con un error claro: el workspace está en modo lectura y no tiene permisos para escribir [01:50]. Esto te permite probar prompts sin riesgo de modificar el proyecto.

¿Por qué los tokens también significan dinero?

Cada archivo que lee el agente, cada esquema que interpreta y cada skill que carga ocupa contexto. En proyectos pequeños no se nota, pero en proyectos grandes el contexto se llena rápido.

Cuando eso pasa, el agente tiene menos espacio para razonar sobre la tarea actual. Entonces el problema no es solo el costo: también es la capacidad de trabajo del modelo.

¿Cómo reducir el consumo de tokens en AI Radar?

En una prueba real con AI Radar, le pidieron al agente traer las últimas dos noticias guardadas. El agente leyó la skill, analizó el JSON, revisó la información del día y entregó la respuesta. El gasto fue de 15 597 tokens [02:27].

Para responder algo aparentemente simple, Codex tuvo que cargar instrucciones, leer archivos, interpretar estructuras y gastar tokens en contexto. Funciona, pero tiene un costo evidente.

¿Cuándo conviertes una tarea en una herramienta del proyecto?

La regla práctica: si una tarea es repetible, determinística y validable, no debería gastar tokens cada vez que el modelo la descubra. Conviértela en una tool.

Para probarlo, abres Codex y le pides crear un script en Python que lea el JSON diario de AI Radar y devuelva n señales en JSON, con opciones para elegir día, cantidad y orden. Además, le pides crear un skill que se active cuando alguien quiera consultar señales y que llame automáticamente al tool [03:36].

¿Qué diferencia hay entre usar prompts largos y herramientas dedicadas?

Al repetir el mismo comando después de crear el tool y el skill, el modelo encontró la skill, llamó al tool en solo dos intentos y entregó la misma respuesta. Esta vez gastó únicamente 5228 tokens [04:18].

La comparación es contundente:

Antes: 15 597 tokens cargando contexto y razonando.
Después: 5228 tokens delegando a una herramienta.
Ahorro: cerca de dos tercios del consumo.

La diferencia importante no es solo gastar menos tokens. Es que el agente dejó de gastar razonamiento en una tarea mecánica, lo que hace el proceso más rápido y más confiable.

¿Cuándo conviertes una tarea en herramienta? Cuando es repetible, determinística y validable. Si el resultado se puede verificar y siempre sigue la misma lógica, conviértela en tool y deja al modelo solo para decidir cuándo usarla.

¿Qué herramienta puedes crear para practicar en AI Radar?

El reto es construir una herramienta pequeña para tu proyecto. Algunas ideas:

Detectar señales duplicadas.
Contar señales por estado.
Validar evidencia vacía.
Listar fuentes primarias.

Luego, escribe un skill corto que le diga a Codex cuándo usar esa herramienta. La idea es que el modelo no tenga que redescubrir el patrón cada vez.

Comparte en los comentarios tres cosas: qué tool creaste, qué skill la activa y cuántos tokens aproximadamente ahorraste comparando el antes y el después.

Daniel Acosta Bermúdez

Estudiante

Aqui les dejo este Tool para noticias sin evidencia: #!/usr/bin/env python3

"""

AI Radar Tool: validate_empty_evidence.py

Detecta señales/noticias sin evidencia suficiente.

Uso:

python tools/validate_empty_evidence.py

python tools/validate_empty_evidence.py --db data/ai_radar.db

python tools/validate_empty_evidence.py --limit 20

La tool intenta encontrar columnas tipo:

- evidence

- evidence_url

- source_url

- url

- source

Si no encuentra una columna llamada evidence, usa url/source como evidencia mínima.

"""

import argparse

import sqlite3

from pathlib import Path

DEFAULT_DB_PATHS = [

"data/ai_radar.db",

"ai_radar.db",

"news.db",

]

def find_default_db():

for path in DEFAULT_DB_PATHS:

if Path(path).exists():

return path

return None

def get_columns(conn, table_name):

rows = conn.execute(f"PRAGMA table_info({table_name})").fetchall()

return [row[1] for row in rows]

def table_exists(conn, table_name):

rows = conn.execute(

"SELECT name FROM sqlite_master WHERE type='table' AND name=?",

(table_name,),

).fetchall()

return len(rows) > 0

def build_empty_condition(columns):

evidence_candidates = [

"evidence",

"evidence_url",

"source_url",

"url",

"source",

]

available = [col for col in evidence_candidates if col in columns]

if not available:

return None, []

conditions = [

f"({col} IS NULL OR TRIM({col}) = '')"

for col in available

]

return " AND ".join(conditions), available

def main():

parser = argparse.ArgumentParser(

description="Detecta señales de AI Radar sin evidencia suficiente."

)

parser.add_argument(

"--db",

default=None,

help="Ruta a la base de datos SQLite.",

)

parser.add_argument(

"--table",

default="news_items",

help="Nombre de la tabla a revisar. Default: news_items",

)

parser.add_argument(

"--limit",

type=int,

default=25,

help="Cantidad máxima de registros a mostrar.",

)

args = parser.parse_args()

db_path = args.db or find_default_db()

if not db_path:

print("❌ No encontré base de datos SQLite.")

print("Usa: python tools/validate_empty_evidence.py --db ruta/a/tu.db")

return 1

if not Path(db_path).exists():

print(f"❌ No existe la base de datos: {db_path}")

return 1

conn = sqlite3.connect(db_path)

conn.row_factory = sqlite3.Row

if not table_exists(conn, args.table):

print(f"❌ No existe la tabla: {args.table}")

return 1

columns = get_columns(conn, args.table)

condition, evidence_columns = build_empty_condition(columns)

if not condition:

print("⚠️ No encontré columnas de evidencia conocidas.")

print("Columnas disponibles:")

print(", ".join(columns))

return 1

select_columns = [

col for col in ["id", "title", "source", "url", "score", "collected_at"]

if col in columns

]

if not select_columns:

select_columns = ["rowid"]

query = f"""

SELECT {", ".join(select_columns)}

FROM {args.table}

WHERE {condition}

LIMIT ?

"""

rows = conn.execute(query, (args.limit,)).fetchall()

print("🧪 AI Radar — Validación de evidencia vacía")

print(f"DB: {db_path}")

print(f"Tabla: {args.table}")

print(f"Columnas usadas como evidencia: {', '.join(evidence_columns)}")

print("-" * 60)

if not rows:

print("✅ No encontré señales sin evidencia.")

return 0

print(f"⚠️ Señales sin evidencia encontradas: {len(rows)}")

print()

for row in rows:

item = dict(row)

print("—")

for key, value in item.items():

print(f"{key}: {value}")

print()

print("Siguiente acción sugerida:")

print("Revisar estas señales antes de resumirlas, puntuarlas o enviarlas.")

return 0

if __name__ == "__main__":

raise SystemExit(main())

Juan Camilo Mejía Rodríguez

JESUS DANIEL MALMA MONTAÑO

YENNI BARRETO

•

Luis Puerta

Luis Enrique Medina Laguna

Kevin Franco

Maikel Andres Vinces Mendoza

Jordi Felipe Guerrero Diaz

Juan Francisco Rodríguez Riaño

DANIELA MICHELLE CASTANEDA TRINIDAD

Alejandra Oliva Rangel

Aaron Santillan

Alvaro Hernandez

David Ricardo Valencia Cruz

Ulqernesh Karvenae

Kenneth Angulo L

Pedro Jesus Hincapie Garcia

Dilan Bocanegra

Eficiencia en ejecución y gestión de Tokens

Fundamentos y Configuración de Codex

Qué puede hacer un agente de IA en tu repositorio

Cómo configurar agents.md en Codex CLI

⁠ ⁠Estructuración de datos

Creación de Skills y lógica reutilizable

Optimización de Contexto