Probar tu billetera paso a paso puede volverse tedioso, sobre todo cuando ya está publicada y funcionando en el navegador. Con un agente de Codex puedes automatizar ese proceso, detectar errores reales y ahorrar tiempo de QA sin tocar tu aplicación.
¿Qué es un agente y por qué usarlo para testear tu app?
Un agente cambia la forma en que pruebas software porque trabaja por ti mientras tú observas los resultados.
¿Qué es un agente de IA? Es un programa autónomo que percibe el entorno, planifica y actúa para cumplir objetivos sin supervisión humana. En testing, eso significa que abre tu app, prueba flujos y reporta hallazgos.
En este flujo usamos Codex App, una herramienta de OpenAI que se parece mucho a ChatGPT y pertenece a la misma empresa. Lo interesante es que no necesitas una sesión paga para empezar a usarla [0:55].
¿Cómo instalar Codex en tu computador?
El proceso es directo y solo te toma unos minutos:
- Busca en Google Descargar Codex App y entra a la segunda opción [0:30].
- Elige la versión según tu sistema operativo, Windows o Mac.
- Instala, abre la app y continúa con tu cuenta de ChatGPT.
- Inicia sesión y otorga acceso completo para que pueda controlar el navegador.
El acceso completo es clave: sin él, el agente no podrá abrir tu app ni interactuar con ella sin pedirte permiso en cada paso.
¿Cómo lanzar el primer prompt al agente para probar tu billetera?
La primera tarea es sencilla, pero marca el tono de todo lo que viene: pedirle al agente que abra la URL pública de tu aplicación [1:25]. Codex usa su navegador integrado y carga la app por ti.
Después cierras el panel y le pasas el segundo prompt, donde le indicas el caso de uso que quieres probar. Aquí viene lo interesante: debes pedirle una respuesta estructurada con resultado esperado, resultado encontrado, evidencia y un veredicto de pasa o falla.
Y un detalle crítico: indícale explícitamente que no modifique la app en ningún momento. El agente debe testear, no editar tu código.
¿Qué pasa cuando el agente encuentra una limitación?
Durante la prueba, el agente intentó validar el flujo de ticket y voz con un caso real, pero se dio cuenta de que no podía ejecutarlo. En lugar de marcarlo como fallo, lo separó como limitación de prueba [2:20].
Esa distinción importa mucho en QA: no es lo mismo un bug del producto que una restricción del entorno de testing. Un buen agente sabe diferenciar entre ambos.
¿Cómo interpretar los resultados y reproducir un bug encontrado?
El agente reportó varios casos: algunos pasaron, el quinto tuvo una observación y dos no fueron concluyentes (foto y notas de voz). Pero el hallazgo más valioso fue un invalid date en la sección de movimientos [2:55].
¿Qué hago si el agente reporta un error sin contexto suficiente? Pídele que te detalle el caso de uso exacto: qué pasos siguió, qué datos ingresó y dónde apareció el error. Así puedes replicarlo manualmente.
Al preguntarle al agente, este explicó que creó una cuenta nueva, agregó un gasto mensual y al ir a ver todo apareció el invalid date [3:25].
¿Cómo replicar manualmente el error reportado?
Para confirmar el bug, sigue los mismos pasos que el agente:
- Registra un nuevo gasto con un valor concreto, por ejemplo 62 mil.
- Asigna categoría comida y descripción mercado.
- Confirma el gasto.
- Da clic en ver todo y revisa la fecha del movimiento.
Al hacerlo, el invalid date aparece tal cual lo describió el agente [4:00]. Ese tipo de errores suelen pasar desapercibidos en pruebas manuales rápidas, y aquí está el verdadero valor de automatizar con un agente.
¿Qué ganas al integrar agentes en tu flujo de desarrollo?
Un agente como Codex te permite testear más rápido, encontrar bugs que tú no habrías notado y mantener un registro estructurado de cada caso. Además, separa limitaciones de fallos reales, lo que hace que los reportes sean más útiles para tomar decisiones.
El reto ahora es tuyo: soluciona los errores que el agente encontró en tu billetera y vuelve a publicar tu app. ¿Qué bugs te detectó tu agente que no esperabas? Cuéntanos en los comentarios.