Componentes clave de un agente de IA

Resumen

Los agentes de inteligencia artificial funcionan gracias a cuatro componentes que imitan la forma en la que tú resuelves problemas: percepción, planificación y razonamiento, herramientas y memoria. Entender cómo encajan estas piezas es clave si quieres construir aplicaciones autónomas con LLMs y diseñar prompts que realmente guíen a tu agente.

¿Cuáles son los cuatro componentes de un agente de IA?

Un agente no es solo un modelo respondiendo preguntas. Es un sistema que percibe, piensa, actúa y recuerda. Cada componente cumple una función específica y, cuando trabajan juntos, aparece esa autonomía que distingue a un agente de un simple chatbot [0:08].

  • Percepción: cómo el agente recopila información del entorno.
  • Planificación y razonamiento: cómo analiza el problema y crea un plan.
  • Herramientas: las interfaces externas que ejecuta para resolver pasos concretos.
  • Memoria: cómo aprende de interacciones pasadas y las usa como contexto.

¿Qué es un agente de IA en términos simples? Es un sistema que combina un LLM con percepción, herramientas y memoria para resolver tareas de forma autónoma, no solo responder texto.

¿Cómo percibe un agente su entorno?

La percepción es el mecanismo de entrada del agente. La mayoría de los agentes actuales son pasivos: necesitan que algo los active [1:30].

Esa activación normalmente llega como texto. Puede ser un prompt que tú escribes, un correo electrónico entrante o un mensaje de WhatsApp que dispara un evento preprogramado. Ya están en desarrollo entradas multimodales como voz, imágenes y sensores físicos, pero hoy el estándar sigue siendo el texto.

¿Cómo razona y planifica un agente de IA?

El cerebro del agente es un large language model, un LLM. Cuando recibe una consulta, su trabajo es idear cómo resolver el problema y luego ejecutar los pasos [2:30].

Los LLM son cada vez más poderosos, pero necesitan contexto. Y ese contexto se lo das tú a través de prompts bien diseñados, que funcionan como las instrucciones que orientan al cerebro del agente.

¿Qué es la planificación sin retroalimentación?

Es la forma más sencilla de hacer planear a un modelo. Le pides que cree un plan basado en su comprensión inicial y lo ejecute tal cual, sin modificarlo en el camino [3:20]. Es un plan estático.

El diseño más común aquí se llama cadena de pensamiento: en lugar de pedirle al modelo una respuesta directa, le pides que piense paso a paso antes de responder.

¿Qué es la cadena de pensamiento o chain of thought? Es una técnica de prompting donde le indicas al LLM que razone paso a paso antes de dar la respuesta final, lo que mejora la calidad del resultado en problemas complejos.

La cadena de pensamiento tiene dos variantes principales:

  • Zero-shot: le dices simplemente "piense en el problema paso a paso", sin ejemplos.
  • Few-shot: le das algunos ejemplos resueltos para que use como base y desarrolle su propia solución.

¿Qué es la planificación con retroalimentación?

Aquí el agente ajusta y refina su plan mientras lo ejecuta. Reflexiona sobre sus propias respuestas, las critica y las modifica en el camino [5:00]. Es mucho más poderosa y se apoya en dos diseños fundamentales.

REACT combina reason y act. El LLM va generando rastros de razonamiento verbal y acciones, y ajusta su plan con la información que obtiene de las herramientas. Es un ciclo que continúa hasta que el modelo llega a su respuesta final usando su propia información para reaccionar, pensar y actuar.

REFLECTION usa un segundo LLM como supervisor. Mientras un modelo genera respuestas, otro le pide críticas y recomendaciones constantemente. Pueden ser dos modelos en paralelo o varios trabajando juntos. El objetivo es ejecutar ese bucle de crítica y respuesta hasta que el agente esté satisfecho con la respuesta antes de avanzar al siguiente paso.

¿Cuál es la diferencia entre REACT y REFLECTION? REACT es un único LLM que razona y actúa en ciclo con sus herramientas. REFLECTION añade un segundo LLM que supervisa y critica las respuestas del primero, a costa de más latencia y costo.

Esta segunda aproximación incrementa muchísimo la efectividad del agente, aunque implica más llamadas a modelos, más costo y más latencia.

¿Por qué los agentes empiezan a parecer humanos?

Cuando juntas percepción, razonamiento, acciones y memoria, el resultado se parece bastante a cómo tú enfrentas un problema complejo: observas, piensas, actúas con herramientas y aprendes de lo que hiciste antes.

Esa es la promesa de los agentes: imitar gradualmente la autonomía humana para resolver tareas. Los LLM son el cerebro que les permite planificar y razonar, mientras que los planes que generan pueden ser estáticos, como en cadena de pensamiento, o dinámicos, como en REACT y REFLECTION.

¿Tú con cuál arquitectura empezarías tu primer agente, cadena de pensamiento o REACT? Cuéntame en los comentarios.