Qué es un agente de IA y cuándo usarlo

Curso para Crear Agentes de AI con MongoDB

Contenido del curso

Fundamentos y Configuración de Agentes de AI

Herramientas y Búsqueda Vectorial

Orquestación y Construcción con LangGraph

Criterios de Uso y Finalización

13
Qué lograste al crear tu agente con MongoDB
00:48 min

Tomar examen

Qué es un agente de IA y cuándo usarlo

Resumen

Un agente de inteligencia artificial es un sistema que usa un LLM para razonar, planear y ejecutar pasos hasta resolver un problema, apoyándose en herramientas externas como APIs, bases de datos u otros agentes. Si trabajas con búsqueda, soporte técnico o automatización, entender la diferencia entre prompting, RAG y agentes te ayuda a elegir la arquitectura correcta para tu producto.

Piensa en la barra de búsqueda de cualquier sitio web. Antes funcionaba con keywords o full text search, pero con la ola de la IA generativa hoy hablas en lenguaje natural y obtienes respuestas contextuales. El propio buscador del knowledge base de MongoDB opera así, como una aplicación RAG, y el siguiente salto natural es convertirlo en un agente con memoria y capacidad de decisión [0:48].

¿Qué es un agente de IA y para qué lo necesitas?

Un agente no solo responde: razona sobre el problema, arma un plan, ejecuta pasos y vuelve a iterar hasta llegar a la solución. Para hacerlo, se conecta con el mundo exterior a través de herramientas, que son básicamente componentes externos: una API, una base de datos o incluso otro agente [2:10].

¿Qué es un agente de IA? Es un sistema basado en un LLM que razona sobre un problema, crea un plan, ejecuta pasos usando herramientas externas e itera hasta entregar una solución.

Esa capacidad de iterar y decidir el siguiente paso es lo que separa a un agente de un chatbot tradicional. No te entrega una respuesta única y cerrada, sino que evalúa si necesita más información, si debe llamar a otra herramienta o si ya tiene lo suficiente para responder.

¿Cuáles son los tres paradigmas para interactuar con un LLM?

Hoy existen tres formas principales de trabajar con un modelo de lenguaje, y cada una resuelve un nivel de complejidad distinto [2:45].

Simple prompting: le haces una pregunta al LLM y responde solo con su información paramétrica, es decir, el conocimiento con el que fue entrenado.
RAG (Retrieval-Augmented Generation): le inyectas tu información propietaria para que combine su entrenamiento con datos tuyos.
Agentes: el modelo razona, decide y ejecuta acciones usando herramientas externas en múltiples pasos.

Cada escalón añade capacidades, pero también costo y complejidad. Veamos cuándo conviene cada uno.

¿Cuándo usar simple prompting y por qué falla?

En el simple prompting solo conversas con el modelo. Si no tiene la información necesaria, no puede darte una respuesta apropiada y muchas veces produce las famosas alucinaciones: como no sabe la respuesta pero tiene una confianza envidiable, dice lo que se le ocurre [3:40].

Además, no puede usar sus propias respuestas para refinarse y no ofrece personalización. Sirve para tareas simples y genéricas, pero se queda corto cuando necesitas precisión sobre datos específicos.

¿Qué es RAG y cuándo es suficiente?

RAG significa generación aumentada por recuperación. Aquí le entregas al modelo tu información propietaria, la de tu empresa o tu base de conocimiento, para que la use al responder [4:25].

¿Qué es RAG? Es una técnica donde el LLM combina su entrenamiento con información propietaria que tú le proporcionas, generando respuestas precisas sobre tus propios datos.

Con RAG ya puedes construir un sistema de preguntas y respuestas con información adecuada y cierto grado de personalización. Pero tiene un techo: no maneja procesos de múltiples pasos, no interactúa con sistemas externos complejos y no usa sus propias respuestas para tomar decisiones nuevas. Si tu caso de uso requiere eso, necesitas un agente.

¿Qué ventajas y desventajas tiene un agente frente a RAG?

El agente toma acciones con la ayuda de sus herramientas y razona sobre los resultados que recibe de vuelta para informar la siguiente decisión. Esa decisión puede ser pedir más información, llamar a otra herramienta o entregar la respuesta final [5:50].

Entre sus capacidades destacan:

Manejar consultas complejas de varios pasos.
Usar el historial de interacciones como contexto para futuras respuestas.
Personalizar respuestas a través del tiempo.
Conectarse con múltiples fuentes externas vía APIs, bases de datos u otros agentes.

Ahora, no todo es ganancia. Por su arquitectura, los agentes son más difíciles de desarrollar y más costosos, porque requieren múltiples llamadas a uno o varios modelos de lenguaje. Y aquí viene un punto importante: los agentes no son determinísticos. Con las mismas entradas no siempre obtendrás la misma respuesta, porque los LLM se basan en probabilidad [7:15].

¿Por qué un agente no es determinístico? Porque los modelos de lenguaje generan respuestas con base en probabilidad, así que con las mismas entradas pueden producir salidas distintas en cada ejecución.

Esto significa mayor costo, mayor latencia y mayor complejidad de implementación. Por eso la pregunta no es si los agentes son mejores, sino si tu problema realmente necesita ese nivel de razonamiento iterativo.

¿Tu caso de uso justifica dar el salto de RAG a agente? Cuéntame en los comentarios qué tipo de tareas estás intentando automatizar.

Qué es un agente de IA y cuándo usarlo

Fundamentos y Configuración de Agentes de AI

Agentes de AI con LangGraph y MongoDB

Configura tu entorno de agentes en Instruct