Creación de Agentes Inteligentes con LangChain

Clase 3 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Imagina un asistente virtual que no solo responde preguntas, sino que toma decisiones, ejecuta acciones y busca información en tiempo real. Eso es exactamente lo que logran los agentes en LangChain: entidades autónomas capaces de percibir, razonar y actuar utilizando herramientas externas. Comprender su arquitectura es el primer paso para construir soluciones de inteligencia artificial realmente funcionales.

¿Cómo se organiza la arquitectura de LangChain?

LangChain se estructura en capas bien definidas que trabajan juntas para dar vida a un agente. Dentro de LangChain Core [01:10] encontramos los componentes fundamentales: los Large Language Models (LLM) y las bases vectoriales. A nivel de LangChain propiamente dicho, se construyen las cadenas (chains) y los agentes. Por otro lado, LangChain Community [01:28] agrupa todas las integraciones con tecnologías externas como OpenAI, Hugging Face o Google.

Un elemento clave es el LangChain Expression Language (LCEL) [01:48], un lenguaje de expresión propio del framework que permite conectar cadenas e integraciones para finalmente construir el agente. Cada componente tiene entradas y salidas específicas; por ejemplo, al interactuar con prompts, se envía un diccionario como input y se obtiene un objeto llamado prompt value como output [02:10].

¿Qué es un agente y cómo percibe su entorno?

Una referencia fundamental para entender agentes proviene del libro Artificial Intelligence: A Modern Approach de Norvig y Russell [03:02]. En este modelo, un agente interactúa con un ambiente del cual recibe información a través de sensores, y a partir de esos datos toma acciones concretas.

Un agente puede ser desde un chatbot hasta un robot físico.
Los sensores pueden ser cámaras, sensores térmicos u otras fuentes de datos.
Las acciones van desde generar respuestas hasta mover componentes mecánicos.

El ciclo se resume en tres etapas claras: percibir, razonar y actuar [03:48]. Por ejemplo, un asistente de preguntas frecuentes primero percibe las consultas técnicas, luego razona buscando respuestas en bases de datos internas o manuales, y finalmente actúa accediendo a las APIs correctas para resolver problemas o proporcionar instrucciones.

¿Cuáles son los pasos para crear un agente con LangChain?

El proceso de construcción sigue un flujo progresivo con componentes que se van integrando uno sobre otro [04:18]:

¿Cómo seleccionar el modelo de lenguaje adecuado?

Todo comienza eligiendo un Large Language Model a través de los chat models de LangChain [04:28]. Las opciones incluyen OpenAI, Hugging Face u otros modelos disponibles. A este modelo se le puede añadir un prompt, ya sea utilizando los templates predefinidos de LangChain o creando uno personalizado según las necesidades del proyecto.

¿Qué papel juegan las bases vectoriales y las cadenas?

Cuando se construye un chatbot, es posible incorporar una base vectorial [04:55] que contenga información exclusiva del caso de uso. Esta base alimenta al modelo y permite generar respuestas contextualizadas. Las cadenas (chains) son el componente más importante del proceso [05:08], ya que permiten unir todos los elementos anteriores utilizando LCEL.

¿Qué herramientas se pueden integrar al agente?

En la etapa final se construye el agente propiamente dicho [05:23], al cual se le pueden añadir:

Herramientas predefinidas que ya ofrece LangChain.
Herramientas personalizadas construidas a medida.
Memoria para mantener contexto entre interacciones.
Una base de conocimiento o base vectorial para consultas especializadas.

El resultado final es un asistente inteligente que combina modelo de lenguaje, prompts, memoria, herramientas externas y bases de conocimiento en una sola entidad capaz de tomar decisiones autónomas.

¿De qué manera te gustaría utilizar LangChain para construir tu propio agente? Comparte tus ideas en los comentarios.

Comentarios

Orlando Castellanos

student•

me gustaria construir un agente que planee viajes ,de tal manera que de manera conversacional genere un presupuesto,busque hospedaje,busque trasporte y haga un itinerario

Guillermo Baldán López

student•

Excelente idea. Podrías hacer un modelo de negocio basado en un agente como ese.

Yesue Pachon

student•

es una gran indea, para algo personal. tomare prestada nuestra idea

Cornelio Reyes

student•

Un Agente querealice pagos automáticos de impuestos, servicios y de personal de una Empresa.

Guillermo Baldán López

student•

Es buena idea, pero yo le pondría un poco de supervisión. Pondría una interfaz donde el agente solicitase permiso para hacer una serie de pagos que presentaria en la interfaz, dandole opción a un supervisor humano de quitar o añadir algún otro concepto.

Ariel Ezequiel Biazzo Genua

student•

Estaria cool que evies capturas de pantalla a la hora de enviar permisos, a dia de hoy, las personas necesitan ver para aceptar que algo SI esta siendo realizado.

Juan Camilo Noreña López

student•

Base de datos vectorial => sistema de almacenamiento y búsqueda diseñado para manejar representaciones vectoriales de datos, en lugar de trabajar con datos como números o texto, está optimizada para almacenar y gestionar representaciones numéricas de datos más complejos como imágenes, texto o sonidos, y permiten realizar búsquedas de manera más eficiente.

¿Cómo funcionan? 🔍

Representación vectorial: a través de técnicas como embeddings, donde cada dimensión del vector representa una característica del objeto o concepto.

Ejemplo: Un documento de texto puede representarse como un vector de varias de dimensiones, donde cada dimensión refleja la relación con otra palabra.

Búsqueda aproximada (nearest neighbors): permite realizar búsquedas basadas en similitud, en lugar de buscar por coincidencias exactas, buscan vectores cercanos en el espacio de características.

Ejemplo: En una DB de imágenes, puede buscar una imagen similar a otra (o "parecida") basándote en la cercanía de sus vectores.

Levi Nuñez

student•

Estos asistente virtuales que no responda preguntas sino que también tome decisiones por nosotros ya sea ejecutar acciones y busca información en tiempo real, al final estas son entidades autónomas capaces de percibir, razonar y actuar utilizando herramientas externas.

Guía Conceptual

Conceptual guide | 🦜️🔗 LangChain

LangChain v0.2 es un marco modular diseñado para construir aplicaciones que usan modelos de lenguaje. Se compone de varios paquetes como:

langchain-core: Contiene los componentes principales como los modelos de lenguaje (LLMs), almacenes vectoriales y mecanismos de recuperación.
langchain: Gestiona las cadenas o Chains y agentes que permiten la interacción y ejecución de flujos complejos.
langchain-community: Ofrece integraciones de terceros que permiten conectar LangChain con herramientas externas. ejem: modelos OpenAI, Hugging Face
LangChain Expression Language (LCEL): Facilita la combinación de diferentes componentes de manera flexible. Basicamente nosotros vamos a utilizar un lenguaje de expresión que le pertenece solamente Langchain para poder agarrar cada una de las cadenas o integraciones y finalmente poder construir la agente
Runnable: Una interfaz para crear cadenas personalizadas. esta es estandar.métodos asincrónicosEl tipo de entrada y el tipo de salida varían según el componente:ComponentInput TypeOutput TypePromptDictionaryPromptValueChatModelSingle string, list of chat messages or a PromptValueChatMessageLLMSingle string, list of chat messages or a PromptValueStringOutputParserThe output of an LLM or ChatModelDepends on the parserRetrieverSingle stringList of DocumentsToolSingle string or dictionary, depending on the toolDepends on the tool
- stream : transmitir fragmentos de la respuesta
- invoke : llamar a la cadena en una entrada
- batch : llamar a la cadena en una lista de entradas

- astream : Stream back: fragmentos de la respuesta asíncrona
- ainvoke : llamar a la cadena en una entrada asíncrona
- abatch : llamar a la cadena en una lista de entradas asíncronas
- astream_log : retroceder los pasos intermedios a medida que se producen, además de la respuesta final
- astream_events : eventos de flujo beta a medida que ocurren en la cadena

Agentes

Conceptual guide | 🦜️🔗 LangChain

Para los agentes uno de los recursos bibliograficos mas importantes que tenemos que estudiar es “ARTIFICIAL INTELLIGENCE: A Modern Approach de Peter Norvig & Stuart J. Russell”

Aqui vemos expuesto lo que es el diagrama de un agente:

Un agente interactúa con un ambiente de donde recibe información mediante ciertos sensores y éste puede tomar acciones a partir de cada uno de estos datos información. Ahora un agente puede ir desde la creación de un Chat Bot o un asistente hasta lo que es un robot recibe información mediante diferentes sensores como puede ser una cámara o un sensor térmico etc. y tomar una acción como puede ser mover alguna de sus partes!Por ejemplo queremos un asistente que responda preguntas frecuentes, para ello lo primero que hacemos es percibir las preguntas técnicas frecuentes y luego razona buscando respuestas en bases de datos internas o manuales técnicos y finalmente actuamos actuamos accediendo a las APIs correctas para resolver problemas o o proporcionar instrucciones.
Instalacion de herramientas Python 3.9 en adelante, Anaconda venv, OpenAI API Key, Pinecone user, VS Code, LangChain
Seleccionar un LLM esto lo vamos a hacer en langchain con un Chat Models y podemos utilizar lo que es OpenAI, Hugging Face o Google, ademas podemos añadirle un prompt en donde Langchain ya tiene diferentes templates para nosotros también podemos crear uno de acuerdo a nuestras necesidades.!
Al momento que estemos interactuando o creando algún Chat Bot nosotros vamos a poder utilizar una base vectorial donde tenemos información que le pertenece solamente a nuestro caso alimentamos el modelo lo consultamos y vamos a poder construir algunas respuesta. Las Chains son la parte más importante ya que nos permite comunicar o unir cada uno de estos procesos para poder Crear lo que es el agente. para estos usaremos el lenguaje LCEL que es propio de langchain.!
Construcción del agente donde nosotros nosotros vamos a poder añadir diferentes herramientas que ya tienen Langchain o que nosotros necesitemos para poder construirlo.!

andres reyes

student•

No se si es por mi lado, pero las imágenes no me cargan

Gustavo Trillo

student•

Si, no cargan, pero se agradece el resumen

Sara María Mejia Sánchez

student•

Actualmente identifico oportunidades de mejora en diferentes áreas, sobre las cuales un agente puede generar valor:

Atención en restaurantes (chat de pedidos)
Turismo: planeación de itinerarios, presupuestos de rutas, transporte aéreo y terrestre
Servicio al cliente para venta de productos en general

Guillermo Baldán López

student•

servicios de atención al cliente tanto para el sector privado como público

Guillermo Baldán López

student•

En este curso se trata sobre la construcción de agentes ¿Y como sería la construcción de un equipo de agentes? En el siguiente esquema presento una idea de sistema mejorado de razonamiento construido a partir de dos agentes. Básicamente un agente emite un razonamiento y otro agente lo critica entonces el primer agente toma la crítica que ha hecho el segundo agente, el agente adversarial y apartir de esta crítica mejora el primer razonamiento. Se podría ajustar el número de loops del proceso.

Jonathan Mauricio Meza Bastidas

student•

para la construcción de un equipo de agentes está n8n

Alvaro Hernandez

student•

Me parece bien una herramienta que analice tu manejo de cuentas bancarias y segun los movimientos comience a sugerir oportunidades de ahorro e inversion.

Yesue Pachon

student•

crearia un equipo de asesoramiento para los diferentes ambitos de mi vida. Compuestos por un asesor de image, un asesor de salud, un asesor de finanzas, un asesor de formacion academica, un optimizador de decisiones y reduccion de riesgos

Eduardo Guzmán

student•

Me gusta el uso de los "pizarrones" con los diagramas son excelentes!

andres reyes

student•

Me gustaría crear un agentes para ayudarme a entender y poder contribuir en un open-source

David Rosas

student•

Con este curso aprenderé a crear un agente de ventas, que atienda y responda preguntas de clientes potenciales de un Broker Hipotecario y PyME

Julie Andrea Martinez Ramirez

student•

Comparto flujo de aprendizaje

Juan Pablo Lozano

student•

es necesaria la músiquita de fondo?

Guillermo Baldán López

student•

Muchas veces he pensado como sería hacer un agente que me busque trabajo por Internet.

Guillermo Baldán López

student•

Me gustaría crear un duo de agentes adversariales para programación. El usuario en un promp especificaría que quiere programar y habría un agente que definiría unos tests que tendría que pasar el código y otro agente que escribira el código que pasara los test. El agente que escribe el código estaría en un sandbox de tal manera que pudiera lanzar los test y reentrenarse con retroalimentación.

andres reyes

student•

Me gusta la idea de "re-entrenarse" esta retroalimentación estaría bien si es a base de código de open-source o de stackoverflow donde usen buenas practicas

Carlos Gustavo Gambedotti

student•

una idea similar de opener codigos dio origen a Core War, ¡no me lo quiero imaginar con IA! ...

David Rosas

student••

En el contexto de esta clase, ¿qué significa CADENA?

En el contexto de la clase, una "cadena" (o "chain" en inglés) se refiere a una secuencia de procesos interconectados que forman parte de la construcción de agentes inteligentes en LangChain. Estas cadenas permiten integrar diferentes componentes, como modelos de lenguaje, bases de datos vectoriales y herramientas externas, para que el agente pueda percibir, razonar y actuar de manera autónoma. La creación de cadenas es fundamental para el funcionamiento efectivo de los agentes que se desarrollan en el curso.

César Mauricio Díaz Claros

student•

Me gustaría usar LangChain para construir un agente especializado en la gestión un comité al que desempeño el rol de secretaría técnica. La idea es aprovechar su capacidad de orquestar LLMs con memoria, herramientas externas y cadenas de razonamiento.

El agente estaría conectado a las fuentes de conocimiento institucionales (actas de comité, reglamentos, proyectos y decisiones tomadas), usando embeddings y un vector store para poder recuperar información precisa. Con esta estructura el agente podría:

Responder preguntas sobre decisiones pasadas del comité, consultando las actas y resumiendo la información relevante.
Evaluar si un tema es pertinente para ser tratado en el comité, comparando el asunto con los criterios establecidos en el reglamento.
Automatizar la agenda, de modo que si un tema es pertinente pueda programar la sesión en Google Calendar e invitar automáticamente a los miembros del comité.

LangChain me permitiría integrar en un solo flujo la memoria semántica (para consultar actas y reglamentos), el razonamiento del LLM (para decidir pertinencia) y las herramientas externas (calendar, correo) para ejecutar acciones concretas. De esa forma el agente no sería solo un chatbot, sino un asistente operativo completo para el funcionamiento del comité.

Oriana Carolina Ailigo

student•

Realizar un menu de cada dia con alimentos buenos para la salud, tomando los requerimientos para bajar de peso, que tenga el peso actual de la persona y tome accion.

Irwin Morales Cabrera

student•

muy interesante esta clase!!

Miguel Angel Castillo Enriquez

student•

Sí, un agente en LangChain puede alimentarse con documentos en formato PDF. Para hacerlo, es necesario extraer el texto del PDF y estructurarlo de manera que sea comprensible para el agente. Esto se puede lograr mediante bibliotecas de Python como PyPDF2 o pdfplumber, que permiten leer y manipular el contenido de archivos PDF. Una vez que el texto está disponible, puede ser utilizado como entrada en la construcción de un modelo de agente inteligente.

Creación de Agentes Inteligentes con LangChain

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain