Construcción de un Asistente Conversacional con LangChain y RAG

Clase 22 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Integrar una base vectorial con memoria conversacional es el paso definitivo para construir un asistente inteligente que responda exclusivamente con la información que tú has cargado. A lo largo de este recorrido se conectan todas las piezas: el prompt contextualizado, el retriever, el modelo de lenguaje y el historial de chat, formando una cadena RAG completa y funcional.

¿Cómo se crea un prompt contextualizado para el asistente?

Una vez que los documentos están indexados en el espacio vectorial, el siguiente paso es construir un prompt contextualizado que le indique al modelo cómo debe comportarse [1:12]. Este prompt cumple varias funciones:

Instruir al modelo para que responda según el historial del chat.
Considerar la última pregunta del usuario cuando contenga información relevante.
Evitar responder si la información no se encuentra ni en el historial ni en el contexto cargado.
Mantener un tono profesional en cada respuesta.

Para armarlo se utiliza Chat Prompt Template con el método from_messages, que recibe una lista con tres elementos: el system prompt (las instrucciones del sistema), un Message Placeholder que aloja el chat_history y finalmente la entrada del humano representada por la variable input [1:48].

¿Qué papel juegan Message Placeholder y Chat History?

El componente Message Placeholder actúa como un contenedor dinámico donde se inyecta el historial de la conversación. Cada vez que el usuario hace una nueva pregunta, ese historial se actualiza automáticamente, lo que permite al modelo recordar intercambios anteriores y mantener coherencia en sus respuestas [2:25].

¿Cómo se integran el retriever, el LLM y el prompt en un RAG chain?

Con el prompt contextualizado listo, se procede a unir las tres piezas fundamentales en un solo objeto [3:30]:

Large Language Model (LLM): el motor que genera las respuestas.
Retriever: la conexión al espacio vectorial donde están los documentos.
Prompt contextualizado: las instrucciones que guían la generación.

Primero se crea un QA prompt (question answering), que sigue la misma estructura de system, Message Placeholder y human input [4:05]. Luego, con el módulo para trabajar con documentos, se construye el chain pasándole el LLM y este último prompt.

El RAG chain resultante combina la recuperación de documentos relevantes con la generación de respuestas, asegurando que toda la información provenga exclusivamente de lo que se ha cargado previamente [4:50].

¿Cómo se añade el historial de sesión a la cadena?

Para gestionar la memoria se utiliza un diccionario que almacena cada session ID junto con su conversación asociada [5:30]. La cadena final, llamada Conversational RAG Chain, se construye utilizando el historial de mensajes y recibe cuatro parámetros clave:

El RAG chain ya creado.
La función get_session_history para recuperar conversaciones previas.
La llave input con la consulta del usuario.
La llave chat_history para el historial y output_message_key para la respuesta.

Al invocar el chain con el método invoke, se le pasa tanto la pregunta como la configuración de sesión, por ejemplo session_id: "abc123" [6:20].

¿Qué hacer cuando el modelo no devuelve la respuesta esperada?

Un problema frecuente al trabajar en Google Colaboratory es que el modelo responda que no tiene información, aun cuando los documentos están cargados correctamente [7:00]. La solución consiste en desconectar y borrar el tiempo de ejecución desde el menú "Entorno de ejecución" y volver a ejecutar todas las celdas desde el inicio, incluyendo la carga de las API keys.

Este comportamiento está ligado a los servidores de Google y no al código en sí. Si estás seguro de que cada paso está bien escrito, reiniciar el entorno suele resolver el problema [7:25].

Tras el reinicio, al preguntar "¿Cuál es la receta de avena con frutas?", el asistente devuelve exactamente la información del documento cargado: una taza de avena, una taza de leche de almendras, una cucharada de miel y frutas frescas [8:10]. No inventa ni trae datos de fuentes externas, lo que confirma que el sistema RAG funciona correctamente.

Para mejorar la legibilidad de las respuestas, se recomienda envolver la salida con print(), lo que estructura mejor el texto en el notebook. También es importante recordar que el modelo puede variar ligeramente su redacción en cada ejecución, ya que se le ha dado libertad creativa dentro de los límites del contexto proporcionado [8:35].

El reto a partir de aquí es seleccionar un problema real y alimentar el espacio vectorial con documentos especializados, como bibliografía de inteligencia artificial, para que el asistente enseñe esos temas de forma conversacional. Comparte tu idea en los comentarios y explora todo el potencial de LangChain combinado con RAG.

Luis Castillo

student•

creo que las nuevas versiones de langchain no te dejan importar de esa manera:

from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

from langchain.chains.history_aware_retriever import create_history_aware_retriever

from langchain.chains.retrieval import create_retrieval_chain

contextualize_q_system_ = ChatPromptTemplate.from_messages(

[

(

'system', contextualize_q_system_prompt

MessagesPlaceholder(variable_name='chat_history'),

('human', '{input}')

]

ModuleNotFoundError                       Traceback (most recent call last)

/tmp/ipython-input-965246410.py in <cell line: 0>()
      1 from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
----> 2 from langchain.chains.history_aware_retriever import create_history_aware_retriever
      3 from langchain.chains.retrieval import create_retrieval_chain
      4 
      5 contextualize_q_system_ = ChatPromptTemplate.from_messages(

ModuleNotFoundError: No module named 'langchain.chains'

---------------------------------------------------------------------------
NOTE: If your import is failing due to a missing package, you can
manually install dependencies using either !pip or !apt.

To view examples of installing some common dependencies, click the
"Open Examples" button below.

John Salcedo

student•

si, la solucion es ejecutar este comando:

!pip -q install -U langchain-classic

y el impor cambia a:

from langchain_classic.chains import create_history_aware_retriever, create_retrieval_chain

el tema es que hubo seguramente un gran cambio y quedo este lang_chain clasic , que de hecho este cambio es como de unos 5 meses atras, por lo demas todo funciona.

Nota: tener en cuenta que se deben ajustar otros imports al lang chain classic y si lo hacen por google colab da otros errores pero que tiene que ver con las versiones del python en el colab, ese fue mi caso, pero estas no me impedieron realizar el ejercicio.

Guillermo Baldán López

Gerardo Mayel Fernández Alamilla

Ricardo Gomez

Eduardo Guzmán

IA Terra

Jairo Arturo Morán Burgos

Juan Diego Mamani

Sandra Milena RAIRAN PINILLA

Daniel Jaramillo

Juan Camilo Mejía Rodríguez

Harold Combita

luis arturo Monsalve

Gerardo Miguel Pérez Solis

Abimelek Castrezana

Juan Andrés Guillamet Chargué

Construcción de un Asistente Conversacional con LangChain y RAG

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain

Creación de Agentes Inteligentes con LangChain

Instalación y uso de API Keys para modelos de lenguaje en Google Collab

Chat Models y Prompt templates

Chat Messages con OpenAI

Conexión y uso de modelos de chat con LangChain y OpenAI

Uso de Modelos de Google AI Gemini en LangChain

Creación de Plantillas de Prompts en LangChain

Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Cadenas en LangChain

Creación de Cadenas en LangChain con String Output Parser

Gestión de Historial de Chat con LangChain

Integración de Herramientas Claves en LangChain: Runnable, OutputParser, Streaming

Creación de Chatbots Inteligentes con Memoria Conversacional

Cadena de Procesos para Memoria Conversacional con GPT-3.5 Turbo

Carga de documentos en LangChain

Carga y procesamiento de archivos HTML con LangChain y Beautiful Soup

Carga de PDFs y CSVs en LangChain con PyPDF y CSV Loader

División de Texto en Fragmentos con TextSplitters en LangChain

Retrieval-augmented generation (RAG)

Gestión de Vectores de Texto con Chroma y LangChain

Embeddings y su aplicación en modelos de lenguaje y RAG

Pinecone: Implementación de Bases de Datos Vectoriales Escalables

Creación de Chatbot RAG con LangChain y ChromaDB