Creación de Chatbot RAG con LangChain y ChromaDB

Resumen

¿Cómo empezar a construir un Chatbot utilizando Langchain y ChromaDB?

Comenzar con la construcción de un chatbot eficaz implica una comprensión profunda de las herramientas y modelos que interfieren en su desarrollo. Este contenido ofrece una visión detallada ir por paso, desde la elección del Language Model hasta la estructuración de un sistema de respuesta.

¿Cuál es el punto de partida para interactuar con el modelo?

El proceso inicia con la formulación de una entrada, que es básicamente la pregunta del usuario o la forma en que desea interactuar con el modelo. Para enriquecer este intercambio, se contextualiza la entrada proporcionando información previa.

Modelo de Lenguaje: Seleccionamos un modelo de lenguaje apropiado, ya sea de pago u open source.
Consulta Contextualizada: Vamos a buscar en un espacio vectorial lleno de documentación pre-cargada.
Historial de Chat: Cualquier interacción con el chatbot se guarda en el historial, garantizando una mejora continua del flujo de información.
Respuesta Personalizada: Definimos un prompt personalizado que proporciona identidad y rol al chatbot para guiar su respuesta.

¿Cómo utilizar archivos PDF en el proyecto?

Uno de los elementos cruciales es la carga de información desde archivos, y en este caso, utilizamos PDFs. Con los pasos correctos, podemos manejar diferentes tipos de documentos para sacar provecho de su contenido.

Preparación de Archivos: En este punto, intentamos con cuatro PDFs de temas diversos: un recetario de comida saludable, un documento sobre inteligencia artificial en medicina, un análisis de ventas y una guía de viaje a París.
Transformación: Podemos trabajar con CSV, HTML, o incluso Markdown si preferimos esos formatos.
Cargadores y Librerías: Utilizamos un cargador específico para los PDFs y nos apoyamos en librerías como PyPDF para gestionar los datos.

from langchain.document_loaders import PyPDFLoader

directory_path = "/ruta/al/directorio"
loader = PyPDFLoader(directory_path, file_extension=".pdf")
documents = loader.load()

¿Cómo manejar y dividir la información?

A medida que manejamos documentos más extensos, es fundamental dividir esta información en fragmentos o chunks para una mejor vectorización.

División Textual: Usamos text_splitter para manejar documentos cortos, especificando tamaños y solapamiento.
Acceso a Datos: La información se divide también para organizar metadatos acerca de la ubicación exacta dentro del PDF.

from langchain.text_splitters import CharacterTextSplitter

splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=20)
fragmentos_divididos = splitter.split(documents)

¿Qué se debe considerar al utilizar un espacio vectorial?

Una vez que toda la información está bien segmentada, se transfiere a un espacio vectorial, ChromaDB en este caso, para vincular cada fragmento a un vector en particular.

Elegir el VectorStore: Integramos ChromaDB con Langchain para gestionar el almacenamiento y recuperación de datos.
Vectorización y Embeddings: OpenAI Embeddings sirve para transformar datos en vectores que se almacenan en el espacio asignado.

from langchain.vector_stores import Chroma
from openai import OpenAIKey
from langchain.embeddings import OpenAIEmbeddings

embedding = OpenAIEmbeddings()
vector_store = Chroma.from_documents(fragmentos_divididos, embedding)
retriever = vector_store.as_retriever()

¿Cómo se crea el Prompt y se configura el Modelo de Language?

El rol y el comportamiento del chatbot son definidos a través de un prompt específico. Este paso es esencial para moldear la interacción del usuario con el sistema.

Definir el Rol: El Prompt Template establece el comportamiento del modelo. En este caso, configuramos el sistema para que funcione como un asistente informado sobre múltiples PDFs.
Contexto y Respuesta: El contexto asociado se adquiere desde vectores cercanos a la consulta del usuario, garantizando respuestas coherentes.

system_prompt = """
Eres un asistente que devuelve información de múltiples PDFs.
Incluye emojis en cada respuesta para mejorar la interacción.
Aquí tienes el contexto: {contexto}
"""

model = ChatOpenAI(model_name="gpt-4.0", temperature=0.7, max_tokens=150)

Integrar todos estos elementos da como resultado una configuración robusta que no solo responde a las preguntas, sino que las contextualiza de manera que imita una interacción más natural y útil con el usuario. Es un proceso que eleva el estándar en el diseño de chatbots modernos.