Implementación de MultiQuery Retrievers con LangChain y Pydantic

Clase 11 de 17 • Curso de LangChain para Manejo y Recuperación de Documentos

Contenido del curso

Manejo de documentos

Indexación de vectores

Recuperación de documentos

Re-ranking semántico

RAG

Tomar examen

Resumen

¿Qué es un MultiQuery Retriever?

Un MultiQuery Retriever es una técnica avanzada utilizada para mejorar la precisión en la recuperación de documentos relevantes en un sistema de búsqueda. Funciona generando múltiples preguntas a partir de una inicial, lo cual permite abordar las consultas desde distintos ángulos y captar un contexto más amplio. Este método es similar al proceso humano de reformular preguntas para lograr una mejor comprensión y obtener respuestas más precisas.

¿Cómo funciona el MultiQuery Retriever?

El proceso comienza con el envío de una consulta inicial, que es procesada por un modelo de lenguaje como OpenAI. Este modelo genera varias nuevas preguntas relacionadas con la original. A partir de estas preguntas, el sistema busca en un VectorStore los documentos que mejor coincidan con cada consulta generada. Finalmente, los documentos relevantes se combinan en un conjunto completo que proporciona una respuesta más detallada y contextualizada a la pregunta original del usuario.

Importación y configuración

Para implementar un MultiQuery Retriever, debes importar el módulo correspondiente. Necesitarás también un VectorStore y un sistema de embeddings, además de un modelo de lenguaje (LLM). Aquí te mostramos cómo hacerlo:

from langchain.retrievers.multiquery import MultiQueryRetriever

# Configurar el VectorStore y el modelo de lenguaje
model = chatOpenAI(temperature=0)  # Ajustando la temperatura para obtener respuestas consistentes
retriever = MultiQueryRetriever(model, vectorStore)

Creación de un Retriever

Una vez configurado el entorno, se crea un retriever básico utilizando una VectorStore convertida mediante el método asRetriever. El modelo de lenguaje genera las preguntas y el retriever las utiliza para obtener los documentos relevantes.

Personalización de la generación de preguntas

Para personalizar el proceso de generación de preguntas, LangChain ofrece la opción de definir un esquema de salida utilizando Pydantic. Esto se logra mediante la creación de un parser de salida:

from pydantic import BaseModel

class lineList(BaseModel):
    lines: list[str]  # Lista de preguntas generadas

class lineListsOutputParser(PydanticOutputParser):
    def parse(self, text: str) -> lineList:
        lines = text.strip().split('\n')
        return lineList(lines=lines)

Esta definición permite estructurar los datos de forma que sean iterables y fácilmente manejables dentro de la aplicación.

Construcción del prompt

Una vez definido el parser, se construye un prompt específico para guiar la generación de preguntas. Esto se engloba en una cadena de LLM:

prompt = "Generar múltiples preguntas desde una consulta inicial..."
output_parser = lineListsOutputParser()

Ejecución y obtención de resultados

Finalmente, se prueba la funcionalidad ejecutando la cadena de acciones configurada. Este método invoca el modelo de lenguaje, generando múltiples preguntas y consolidando los resultados para la consulta del usuario:

result = retriever.invoke({
    "question": "¿Cómo crear un retriever con LangChain?"
})
print(result)

Al ejecutar, el sistema devuelve un conjunto estructurado de preguntas, dando lugar a respuestas más precisas y completas. Este proceso es fundamental para aplicaciones donde la precisión y el detalle de la respuesta son cruciales.

Recomendaciones prácticas al utilizar MultiQuery Retriever

Usar temperatura baja: Configure el modelo de lenguaje con una temperatura baja para asegurar consistencia en las respuestas generadas.
Personalizar el prompt: Adapte el prompt a las necesidades específicas del caso de uso para asegurarse de que las preguntas generadas cubran todos los ángulos necesarios.
Comprobar la coherencia de las preguntas: Asegúrese de que las preguntas generadas son coherentes y relevantes para el contexto de la consulta original.
Optimizar el tiempo de respuesta: Aunque el proceso puede ser más lento debido a las consultas múltiples, encontrar un equilibrio entre la calidad de las respuestas y el tiempo de procesamiento es vital.

Incorporar estas técnicas en sistemas de búsqueda y recuperación de documentos no solo mejora la precisión de las respuestas, sino que también optimiza la experiencia del usuario al proporcionar un contexto más rico y detallado. Continúa explorando estas herramientas y perfecciona tu habilidad para ofrecer respuestas exactas y valiosas.

Comentarios

Luis Boivar

student•

siento que estoy entiendo el núcleo de la conversación humana con este curso jajajaja

gemma clavero del moral

student•

¡Jajaja, yo también estaba pensando en que todo esto es tal cual funcionamos! Es puro "Prompt Engineering de Pareja":

El hombre envía una query directa, básicamente un Retriever simple con temperature=0: 'Estoy cansado'.

Las mujeres, en lugar de eso, construimos en nuestra cabecita un MultiQueryRetriever (¡ temperature=0.9!) que toma ese prompt y, para captar más contexto lo "enriquece" automáticamente con metadata de conversaciones de hace 6 meses.

De repente, el pobre tipo se encuentra intentando depurar las 5 nuevas queries que el retriever acaba de generar, tipo '¿Cansado de mí?', '¿Es una indirecta para no lavar los platos?' y '¿Qué quisiste decir realmente con ese tono?', todas ellas buscando en un vector store de 'cosas_que_probablemente_olvidaste'.

sergio quintero

student•

Los notebooks de los recursos están incompletos, solo aparece la mitad de lo que el profesor muestra en las clases

Luis Boivar

student•

MultiQueryRetriever, es la implementación para preguntar, desde varios puntos de vista, la pregunta que nos envía el usuario.

estás "preguntas con otra perspectiva" la genera un llm con la pregunta inicial.

Implementación de MultiQuery Retrievers con LangChain y Pydantic

Manejo de documentos

Extracción y Fragmentación de Texto para IA

Extracción de Texto Contextual en HTML: Técnicas y Aplicaciones

Extracción de Texto en PDFs con Doku Gami

Fragmentación de Texto con Contexto en Documentos de Programación

Indexación de vectores

Indexación de Vectores para Optimizar Bases de Datos

Indexación Incremental y Limpieza de Vectores Duplicados

Recuperación de documentos

Recuperación y fragmentación de documentos para consultas eficaces

Fragmentación de Documentos para Modelos de Lenguaje

Etiquetado y Filtrado de Documentos con Modelos de Lenguaje

Filtrado Inteligente de Documentos con Metadatos y Modelos de Lenguaje

Implementación de MultiQuery Retrievers con LangChain y Pydantic

Combinación de Retrievers para Búsqueda de Documentos Relevantes

Re-ranking semántico

Integración de Reranking Semántico en Buscadores por Palabras Clave

Ranking por Relevancia Marginal Máxima en Documentos

Reordenamiento de Documentos en Recuperación Mejorada de Información

RAG

Implementación de Sistemas RAG para Mejora de Chatbots

Creación de Aplicación con Streamlit para Procesamiento de Documentos