Cursos Empresas Blog Live Conf Precios

Creación de un sistema de preguntas y respuestas con LangChain

Clase 1 de 37 • Curso de LangChain

Contenido del curso

Introducción a LangChain

Casos de uso de LangChain

Manejo de documentos con índices

Embeddings y bases de datos vectoriales

Chats y memoria con LangChain

Evolución del uso de LLM

37
Creación de Chatbots con Modelos de Lenguaje y Bases de Datos Vectoriales
05:27 min

Resumen

La implementación y mejora de los modelos de lenguaje es un campo en constante evolución. En ese sentido, uno de los mayores desafíos es cómo alimentar a estos modelos con la información relevante que no estuvo presente en sus datos de entrenamiento original. La plataforma Lancia emerge como una herramienta vital en este proceso al proporcionar un framework open source para crear flujos de trabajo que enriquecen al modelo con los datos necesarios. Analicemos cómo Lancia simplifica este proceso, desde la integración con bases de datos vectoriales para crear índices hasta la obtención de respuestas específicas a partir de información personalizada.

¿Qué desafíos presentan los modelos de lenguaje avanzados?

Los modelos de lenguaje en gran escala enfrentan dos retos principales. Primero, la recopilación de la información contextual necesaria para responder preguntas específicas. Y segundo, el diseño de un procedimiento que permite transitar desde los datos hasta obtener la respuesta deseada por el modelo.

¿Cómo ofrece Lancia una solución a estos retos?

Lancia propone una solución integral ofreciendo un framework que construye cadenas de procesos para nutrir al modelo de lenguaje con la información apropiada. Este sistema toma ventaja de modelos de lenguaje diversificados y los combina con herramientas como bases de datos vectoriales y la creación de índices para filtrar y proporcionar información pertinente.

¿Cómo funciona el enriquecimiento de la información en LangChain?

LangChain realiza una serie de pasos estructurados para alimentar al modelo de lenguaje:

Conversión de la pregunta del usuario en vectores numéricos mediante modelos de embedding.
Búsqueda en la base de datos vectorial para identificar los documentos relevantes a la pregunta.
Creación de resúmenes de la información recopilada utilizando otro modelo.
Uso de un tercer modelo de lenguaje para responder la pregunta con base en la información refinada.

¿Cuál es el proceso de implementación utilizando LangChain?

El proceso de implementación con LangChain comienza con la instalación de dependencias clave, como PyPDF Loader y OpenAI. Luego se procede a importar y procesar documentos recientes – por ejemplo, papers de investigaciones de 2023 – dividiéndolos en fragmentos manejables para modelos de embedding. Estos pasos se visualizan en un ejercicio práctico disponible en los recursos del curso, donde se enseña a realizar un "Hola Mundo" con LangChain.

¿Cómo se prepara el texto para alimentar el modelo de lenguaje?

Antes de convertir el texto en números para ser interpretado por los modelos, es fundamental segmentarlo en porciones adecuadas debido a las limitaciones de tamaño de los modelos de embedding. Esto se logra con herramientas específicas que dividen el texto y mantienen una continuidad conceptual entre los segmentos.

¿Cuál es la función de los embeddings y las bases de datos vectoriales?

Los embeddings transforman el texto en vectores numéricos que son almacenados en bases de datos vectoriales. Esta representación vectorial facilita la búsqueda y recuperación de segmentos de texto pertinentes cuando son cotejados con una consulta o pregunta específica.

¿Cómo se responde a preguntas con información personalizada?

LangChain puede gestionar preguntas sobre datos no conocidos previamente por el modelo de lenguaje. Utilizando todos los componentes anteriores, se puede consultar sobre temas muy recientes, como el FinGPT y obtener respuestas basadas en documentos que no estaban incluidos en el entrenamiento original del modelo.

En resumen, LangChain permite desarrollar aplicaciones que utilizan modelos de lenguaje para responder a preguntas basándose en información actualizada y no incluida en su entrenamiento inicial. A lo largo del curso, se explorarán los distintos pasos y opciones disponibles en cuanto a modelos, bases de datos vectoriales y otras herramientas complementarias. La clave está en la capacidad de ensamblar estos componentes para resolver dudas concretas y particularizadas del usuario.

Siguiendo estas pautas y explorando las posibilidades que ofrece LangChain, se abre un panorama amplio para el desarrollo de sistemas más inteligentes y adaptativos en el campo del procesamiento del lenguaje natural. La innovación constante en esta área es imprescindible, y herramientas como LangChain son fundamentales para seguir avanzando. ¡Es hora de poner en práctica estos conocimientos y descubrir todo lo que puede ofrecer esta tecnología!

Obtén respuestas inmediatasProfundiza lo que acabas de ver

Comentarios

Lionard Leyva

student•

No entendi un carajo.

Carlo Wesley Martinez Ortiz

student•

Te recomiendo el curso de fundamentos de ingenieria de software :D despues unos cursos de programación para tener un mejor contexto nwn.

Mauricio Martínez Orjuela

student•

te falta este curso que es muy "top"

Curso de Embeddings y Bases de Datos Vectoriales para NLP https://platzi.com/cursos/embeddings-nlp/

Gabriel Ichcanziho Pérez Landa

student•

Hola comunidad.

Les comparto mi código con leves modificaciones y con comentarios pertinentes.

# --- Carga de documents
import os
import requests
from dotenv import load_dotenv
from langchain.document_loaders import PyPDFLoader

# leo el archivo keys.env y obtengo mi Api KEY de OpenAI
load_dotenv("../secret/keys.env")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

# Es importante que quede seteado como una variable de entorno porque será utilizado más adelante
os.environ['OPENAI_API_KEY'] = OPENAI_API_KEY

urls = [
    'https://arxiv.org/pdf/2306.06031v1.pdf',
    'https://arxiv.org/pdf/2306.12156v1.pdf',
    'https://arxiv.org/pdf/2306.14289v1.pdf',
    'https://arxiv.org/pdf/2305.10973v1.pdf',
    'https://arxiv.org/pdf/2306.13643v1.pdf'
]

ml_papers = []

for i, url in enumerate(urls):
    filename = f'paper{i+1}.pdf'

    # Verifico si el archivo no ha sido descargado previamente
    if not os.path.exists(filename):
        response = requests.get(url)
        with open(filename, 'wb') as f:
            f.write(response.content)
        print(f'Descargado {filename}')
    else:
        print(f'{filename} ya existe, cargando desde el disco.')

    loader = PyPDFLoader(filename)
    data = loader.load()
    ml_papers.extend(data)

# Utiliza la lista ml_papers para acceder a los elementos de todos los documentos descargados
print('Contenido de ml_papers:')
print()

print(type(ml_papers), len(ml_papers), ml_papers[3])

# --- Split de documents

# Los documentos NO pueden ser procesados directamente por LLMs porque contienen demasiado texto, sin embargo, podemos
# particionarlo en conjuntos de texto más pequeños para entonces poder acceder a su información.
from langchain.text_splitter import RecursiveCharacterTextSplitter

# Cada partición contendrá 1500 palabras, y tendrán una intersección de 200, de modo que la cadena 2 comparte 200
# palabras con la cadena 1 y con la cadena 3
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1500,
    chunk_overlap=200,
    length_function=len
    )

documents = text_splitter.split_documents(ml_papers)
# Ahora podemos revisar de nuevo la cantidad de `documentos` y ver un ejemplo del mismo
print(len(documents), documents[10])

# --- Embeddings e ingesta a base de datos vectorial

from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma

# Crea un objeto capaz de convertir el texto a un vector utilizando como base el modelo de ADA-002 de OpenAI
# En este punto es importante que hayas seteado tu OPENAI API KEY como variable de entorno, para que puedas acceder
# a este servicio
embeddings = OpenAIEmbeddings(model="text-embedding-ada-002")

# Con ayuda de Chroma, creamos un objeto vectorstore para almacenar las representaciones vectoriales de los textos
# contenidos en `documents` una cadena de texto previamente generada

vectorstore = Chroma.from_documents(
    documents=documents,
    embedding=embeddings
)

# Una vez que hayas creado la Base de datos vectorial, el parámetro search_kwargs `k` me permite definir hasta cuantos
# vectores similares voy a buscar al momento de encontrar información para una pregunta. `retriever` será entonces
# nuestra base de datos de vectores que servirá para añadir información reciente a los LLMs con el fin de responder
# preguntas.
retriever = vectorstore.as_retriever(
    search_kwargs={"k": 3}
    )

# --- Modelos de Chat y cadenas para consulta de información

from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA


# Voy a crear un objeto `chat` de la clase ChatOpenAI indicando que el engine a utilizar será GPT 3.5 y cuya temperatura
# será 0 lo que signfica que tendrá respuestas muy restrictivas basadas únicamente en el texto que conoce y tendrá
# poca creatividad al momento de responder peticiones.
chat = ChatOpenAI(
    openai_api_key=OPENAI_API_KEY,
    model_name='gpt-3.5-turbo',
    temperature=0.0
)

# Finalmente, creamos una cadena `chain` del tipo `Question Answer` pregunta-respuesta. Como LLM utilizará al objeto
# `chat` que es una instancia de ChatGPT 3.5, el tipo de cadena es `stuff` que significa que vamos a utilizar tanta
# información como quepa en el prompt, y finalmente el `retriever` será la base de datos vectoriales que hemos definido
# previamente.
qa_chain = RetrievalQA.from_chain_type(
    llm=chat,
    chain_type="stuff",
    retriever=retriever
)

# Vamos a poner a prueba nuestra cadena de preguntas y respuestas:

query = "qué es fingpt?"
print(query)
print(qa_chain.run(query))

query = "qué hace complicado entrenar un modelo como el fingpt?"
print(query)
print(qa_chain.run(query))

query = "qué es fast segment?"
print(query)
print(qa_chain.run(query))

query = "cuál es la diferencia entre fast sam y mobile sam?"
print(query)
print(qa_chain.run(query))

Juan R. Vergara M.

student•

Gran aporte amigo 📝💡🥇

Jhon Alexander Bermeo Mejia

student•

Alguien por favor como haría para saber la cantidad de tokens usados en la solicitud

Carlo Wesley Martinez Ortiz

student•

Pfffff, creo que para ser el primer curso es fácil perderse, no entendia porque se hacian algunas cosas así que investigue por mi cuenta y me gustaria dejar aquí mis apuntes de la clase.

Iniciemos por explicar lo que hace el profesor:

Usamos Langchain, que es el framework open source para desarrollar aplicativos de IA basados en LLM's.
Conectamos Langchain a un LLM, para que procese nuestro prompt y nos de un resultado de vuelta.
Utilizamos una técnica llamada RAG, donde le agregamos contexto basado en documentos al LLM para que pueda dar una mejor respuesta.

Ahora un par de cosas a explicar a manera de glosario que a mi personalmente me tomo un poco agarrar.

Entorno de trabajo: El profesor esta usando google colab. Un entorno que le permite disponer de un ordenador potente sin necesidad de tenerlo. En el esta ejecutando comandos de terminal (como la instalación de librerias) y ejecutar código python (el cual podemos escribir en archivos en caso de que dispongamos de un entorno local).
Langchain openai API: langchain puede conectarse a distintos tipos de LLM's, puedes encontrar la documentación técnica y conectarlo a cualquier modelo que requieras, incluso a modelos locales en caso de que dispongas de ellos.
Embeddings o vectorizar: Esta parte es amplia... Nosotros tenemos estos documentos con información especifica como por ejemplo la historia de las medusas. Lo que hacemos al vectorizar es procesar estos documentos para conseguir sintetizar su información en conceptos, de manera que al recibir un promp que menciona a las medusas o pregunta algo referente a ellas, Langchain puede identificar en que documento se menciona a nivel de concepto información relevante para la consulta. Añade esta información vectorizada al prompt y lo envia al LLM para que este pueda generar una respuesta más contextualizada o enriquecida con información que el modelo originalmente no tiene.
RAG: Básicamente es la técnica que utilizamos, vectorizamos información personalizada (documentos) para mejorar o ampliar el contexto de un LLM y así conseguir mejores respuestas.

Espero ayudar a alguien con mi pequeño aporte.

Emmanuel Rodríguez

student•

Primer video del curso, y ya llovieron golpes de todos lados 😅

Hugo Montoya Diaz

student•

Majestuoso este curso e iniciando con todo

Santiago J. Vasconcello Acuña

student•

Extremadamente útil considerando que Llama 2 acaba de salir esta semana. Así que obligado a probarlo con llama2

Andrés Cardona

student•

A despatar una habilidad nueva en la Vida!!

Roberto Eliezer Prince Elorza

student•

Me hizo sufrir ya que es una version ya antigua de langchain y la api ha cambiado bastante. Tambien conviene utilizar openai aunque sea un solo para tomar el curso. Yo utilizo OpenRouter para todo y en este caso genera friccion aunque no sea imposible. Deberian aclarar que version langchain se utilizo para acelerar las cosas. Saludos y abrazos

Pedro Jesus Hincapie Garcia

student••

En caso de presentar problema en la carga de documento:

Remplazar:

from langchain.document_loaders import PyPDFLoader

Por este:

from langchain_community.document_loaders import PyPDFLoader

Ten presente, que debes incluir en pip install

Marcel Solera

student•

Un embedding es una representación vectorial de datos que permite convertir información, como texto o imágenes, en una forma que los modelos de machine learning pueden procesar. En el contexto de LangChain, los embeddings se utilizan para transformar preguntas y documentos en vectores, facilitando la búsqueda de información relevante en bases de datos vectoriales. Esto es esencial para crear chatbots inteligentes que puedan responder a consultas basadas en datos que no estaban disponibles en su entrenamiento original.

Juan R. Vergara M.

student•

Wow este curso empieza directo en la acción 🔥

JESÚS RENE OLAVE LASSO

student•

Excelente

Javier Velázquez

student•

Buen inicio de curso, grandes expectativas...

Juan R. Vergara M.

student•

Así es, no había visto ningún curso aquí que empezara directo en la acción 🧨🤯

Carlos G

student•

Tremendo inicio del curso, grandes expectativas, buen contenido.

Edwar Diaz

student•

entiendo lo que sucede en la clase. y nice la introducción. pero luego de ello iniciar con todo un notebook implementando langchain en la primera clase me párese algo pesado. entiendo que con eso se pueden ver las capacidades pero igual considero que es mejor entender la estructura antes de ver la aplicación

Guillermo Castaño Vèlez

student•

No me molesta ir al grano inmediatamente sin tanto bla bla.. pero en este caso si me faltó mucho contexto!

Zink lar

student•

sigue estando actualizado para que sirva hoy dia?

Zink lar

student•

sigue estando actualizado a día de hoy para que sirva de aprendizaje?

Leonar Santiago Castro Vizcaya

student•

WARNING:langchain.embeddings.openai:Retrying langchain.embeddings.openai.embed_with_retry.<locals>._embed_with_retry in 4.0 seconds as it raised RateLimitError: You exceeded your current quota, please check your plan and billing details.. Alguna recomendación?

Gabriel Andrés Alzate Acuña

student•

Puedes hacerlo con una alternativa libre como llama

Edwin Sergio Nizama Fernández

student•

EmptyFileError Traceback (most recent call last) <ipython-input-4-342d7f8a39fa> in <cell line: 14>() 20 21 loader = PyPDFLoader(filename) ---> 22 data = loader.load() 23 ml_papers.extend(data) Me aparece este error al correr

Pepe Sosa

student•

Te faltan los PDF's no? O están vacíos, eso dice el error.

Mauricio Martínez Orjuela

student•

13:08 Tuve problemas con Chromadb y lo solucioné con

Solución

Sigue estos pasos para resolver el problema:

1. Instalar Microsoft C++ Build Tools

Este es un requisito para compilar ciertas bibliotecas de Python en Windows.

Ve al siguiente enlace para descargar los Build Tools: Microsoft C++ Build Tools
Descarga e instala los Build Tools. Durante la instalación:
- Selecciona la opción "Desarrollo para escritorio con C++".
- Asegúrate de incluir las herramientas de compilación necesarias, como:
  - MSVC (Microsoft Visual C++)
  - CMake Tools para Windows
  - SDK de Windows
Una vez instalado, reinicia tu terminal.

2. Actualizar pip, setuptools y wheel

Antes de intentar instalar nuevamente, actualiza las herramientas relacionadas con la construcción de paquetes de Python:

pip install --upgrade pip setuptools wheel

3. Instalar nuevamente el paquete

Intenta instalar nuevamente chromadb:

pip install chromadb
```Esto debería compilar y construir las dependencias necesarias, incluyendo **chroma-hnswlib**.



#### **4. Verificar la instalación**

Para confirmar que todo se instaló correctamente, ejecuta:

```js
pip show chromadb
```Deberías ver información sobre el paquete, como su versión y ubicación.

Mauricio Martínez Orjuela

student•

me disculparán, me quedó feo al final pero como no se puede editar, así quedó.

Jose Luis Alcocer Caceres

student•

Es interesante que los archivos pdf están en inglés y aún así la chain responde en español. Digo curioso porque al hacer los embeddings en la base de datos vectorial están en inglés los chunks, y la pregunta se hace en español, y dicha pregunta en español se convierte a embedding para hacer búsqueda por similaridad a los textos guardados previamente en inglés. Me hace pensar que los embeddings de text-embedding-ada-002 de OpenAI son entrenados en múltiples lenguajes y extraen el contexto y contenido semántico de las palabras sin importar el lenguaje

Javier Reina

student•

Cuando yo subo información privada al modelo, el modelo guarda esta información o estos documentos en PDF siguen siendo privados?