Estructura y Uso de Langchain en Python

Clase 2 de 37 • Curso de LangChain

Contenido del curso

Introducción a LangChain

Casos de uso de LangChain

Manejo de documentos con índices

Embeddings y bases de datos vectoriales

Chats y memoria con LangChain

Evolución del uso de LLM

37
Creación de Chatbots con Modelos de Lenguaje y Bases de Datos Vectoriales
05:27 min

Tomar examen

Resumen

Langchain organiza todo el flujo de trabajo con modelos de lenguaje en tres pilares fundamentales: conectar con modelos, conectar con datos y encadenar ambos procesos para generar respuestas útiles. Conocer esta estructura es el primer paso para construir aplicaciones como chatbots, asistentes personales o sistemas de preguntas y respuestas sobre documentos.

¿Cómo se estructura una cadena en Langchain?

Una cadena (chain) en Langchain representa el recorrido completo que siguen los datos hasta convertirse en una respuesta. El flujo típico funciona así [0:22]:

Se parte de datos en bruto.
Se convierten en representaciones numéricas mediante un embedding.
Se almacenan en una base de datos vectorial (vector store).
Se construye un prompt que combina la pregunta del usuario con el contexto relevante.
Un modelo de lenguaje largo (LLM) recibe ese prompt y genera la respuesta.

Dentro de cada cadena existen pasos opcionales que permiten personalizar el proceso. En la fase de datos, por ejemplo, es posible limpiar la información, generar resúmenes para reducir su extensión, seleccionar variables relevantes, guardarlas como metadata y fragmentar los textos antes de pasarlos por el embedding [1:01].

¿Qué procesos opcionales enriquecen la interacción con un LLM?

Al interactuar con el modelo, también se pueden agregar capas adicionales [1:24]:

Incorporar una memoria para ampliar el contexto de la conversación.
Seleccionar y filtrar otra base de datos vectorial usando la metadata.
Solicitar información específica del usuario dentro del prompt.

Todos estos elementos se combinan en el formato final del prompt que alimenta al LLM. La flexibilidad de Langchain radica en que cada uno de estos pasos es opcional: se agregan o se omiten según las necesidades del proyecto.

¿Dónde encontrar información sobre Langchain?

Existen cuatro fuentes principales para aprender y resolver dudas sobre este framework [1:49]:

Repositorio de GitHub: es la fuente más importante cuando se trabaja con un proyecto que evoluciona rápidamente. Permite buscar cómo funcionan aspectos que quizás aún no están documentados formalmente.
Documentación oficial: ofrece una vista central donde se elige entre la versión de Python o JavaScript. Aquí se definen los componentes raíz de Langchain: esquemas, modelos, prompts, índices, memoria, cadenas y agentes [2:22].
Chatbot integrado en la documentación: permite hacer preguntas directamente, como "¿cómo puedo usar una cadena?", y recibir respuestas paso a paso. Este chatbot es, en sí mismo, un ejemplo de lo que se puede construir con Langchain [3:07].
Página de integraciones (integrations.langchain.com): muestra todos los document loaders, vector stores, modelos de embedding, modelos de chat y LLMs ya integrados [3:27].

¿Qué casos de uso se pueden implementar?

La documentación destaca varios escenarios prácticos [2:40]:

Asistentes personales.
Resolución de preguntas sobre documentos.
Chatbots conversacionales.
Preguntas sobre datos tabulares, como archivos CSV.
Interacción con APIs externas.
Extracción y evaluación de información.
Creación de resúmenes automáticos.

Estos son solo algunos ejemplos; las posibilidades van más allá de lo que aparece listado.

¿Cómo explorar los modelos integrados en Langchain?

Un ejercicio valioso consiste en buscar qué modelos están disponibles usando las cuatro vías mencionadas: el repositorio de GitHub, la documentación de Python, el chatbot y la página de integraciones [3:52]. Cada fuente ofrece una experiencia distinta en velocidad, profundidad y formato de la información.

Si quieres usar, por ejemplo, un modelo de chat de OpenAI, basta con buscarlo en la página de integraciones, revisar la descripción y seguir las instrucciones de implementación [3:40].

¿Cuál de las cuatro formas te resultó más práctica para encontrar información? Comparte tu experiencia en los comentarios.

Comentarios

juan.alcaraz

student•

Flujo para generar una respuesta con LangChain

Primero comenzamos con datos
Luego se convierten en numero con embebbing
Luego se guardan en una base de datos vectorial
A partir del guardado se crea un prompt para empezar a hacer preguntas
La pregunta al humano se combina con el promp y lo recibe un modelo de LLM (Large Lenguaje Model)
Esto ultimo es la que genera la respuesta.

Sin embargo hay procesos que pueden o no ocurrir. Por ejemplo para el procesamiento de datos se pueden limpiar, generar resumenes, seleccionar metada especifica y posteriormente fragmentarlo para enviarlo al modelo de embebbing.

Patricio Sánchez Fernández

student•

Buen aporte, Juan Manuel.

Pepe Sosa

student•

Todavía no entiendo muy bien qué estoy haciendo/aprendiendo, desde la primera clase sentí que nos fuimos directo a la acción sin haber definido por ejemplo que LangChain es un framework (yo creía que era una librería).

Pero para responder al reto, se me hizo más fácil la página de integraciones, está todo ahí separado por categoría y un poco más claro, además de que cada integración que visité tenía información extra (aunque algún repo ya no existe).

Gabriel Ichcanziho Pérez Landa

student•

Claro, el objetivo es venderte lo que se puede hacer y después vamos a partir con un entendimiento de lo que hacemos. Es normal sentirse abrumando con tantas cosas, pero me parece interesante partir por la aplicabilidad y luego regresar al entendimineto del tema.

Si lo hicieramos al revés podría sentirse que no sabemos para que aprendemos tanta teoría y qué utilidad tiene, aquí es más bien lo contrario. Vemos la utilidad y luego entendemos el funcionamiento.

Bueno o malo, no lo sé, pero es cuestión de sacar las ventajas.

Vicki Esther Avola

student•

A mí me parece una buena estrategia que nos muestren primero para qué podemos usar todo lo que vamos a aprender, esto me permite saber si en realidad me sirve o no seguir el curso.

Gabriel Jaime Cardona Osorio

student•

Sí hablamos de modelos de chat, tiene integrados 6: 2 de OpenAI, Jina, Anthropic, Azure, PaLM (de Google), VertexAI y MLflow, pero también tiene integración con más de 50 modelos LLM's.

Juan R. Vergara M.

student•

Excelente 🤖

Carlos Arturo Gonzalez Meyberg

student•

Esta interesante sus múltiples usos, el uso del prompt tipo asistente es genial

Ignacio Robles

student•

La mas fácil para mi fue la última. Eso si, no encontré un listado de lo modelos específicos, algo que cuesta encontrar en la mayoría de los casos.

FELIX HERRERA MUÑIZ

student•

me parece muy bueno el curso, pero estan usando python, no habra el curso pero con JS?

Platzi

student•

En este curso vamos a verlo en Python.

Alfonso José Chavarro Cortes

student•

Los vectores densos de alta dimensión son representaciones numéricas donde cada dimensión contiene un valor que describe características de un objeto, como palabras o imágenes. En procesamiento de lenguaje natural, estos vectores transforman datos textuales en un formato que modelos como LLM pueden entender. Son útiles porque permiten capturar similitudes semánticas entre los datos, facilitando tareas como la búsqueda y la clasificación. En LangChain, se utilizan embeddings para almacenar y procesar estos vectores en bases de datos vectoriales.

Jhonatan Fernando Figueroa Antonio

student•

Buena tarde, soy muy nuevo aqui y aun desconozco muchas cosas, pretendo desarrollar un chatbot para la empresa en la que me encuentro, me gustaria saber si esto se puede integrar tambien en Whats App? Gracias de antemano :)

eduardo fletes

student•

Sí existe la manera de hacerlo con LangChain, aunque también existe una tecnología low code por si quieres explorarla, se llama n8n. Los dos podrían funcionar bien.

Estructura y Uso de Langchain en Python

Introducción a LangChain

Creación de un sistema de preguntas y respuestas con LangChain