Integración de Herramientas Claves en LangChain: Runnable, OutputParser, Streaming

Clase 12 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Construir agentes inteligentes que procesen datos de forma rápida y organizada requiere dominar cómo encadenar tareas, estructurar respuestas y mostrar resultados en tiempo real. Tres componentes de LangChain hacen esto posible: Runnable, Output Parser y Streaming. Comprender su integración te permitirá crear chatbots avanzados y escalables que manejan grandes volúmenes de información.

¿Qué es Runnable y cómo encadena tareas en LangChain?

Un Runnable es una unidad de trabajo que puede invocarse, transformarse y ejecutarse en secuencia o en paralelo [00:08]. En la práctica, funciona como una pieza de una cadena donde la salida de un paso se convierte en la entrada del siguiente.

Para comenzar, se instala el paquete principal con pip install langchain y se importan los módulos necesarios desde langchain_core:

python from langchain_core.runnables import RunnableLambda

El componente RunnableLambda permite envolver funciones lambda dentro de la cadena [01:12]. En LangChain Expression Language (LCEL), el símbolo pipe (|) conecta cada paso de la secuencia:

python sequence = RunnableLambda(lambda x: x + 1) | RunnableLambda(lambda x: x * 2) sequence.invoke(10)

Resultado: 22

El primer lambda recibe 10, suma 1 y produce 11.
El segundo lambda toma 11, multiplica por 2 y devuelve 22.

¿Cómo guardar resultados intermedios con diccionarios?

Cuando necesitas conservar valores de pasos anteriores, puedes usar diccionarios dentro de la cadena [02:42]. Cada clave almacena el resultado de un proceso distinto:

python sequence = RunnableLambda(lambda x: x + 1) | { "index_1": RunnableLambda(lambda x: x), "index_2": RunnableLambda(lambda x: x * 5) } sequence.invoke(10)

{'index_1': 11, 'index_2': 55}

De esta forma, cada resultado queda accesible por su clave, lo que facilita la reutilización de datos dentro de flujos más complejos.

¿Cómo obtener respuestas en formato JSON con Output Parser?

Hasta ahora los resultados han sido strings o números simples. Sin embargo, en aplicaciones reales se necesitan formatos estructurados como JSON [03:31]. El JsonOutputParser transforma la salida del modelo en un objeto JSON válido.

Primero se importan los componentes necesarios:

python from langchain_core.output_parsers import JsonOutputParser from langchain_core.prompts import PromptTemplate from langchain_openai import ChatOpenAI

Después se crea el modelo, el parser y el PromptTemplate [04:10]. Este último define el rol del modelo, cómo recibe la entrada del usuario y el formato de salida esperado:

python modelo = ChatOpenAI() parser = JsonOutputParser()

prompt = PromptTemplate( template="Answer the user query.\n{format_instructions}\n{query}", input_variables=["query"], partial_variables={"format_instructions": parser.get_format_instructions()} )

¿Cómo se construye la cadena completa?

Se encadenan los tres elementos con el operador pipe: prompt, modelo y parser [06:08].

python chain = prompt | modelo | parser response = chain.invoke({"query": joke_query})

El resultado es un diccionario con estructura JSON, no un texto plano. Esto es fundamental para integrar las respuestas en APIs o bases de datos.

¿Qué es Streaming y por qué mejora la experiencia del usuario?

Los modelos tardan en generar respuestas completas. La técnica de Streaming permite visualizar la construcción de la respuesta token por token, similar a como funciona ChatGPT [07:05].

Para implementarlo de forma síncrona se usa el método .stream() junto con la librería time:

python import time

s = chain.stream({"query": joke_query}) for chunk in s: print(chunk, end="", flush=True) time.sleep(0.3)

También existe la versión asíncrona con .astream() [08:00], que genera chunks progresivamente:

python chunks = [] async for chunk in chain.astream({"query": joke_query}): chunks.append(chunk) print(chunk, end="", flush=True) await asyncio.sleep(0.3)

Cada chunk representa un fragmento parcial de la respuesta.
El parámetro flush=True fuerza la impresión inmediata en pantalla.
El intervalo de 0.3 segundos simula la generación progresiva.

Esta combinación de Runnable para orquestar flujos, Output Parser para estructurar datos y Streaming para entregar resultados en tiempo real forma la base para construir agentes conversacionales robustos. Ahora es tu turno: integra estos tres componentes para generar una conversación completa con un usuario y comparte tu solución en los comentarios.

Comentarios

Juan Pablo Paillet

student•

Runnable:
- Ejecuta tareas de manera secuencial o en paralelo.
- Permite organizar el flujo de trabajo de procesos conectados que se invocan uno tras otro o en paralelo para mejorar la eficiencia.
- Ejemplo: Sumar 1 a un valor y luego multiplicar por 2, pasando el resultado de una tarea a la siguiente.
Output Parser:
- Convierte las respuestas del modelo en datos estructurados, como JSON o texto organizado, lo que es útil para obtener datos claros y procesables.
- Facilita la interpretación y almacenamiento de los resultados generados por el modelo.
Streaming:
- Permite ver las respuestas de manera progresiva en tiempo real.
- Ideal para reducir la espera del usuario y mejorar la experiencia interactiva, como ocurre en los sistemas de generación de texto en tiempo real como GPT.
Langchain Tools:
- Integra las tres herramientas clave (Runnable, Output Parser y Streaming) para construir agentes más eficientes y escalables que puedan procesar grandes volúmenes de datos y generar respuestas rápidas y estructuradas.

Fabián Rodriguez Peña

student•

Explicas el astream pero no explicas para que sirve cada uno de sus parámetros. Se quedan por fuera muchas dudas.

Cesar Augusto Vega Lizarazo

student•

Existe conflicto entre vrsiones de openai y langchain, realice tres pruebas pero la mejor fue con la ultma version: Name: openai, Version: 1.51.2 y Name: langchain Version: 0.3.3.

#import os
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage

# Configura tu API key de OpenAI
#os.environ["OPENAI_API_KEY"] = "tu-api-key-aquí"

# Inicializa el modelo de chat
#chat = ChatOpenAI(model_name="gpt-3.5-turbo-16k", temperature=0.7)
chat = ChatOpenAI(temperature=0.7)

# Define el prompt del sistema
system_prompt = SystemMessage(content="""Eres un asistente amigable y útil. 
Tu tarea es mantener una conversación agradable y proporcionar información útil al usuario.
Sé amable, paciente y siempre dispuesto a ayudar.""")

# Crea un prompt de chat que incluye el historial de la conversación
prompt = ChatPromptTemplate.from_messages([
    system_prompt,
    MessagesPlaceholder(variable_name="chat_history"),
    ("human", "{input}")
])

# Inicializa el historial de chat
chat_history = []

print("¡Hola! Soy tu asistente virtual. ¿En qué puedo ayudarte hoy? (Escribe 'salir' para terminar)")

while True:
    # Obtén la entrada del usuario
    user_input = input("Tú: ")
    
    # Verifica si el usuario quiere salir
    if user_input.lower() == 'salir':
        print("Asistente: ¡Hasta luego! Fue un placer ayudarte.")
        break
    
    # Genera la respuesta usando el modelo de chat
    messages = prompt.format_messages(
        chat_history=chat_history,
        input=user_input
    )
    response = chat.invoke(messages)
    
    # Imprime la respuesta del asistente
    print("Asistente:", response.content)
    
    # Actualiza el historial de chat
    chat_history.append(HumanMessage(content=user_input))
    chat_history.append(AIMessage(content=response.content))
    
    # Limita el historial de chat a las últimas 5 interacciones para evitar tokens excesivos
    if len(chat_history) > 10:
        chat_history = chat_history[-10:]
```![]()![]()![](file:///F:/Cursos/2024/Agentes%20IA/Demo_Chat_Converssacional3.png)

Angel Almazan

student•

Hello there! Estás usando un ambiente virtual? te recomiendo usar poetry

Ismael Omar Leonidas Hurtado Vargas

student•

Como dice el compañero poetry ayuda mucho

Julio Bastidas

student•

Se explico en esta clase los Runnables, cadena y output parser pero los ejercicios fueron totalmente aislados uno del otro, siendo asi debieron dividir esta clase en 3 clases separadas, o hacer un solo ejercicio donde se mezcle las 3 cosas, un poco desorganizada esta clase

Adrián Soto Girón

student•

En general creo qeu el curso esta desorganizado, siento que los contenidos van sin una secuencia clara u objetivo

Juan David Acosta González

student•

LangChain permite desarrollar agentes conversacionales integrando herramientas como Runnable, OutputParser y Streaming.

Runnable: Encadena y ejecuta tareas en secuencia o paralelo.
OutputParser: Convierte las salidas del modelo en datos estructurados (ej. JSON).
Streaming: Ofrece resultados en tiempo real, mejorando la experiencia del usuario.

Además, trabajamos con modelos como OpenAI, creando plantillas de prompts y gestionando memoria conversacional. La integración de estas herramientas permite construir chatbots avanzados y eficientes, optimizando el procesamiento de datos.

Andres Ricardo Martinez Diaz

student•

Me queda la duda de ¿Cómo se debe hacer un streaming de un JSON structured output, o no se si dependa del modelo, probé con algunos pero es como que no me devuelve completo sino hasta el ultimo chunk. quiero decir: Normal stream:


Hola

Soy

un

mensaje

Con Json Structured Output


{ 'msg': 'Hola'}

{ 'msg': 'Hola Soy'}

{ 'msg': 'Hola Soy un'}

{ 'msg': 'Hola Soy un mensaje'}

Es como si tocara mostrar el chunk en el que va y borrar los anteriores cuando viene en formato JSON.

No se si alguien me pueda responder cono sería la forma correcta de hacer stream de este tipo de respuestas o si es propio del modelo?

edgardo ponce

student•

Lo vi dos veces al video pero la verdad no entiendo el objetivo, voy a tener que consultar a mi amigo chatGPT

Alberto Cruz

student•

La profesora usa primero un chain que contiene promot | model | parser, pero para mostrar el streaming usa el model directamente, no el chain. Cómo puedo hacer streaming usando un chain?

Jonathan Javier Veas Realpe

student•

Y todo esto como se puede plasmar en algo como whatsapp o otra red social para dar una respuesta ?

Carli Code

teacher•

La respuesta está en el -> backend

Julio Bastidas

student•

la respuesta de la profesora no deberia de ser el donde sino el como, no me parecio adecuado su respuesta.

Johnatan Steven Barrero Muñetones

student•

Creo que cuando se habla de langchain entender que una cadena es no muy facil de digerir, pero yo lo veo como una serie de herramientas las cuales dan orden a las mil cosas que se pueden hacer con Ai pero esas herramientas permiten que a travez de una serie de pasos uno tras otro entrelazados (chains) para llegar a un objetivo.

Yulieth Angélica Vega Araujo

student•

import nest_asyncio
import asyncio
import time
from langchain.memory import ConversationBufferMemory
from langchain_openai import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain_core.output_parsers import JsonOutputParser

nest_asyncio.apply()

memory = ConversationBufferMemory()
model = ChatOpenAI(model="gpt-4o", streaming=True)
parser = JsonOutputParser()

prompt = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente conversacional que recuerda el historial del usuario y responde en JSON."),
    ("human", "{history}\nUsuario: {query}")
])

chain = prompt | model | parser

async def chat():
    print("\n🤖 ChatBot en vivo (escribe 'salir' para terminar)\n")
    
    while True:
        user_input = input("Tú: ")
        if user_input.lower() == "salir":
            print("\n🤖 ChatBot: ¡Hasta luego! 👋")
            break

        history = memory.load_memory_variables({}).get("history", "")

        query_with_history = f"{history}\nUsuario: {user_input}"  # ✅ Convertir a string

        print("🤖 ChatBot: ", end="", flush=True)
        
        response_text = ""
        async for chunk in model.astream(query_with_history):  # ✅ Ahora enviamos un string
            print(chunk.content, end="", flush=True)
            response_text += chunk.content  
            time.sleep(0.1)

        print("\n")
        
        memory.save_context({"query": user_input}, {"response": response_text})  # ✅ Guardamos historial

await chat()

Eduardo Guzmán

student•

siento que el tema es manejar todas estas funciones de manera eficiente para que no consuman tantos tokens. o usar un llm open source como llama

Guillermo Baldán López

student•

La integración de cadenas en contextos de frameworks o bibliotecas de procesamiento de lenguaje natural, como LangChain, se refiere a la construcción y ejecución de flujos de trabajo mediante la concatenación de tareas o pasos que se ejecutan secuencialmente. En LangChain, este concepto se utiliza para orquestar varias acciones que manipulan el texto o las consultas a medida que se procesan en la cadena. Aquí entran en juego componentes como Runnable y OutputParser.

Integración de Herramientas Claves en LangChain: Runnable, OutputParser, Streaming

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain

Creación de Agentes Inteligentes con LangChain

Instalación y uso de API Keys para modelos de lenguaje en Google Collab

Chat Models y Prompt templates

Chat Messages con OpenAI

Conexión y uso de modelos de chat con LangChain y OpenAI

Uso de Modelos de Google AI Gemini en LangChain

Creación de Plantillas de Prompts en LangChain

Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Cadenas en LangChain

Creación de Cadenas en LangChain con String Output Parser

Gestión de Historial de Chat con LangChain