Cómo usar modelos OpenAI con LangChain

Curso de LangChain

Contenido del curso

Introducción a LangChain

Casos de uso de LangChain

Manejo de documentos con índices

Embeddings y bases de datos vectoriales

Chats y memoria con LangChain

Evolución del uso de LLM

37
Ecosistema LLM y qué sigue después de LangChain
05:26 min

Tomar examen

Cómo usar modelos OpenAI con LangChain

Resumen

Integrar modelos de OpenAI con LangChain te permite generar texto, comparar respuestas y controlar costos en pocas líneas de código. Aquí aprendes a configurar tu API key, instanciar modelos como gpt-3.5-turbo o text-davinci-003, y medir tokens para optimizar el gasto.

Cómo configuro mi API key de OpenAI en LangChain

Antes de instanciar cualquier modelo, necesitas dos instalaciones: openai y langchain. Después, busca tu API key en la plataforma para desarrolladores de OpenAI.

Tienes dos caminos para usarla: pegarla directamente en tu notebook de Colab o guardarla como variable de entorno en tu máquina. La segunda opción es la recomendada porque LangChain la carga de forma automática y evitas exponerla cada vez que ejecutas tu código.

¿Dónde encuentro mi OpenAI API key? En la plataforma de OpenAI para desarrolladores, dentro de la sección de API keys de tu cuenta. Una vez generada, guárdala como variable de ambiente para que LangChain la detecte sola.

Cómo cargo un modelo gpt-3.5 con la clase OpenAI de LangChain

La clase OpenAI vive dentro del módulo de LLMs de LangChain. Al importarla, puedes crear un objeto que represente tu modelo y pasarle argumentos para personalizar su comportamiento.

Los parámetros más importantes que configuras al instanciar son:

model_name: define qué modelo usas, por ejemplo gpt-3.5-turbo o un davinci.
n: número de respuestas distintas que el modelo retorna por prompt. El valor por defecto es 1.
temperature: controla qué tan creativo o predecible es el modelo. Un valor como 0.3 mantiene respuestas más conservadoras.

Cómo llamo al modelo y obtengo una respuesta

Una vez creado tu objeto llm_gpt3_5, llamarlo es directo: le pasas el prompt como argumento de texto y esperas el resultado. Por ejemplo, al preguntarle cómo puedo lograr una clase más interactiva para estudiantes virtuales, el modelo responde en español con sugerencias coherentes.

No todos los modelos manejan español con la misma calidad, pero gpt-3.5-turbo lo hace bien. Si trabajas con audiencia hispanohablante, este detalle importa.

Cómo proceso varios prompts a la vez con generate

Cuando necesitas correr múltiples prompts en paralelo, el método generate recibe una lista y devuelve todas las generaciones juntas. Aquí entra otro modelo útil: text-davinci-003, que importas igual desde la clase OpenAI.

Un ejemplo práctico: instancias llm_davinci con n=2 y temperature=0.3, y le pasas dos prompts en una lista, como pedir un consejo de vida y recomendaciones de libros similares a Hyperion Cantos. El modelo procesa ambos y devuelve dos respuestas por cada uno.

El objeto resultante trae mucha información, pero el atributo generations te da acceso limpio a cada salida. Así puedes leer, por ejemplo, una recomendación específica como Olimpos de Dan Simmons o The Forever War de Joe Haldeman.

¿Qué hace el parámetro n en LangChain? Define cuántas respuestas distintas genera el modelo para un mismo prompt. Si pones n=2, recibes dos variaciones por cada entrada que envíes.

Cómo cuento tokens para controlar el costo en OpenAI

Cada prompt y cada respuesta consumen tokens, y los tokens se cobran. LangChain expone esa información en el atributo llm_output de tus generaciones, donde ves cuántos tokens usó el prompt, cuántos la respuesta y el total.

En el ejemplo del transcript, un prompt de 32 tokens generó una respuesta de 383, para un total de 415 tokens facturados con davinci-003.

Cómo uso tiktoken para medir antes de enviar

Para anticipar el costo antes de llamar al modelo, instala tiktoken, el paquete open source de OpenAI que tokeniza texto. Es la misma lógica que corre debajo de los modelos GPT.

Con tu modelo ya cargado, llamas al método get_num_tokens y le pasas el texto que piensas enviar. Por ejemplo, la frase mis jefes se van a preocupar si gasto mucho en OpenAI equivale a 16 tokens. Con esa medición decides si tu prompt es demasiado largo o si conviene recortarlo.

Mantener prompts compactos es una de las decisiones más rentables cuando trabajas con APIs de pago.

Qué modelos de OpenAI puedo probar con LangChain

LangChain te abre la puerta a varios modelos de OpenAI con la misma sintaxis. Los más comunes que aparecen en la documentación oficial son:

gpt-3.5-turbo: rápido, económico y maneja español con buena calidad.
text-davinci-003: útil para generación de texto largo y tareas creativas.
Otros modelos GPT que encuentras en la documentación para desarrolladores de OpenAI.

Prueba al menos dos modelos distintos con el mismo prompt y compara resultados. Cambia la temperature entre 0.3 y valores más altos para ver cómo varía la creatividad. ¿Qué modelo te dio la respuesta más útil para tu caso? Cuéntalo en los comentarios.

RODRIGO STEVE CARRILLO NORIEGA

Estudiante

Yo use OpenRouter porque tiene modelos gratis 🧠 Contexto: Unificando Proveedores

OpenAI es el estándar de la industria, pero OpenRouter ha surgido como una alternativa poderosa que permite acceder a modelos de OpenAI, Anthropic, Google, Meta (Llama), Mistral y más, todo a través de una única API compatible.

En esta guía aprenderás a configurar LangChain para trabajar con ambos, aprovechando que comparten la misma estructura técnica.

🛠️ Configuración del Entorno (LangChain 1.x)

Para conectar con cualquiera de los dos servicios, utilizamos la librería oficial langchain-openai. Además, usaremos python-dotenv para manejar las claves de forma segura.

Instalación:

pip install langchain langchain-openai python-dotenv

Archivo de Secretos (.env):

Crea un archivo llamado .env en la raíz de tu proyecto y añade tus claves:

OPENAI_API_KEY=sk-...
OPENROUTER_API_KEY=sk-or-...

Carga en Python:

Agrega este bloque al inicio de tu script para inyectar las claves en el entorno:

import os
from dotenv import load_dotenv

# Carga las variables del archivo .env
load_dotenv()

# Validación opcional (recomendada)
if not os.getenv("OPENAI_API_KEY"):
    print("⚠️ Error: No se encontró la OPENAI_API_KEY en el archivo .env")

💡 Nota: Al usar load_dotenv(), LangChain detectará automáticamente la variable OPENAI_API_KEY, por lo que ya no será necesario pasarla como parámetro api_key al instanciar el modelo.

💻 Carga de Modelos: OpenAI vs OpenRouter

El código es casi idéntico. La única diferencia clave es la URL base y el nombre del modelo.

1. Usando OpenAI (Estándar)

from langchain_openai import ChatOpenAI

# Configuración nativa
llm_openai = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.7,
    api_key="tu-api-key-openai" # Opcional si usas variables de entorno
)

print(llm_openai.invoke("Dime un dato curioso de la historia."))

2. Usando OpenRouter (Multi-Modelo)

Para OpenRouter, simplemente redirigimos la petición cambiando el base_url.

from langchain_openai import ChatOpenAI

# Configuración para OpenRouter
llm_openrouter = ChatOpenAI(
    model="mistralai/mistral-7b-instruct", # Nombre específico del proveedor en OpenRouter
    openai_api_base="", # 👈 CLAVE AQUÍ
    api_key="tu-api-key-openrouter",
    temperature=0.7
)

print(llm_openrouter.invoke("Explícame la teoría de la relatividad en 1 frase."))

🔍 Explicación del código

openai_api_base: Le dice a LangChain "No llames a los servidores de OpenAI, llama a esta dirección (OpenRouter)".
model: En OpenRouter, los modelos suelen llevar el prefijo del creador (ej. anthropic/claude-3-opus, google/gemini-pro).

⚙️ Personalización y Uso

Una vez instanciado el objeto (llm), el uso es idéntico para ambos.

Generación simple: .invoke("Texto")
Streaming (respuesta palabra a palabra):

for chunk in llm_openrouter.stream("Escribe un poema corto"):
    print(chunk.content, end="", flush=True)

Gestión de Tokens:

Para controlar costos, usa tiktoken (para OpenAI) o revisa el dashboard de OpenRouter, que normaliza los precios.

# Ejemplo de estimación (aproximada para OpenRouter)
import tiktoken
encoding = tiktoken.encoding_for_model("gpt-3.5-turbo")
num_tokens = len(encoding.encode("Tu prompt aquí"))

🧪 Cuándo usar cada uno

ProveedorCaso de Uso IdealVentaja Principal

OpenAI Directo

Producción crítica, uso de Assistants API, Fine-tuning nativo.

Estabilidad y acceso prioritario a nuevos modelos GPT.

OpenRouter

Comparación de modelos, evitar vendor lock-in, acceso a Claude/Llama sin cambiar código.

Flexibilidad total: Accedes a +100 modelos con una sola API key.

🧠 Conclusión – Puntos clave

Compatibilidad: OpenRouter funciona "engañando" a la librería de OpenAI cambiando la base_url.
LangChain-OpenAI: Es el paquete moderno estándar para ambos casos.
Nombres de Modelos: En OpenRouter, recuerda verificar el ID del modelo (ej. meta-llama/llama-3-70b).
Flexibilidad: Configurar tu código así te permite cambiar de proveedor solo cambiando una variable de entorno.

Sebastián Franco

Edgar Moises Valdez Faria

David Geronimo Quiroga Torres

Jose Luis Alcocer Caceres

Joser rivas

Ayriel Noriega

Angelica Maria Vanegas Arrieta

gottardy melo

John J. Meza

David Cipriano Melchor Natareno

Pablo Torres Pérez

Jean H Forero Martinez

Diego González Castellanos

Alberto Perdomo

Gregson Murcia Castro

•

Jose Gaspar

Guillermo Castaño Vèlez

Josué Barrios Rodriguez

Ignacio Robles

Jhon Alexander Orozco Valencia

Miguel Rodríguez

Jesus Abel Jimenez Bracho

Jaison Hernando Velasco Camacho

Emmanuel Rodríguez

Cómo usar modelos OpenAI con LangChain

Introducción a LangChain

Creación de un sistema de preguntas y respuestas con LangChain

Estructura y Uso de Langchain en Python

Carga de Modelos Open Source con Langchain y Hugging Face