Contenido del curso

Prompt chaining en LangGraph paso a paso

Resumen

El prompt chaining es la técnica más básica para orquestar varios agentes en LangGraph y resolver tareas que un solo nodo no podría manejar. Aquí aprenderás cómo encadenar nodos con modelos de lenguaje en secuencia, cuándo conviene usarlo y cuándo es mejor reemplazarlo por un buen prompt con razonamiento.

¿Por qué necesitas orquestar varios agentes en lugar de uno solo?

Un solo nodo difícilmente resuelve un problema complejo. Por eso tiene sentido orquestar varios agentes, donde cada uno tiene su propio large language model, su modelo de conexión y una tarea muy específica que luego pasa al siguiente.

En la introducción al tema [00:00], se explica que existen distintos workflows según qué tanto decida el modelo por sí mismo:

  • Prompt chaining: los nodos siguen una secuencia fija. El modelo razona dentro de cada nodo, pero no decide la ruta.
  • Paralelo: ejecuta varios nodos al mismo tiempo, sin que el modelo decida.
  • Orquestador: el modelo hace planning y ejecuta los nodos necesarios.
  • Evaluator: corre en ciclo hasta que la respuesta sea suficientemente buena.
  • Routing: el large language model decide por qué nodo seguir.
  • Agent: incorpora tools y un proceso de reflexión.

¿Qué es prompt chaining? Es un patrón donde varios nodos con modelos de lenguaje se ejecutan en una secuencia fija. Cada nodo razona internamente, pero el orden de ejecución no lo decide el modelo, lo defines tú.

¿Cómo se construye un chain en LangGraph paso a paso?

En el notebook 06 chaining [02:00] se parte de un estado simple y tres nodos vacíos: nodo uno, nodo dos y nodo tres. La construcción del grafo sigue dos caminos posibles.

Forma explícita con edges

Primero agregas cada nodo y luego conectas las aristas una por una:

  • Agregas nodo_2 apuntando a la función dos.
  • Agregas nodo_3 apuntando a la función tres.
  • Conectas: inicio → nodo uno → nodo dos → nodo tres → fin.

Al compilar y generar el gráfico, ves una cadena lineal con un punto inicial, los tres nodos y el final.

Forma compacta con add_sequence

Existe una manera más limpia [04:30]: usar el builder con add_sequence y pasarle directamente un array con las funciones. El nombre de cada función se convierte en el nombre del nodo y no necesitas declarar edges manualmente.

¿Cuándo usar add_sequence en lugar de edges manuales? Úsalo cuando tu flujo sea puramente lineal, sin bifurcaciones. Si más adelante vas a tener ramificaciones o decisiones, mejor mantén la forma explícita desde el inicio.

¿Cuándo es mala práctica usar prompt chaining?

El ejemplo oficial de LangGraph muestra tres nodos para generar chistes: uno crea la broma, otro la hace más divertida y un tercero le agrega un plot twist. Es útil con fines educativos, pero en la práctica puede ser una mala decisión [06:30].

¿Por qué? Porque los modelos actuales ya son lo suficientemente inteligentes como para seguir un plan dentro de un solo prompt. Aquí entra el chain of thought: una técnica de prompting donde le das al modelo todas las instrucciones secuenciales en un único mensaje y un modelo razonador las ejecuta paso a paso.

Ejemplos de modelos razonadores disponibles:

  • OpenAI: o1 Preview.
  • Google: Gemini 2.5 con thinking incluido.
  • Anthropic: varios modelos de la familia con razonamiento.

Esto importa por dos razones: cada nodo hace una llamada al large language model y eso cuesta dinero. Si un buen prompt con razonamiento resuelve lo mismo en una sola llamada, el chain sobra. Ahora, cuando cada nodo tiene una carga cognitiva fuerte (prompts largos, contexto pesado), sí conviene dividir para que cada respuesta sea de mejor calidad.

¿Cómo aplicar chaining en un RAG real?

En el ejemplo del RAG [09:30] se renombran los nodos para darles propósito:

  • Conversation: mantiene la conversación, analiza el último mensaje y decide si consultar la base de datos vectorial.
  • Extractor: nodo previo que extraerá información relevante de la conversación.

El flujo queda: inicio → extractor → conversation → fin. Por ahora el extractor pasa vacío, pero ya está integrado en la arquitectura. Al ejecutarlo en LangGraph Studio, se visualiza el patrón de chain completo y se entiende cómo cada nodo cumple su rol antes de pasar al siguiente.

Un caso muy práctico: redes sociales

Un uso real donde el chaining sí brilla es la generación de contenido para redes sociales [12:30]:

  1. Recibes un texto largo o un PDF.
  2. Un primer nodo genera un tweet con base en ese contenido.
  3. Un segundo nodo se conecta con un modelo de imágenes como DALL-E y crea una imagen a partir del tweet generado.
  4. Devuelves tweet + imagen como respuesta final.

Aquí el chain of thought no funcionaría, porque esa técnica no genera imágenes. Necesitas nodos separados con modelos distintos. Ese es el momento donde el chaining se vuelve insustituible.

¿Qué otros casos se te ocurren para resolver con prompt chaining? Cuéntame en los comentarios qué flujos secuenciales con modelos de lenguaje implementarías en tu trabajo.