Structured Output para agentes en LangGraph

Curso para Crear Agentes de AI con LangGraph

Contenido del curso

Fundamentos de LangGraph

El Núcleo del Agente: Estado y LLMs

Lógica y Estructura de Nodos

Agentes ReAct

Grafos Avanzados y Colaboración

Puesta en Producción

Tomar examen

Structured Output para agentes en LangGraph

Resumen

Cuando un Large Language Model responde en texto libre, predecir su salida es casi imposible: cambia el tono, la longitud y el formato según el prompt y la temperatura. Para que un agente tome decisiones reales dentro de LangGraph, necesitas forzar al modelo a responder en un esquema estructurado tipo JSON. Esa técnica se llama structured output y es la base para construir nodos extractores que alimenten la memoria compartida de tu agente.

Por qué necesitas respuestas estructuradas en un agente

Un agente no solo conversa, también evalúa. Y para evaluar, requiere datos en variables tipadas, no párrafos.

El structured output permite que el modelo devuelva un objeto con campos definidos: un string para el nombre, un int para la edad, un enum para el sentimiento. Así puedes operar sobre la respuesta dentro de tu programa, tomar decisiones condicionales y guardar información en el estado del grafo [1:30].

¿Qué es structured output? Es una técnica que obliga al Large Language Model a responder siguiendo un esquema definido (por ejemplo, con Pydantic), en lugar de texto libre. La salida se entrega como un objeto con campos tipados listo para usar en código.

Esta es la diferencia entre usar el modelo como chatbot y usarlo como motor de extracción dentro de un pipeline. El nodo extractor, por ejemplo, recibe el historial completo de la conversación y devuelve un esquema con los datos relevantes del usuario.

Cómo elegir el modelo correcto para structured output

En la documentación de LangChain, dentro de Integrations > Chat Models, hay una tabla comparativa que muestra qué features soporta cada proveedor.

Las columnas más importantes que debes revisar son:

Tool calling: si el modelo puede invocar herramientas externas.
Structured output: si soporta respuestas con esquema, hoy lo soportan prácticamente todos.
JSON mode: quedó obsoleto, structured output lo reemplazó [4:50].
Local: si puedes correrlo en tu máquina con Ollama o Hugging Face.
Multimodal: si acepta imágenes, PDF o audio como input.

Anthropic con Claude, OpenAI y la mayoría de integraciones soportan structured output, así que la decisión depende más de costo, velocidad y calidad para tu caso particular.

Cómo definir un esquema con Pydantic en LangGraph

Pydantic ya viene instalado con LangGraph y es la forma natural de modelar el esquema en Python. Cuando llamas a with_structured_output(schema), LangChain transforma esa clase en el formato que la API del proveedor necesita.

Un ejemplo de clase para un extractor de contacto:

python from pydantic import BaseModel, Field

class ContactInfo(BaseModel): name: str = Field(description="Nombre del cliente") email: str = Field(description="Email del cliente") phone: str = Field(description="Teléfono del cliente") age: str = Field(description="Edad del cliente") sentiment: str = Field(description="Sentimiento de la conversación")

La descripción de cada campo es crítica porque pasa a formar parte del prompt que recibe el modelo. Si la descripción es vaga, el modelo alucina; si es precisa, los datos extraídos son confiables [9:30].

Cómo invocar el modelo con el esquema

Después de definir la clase, el patrón es directo:

python llm = ChatAnthropic(model="claude-...") extractor = llm.with_structured_output(ContactInfo)

messages = [ ("system", "Eres un extractor experto. Dada una conversación, extrae la información siguiendo el esquema."), ("user", history) ] response = extractor.invoke(messages)

La respuesta ya no es un string, es una instancia de ContactInfo. Puedes acceder a response.name, response.phone y usarlo como cualquier objeto Python.

Cómo construir el nodo extractor en un agente RAG

El nodo extractor evalúa el historial cada vez que se ejecuta y guarda lo encontrado en la memoria compartida del grafo. La lógica básica recorre tres pasos.

Lee el estado actual y verifica qué campos están vacíos: customer_name, phone, age.
Si falta información o el historial supera cierto umbral (por ejemplo, 10 mensajes), llama al modelo con structured output.
Devuelve el nuevo estado con los campos extraídos para que los nodos siguientes los usen.

¿Cómo evito gastar tokens en cada turno? Aplica una condición: ejecuta el extractor solo cuando el dato falte o cuando el historial crezca lo suficiente para reevaluarlo. Si ya tienes el nombre y el historial es corto, devuelves el estado sin llamar al modelo.

Esta condición es clave porque cada llamada al Large Language Model tiene costo. La regla típica combina dos señales: campo nulo o historial mayor a N mensajes [19:00].

Cómo manejar campos opcionales sin romper el esquema

Un detalle frecuente: si declaras age: int y el usuario aún no compartió su edad, el modelo intenta devolver null y Pydantic lanza error de validación.

Dos soluciones prácticas:

Usar str en lugar de int mientras la información llega.
Marcar el campo como Optional[int] para permitir nulos.

También conviene agregar al prompt una instrucción clara: si no encuentras la información en la conversación, no la inventes. Sin esa línea, el modelo alucina datos como una edad inventada [13:40].

Cómo inyectar la memoria compartida en el prompt conversacional

Una vez el extractor llena el estado, el nodo conversacional puede usar esos datos para personalizar las respuestas. En lugar de un nombre hardcodeado tipo John Doe, el system prompt se construye dinámicamente.

python customer_name = state.get("customer_name", "John Doe") system = f"Eres un asistente. El cliente se llama {customer_name}."

messages = [ ("system", system), ("user", last_message) ]

El fallback a John Doe evita que el prompt quede roto cuando aún no hay datos. Más adelante conviene hacer el prompt totalmente dinámico: solo añadir la línea del teléfono si el teléfono existe, solo añadir la edad si la edad existe.

Este patrón separa responsabilidades. El nodo extractor se enfoca en obtener datos. El nodo conversacional se enfoca en responder. La memoria compartida los conecta.

Qué habilidades de prompting necesitas para que funcione

El structured output resuelve el formato, pero no la calidad de la extracción. Esa parte depende de tu prompt.

Técnicas útiles que conviene dominar:

Zero-shot: dar instrucciones sin ejemplos.
Few-shot: incluir ejemplos de input y output esperado.
Chain of thought: pedir al modelo que razone paso a paso antes de responder.

El prompting sigue siendo la habilidad central de cualquier ingeniero de agentes, incluso cuando el output ya está estructurado. ¿Has probado combinar structured output con few-shot en tus propios extractores? Cuéntame en los comentarios cómo te fue.

"""
Recruitment Agent with Structured Output
=========================================
This module implements a LangGraph agent that extracts aspirant profiles from
professional introductions and evaluates them against a specific job role.

The agent follows a two-step workflow:
1. Extract structured metadata from the aspirant's introduction
2. Evaluate the aspirant's suitability for the vacant role
"""

from dotenv import load_dotenv
from typing import List

from pydantic import BaseModel, Field
from langchain_core.messages import AIMessage
from langgraph.graph import MessagesState, StateGraph, END

from agents.llms import get_anthropic_model

load_dotenv()

# =============================================================================
# Constants
# =============================================================================

VACANT_ROLE = "Frontend Developer in react with 3 years of experience"

# =============================================================================
# Data Models
# =============================================================================

class Aspirant(BaseModel):
    """Data model representing a job aspirant's profile."""
    
    name: str = Field(description="The full name of the aspirant")
    base_technical_skills: List[str] = Field(description="A list of the aspirant's technical skills")
    ideal_role: str = Field(description="The ideal role the aspirant is seeking")
    years_of_experience: int = Field(description="The number of years of experience the aspirant has")
    psicological_traits: List[str] = Field(description="A list of psychological traits of the aspirant")

    def to_string(self) -> str:
        """Convert aspirant data to a human-readable string format."""
        return (
            f"Name: {self.name}, "
            f"Technical Skills: {', '.join(self.base_technical_skills)}, "
            f"Ideal Role: {self.ideal_role}, "
            f"Experience: {self.years_of_experience} years, "
            f"Psychological Traits: {', '.join(self.psicological_traits)}"
        )

class AspirantResponse(BaseModel):
    """Response model for aspirant profile extraction."""
    
    aspirant: Aspirant | None = Field(description="The aspirant being evaluated")
    no_intro_provided: bool = Field(description="Indicates if no introduction was provided")

# =============================================================================
# LLM Configuration
# =============================================================================

llm_base = get_anthropic_model()
llm_with_structured_output = llm_base.with_structured_output(schema=AspirantResponse)

# =============================================================================
# Core Functions
# =============================================================================

def extractAspirantMetadata(aspirant_intro: str) -> AspirantResponse:
    """
    Extract structured aspirant profile from a professional introduction.
    
    Args:
        aspirant_intro: The aspirant's professional introduction text
        
    Returns:
        AspirantResponse containing the extracted profile or None if invalid
    """
    print("Extracting aspirant metadata...")
    print("Aspirant intro:", aspirant_intro)

    messages = [
        (
            "system",
            "You are an expert career advisor, provide a detailed profile of an aspirant, "
            "pay special attention to the psychological traits. If the introduced text is not "
            "a professional introduction, resolve aspirant as None and set no_intro_provided to true"
        ),
        ("user", aspirant_intro)
    ]
    
    try:
        return llm_with_structured_output.invoke(messages)
    except Exception as e:
        print(f"Error extracting aspirant metadata: {e}")
        return None

def answer_based_on_vacant(aspirant: Aspirant) -> AIMessage:
    """
    Evaluate an aspirant's suitability for the vacant role.
    
    Args:
        aspirant: The aspirant profile to evaluate
        
    Returns:
        AIMessage with the recruitment decision
    """
    messages = [
        (
            "system",
            f"You are an expert recruiter, and we are evaluating aspirants to a role of {VACANT_ROLE}. "
            "Based on the next professional profile summary, please tell the applicant whether or not "
            "they are suitable to continue in the selection process."
        ),
        ("user", aspirant.to_string())
    ]

    response = llm_base.invoke(messages)
    return response

# =============================================================================
# Graph State and Nodes
# =============================================================================

class State(MessagesState):
    """Extended state including aspirant profile data."""
    aspirant: Aspirant | None


def aspirant_metadata_extractor_node(state: State) -> dict:
    """
    Extract aspirant metadata from the user's introduction message.
    
    Args:
        state: Current graph state
        
    Returns:
        Updated state with aspirant data or a prompt message
    """
    messages = state.get("messages", [])
    aspirant = state.get("aspirant", None)

    if len(messages) == 0:
        return {
            "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
        }

    last_message = messages[-1]
    print("Last message content:", last_message.content)

    if aspirant is None and last_message.content.strip() != "":
        aspirant_metadata = extractAspirantMetadata(last_message.content)

        if aspirant_metadata.no_intro_provided and aspirant_metadata.aspirant is None:
            return {
                "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
            }
                        
        return {"aspirant": aspirant_metadata.aspirant}
        
    return {
        "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
    }

def answer_based_on_vacant_node(state: State) -> dict:
    """
    Evaluate the aspirant and provide recruitment feedback.
    
    Args:
        state: Current graph state with aspirant data
        
    Returns:
        Updated state with evaluation message
    """
    aspirant = state["aspirant"]

    if aspirant is None:
        return {
            "messages": [AIMessage(content="We could not extract your profile, please provide a professional introduction.")]
        }

    answer = answer_based_on_vacant(aspirant)
    return {"messages": [answer]}

from langgraph.graph import END

def route_after_extraction(state: State) -> str:
    """
    Route to answer node if aspirant is set, otherwise continue extracting.
    
    Args:
        state: Current graph state
        
    Returns:
        Name of the next node to execute
    """
    if state.get("aspirant", None) is not None:
        return "answer_based_on_vacant_node"
    else:
        return "aspirant_metadata_extractor"

# =============================================================================
# Graph Workflow Definition
# =============================================================================

# Initialize workflow
workflow = StateGraph(State)

# Add nodes
workflow.add_node("aspirant_metadata_extractor", aspirant_metadata_extractor_node)
workflow.add_node("answer_based_on_vacant_node", answer_based_on_vacant_node)

# Set entry point
workflow.set_entry_point("aspirant_metadata_extractor")

# Add conditional routing
workflow.add_conditional_edges(
    "aspirant_metadata_extractor",
    route_after_extraction,
    {
        "aspirant_metadata_extractor": END,
        "answer_based_on_vacant_node": "answer_based_on_vacant_node"
    }
)

# Add final edge
workflow.add_edge("answer_based_on_vacant_node", END)

# Compile the agent
agent = workflow.compile()

"""
Recruitment Agent with Structured Output
=========================================
This module implements a LangGraph agent that extracts aspirant profiles from
professional introductions and evaluates them against a specific job role.

The agent follows a two-step workflow:
1. Extract structured metadata from the aspirant's introduction
2. Evaluate the aspirant's suitability for the vacant role
"""

from dotenv import load_dotenv
from typing import List

from pydantic import BaseModel, Field
from langchain_core.messages import AIMessage
from langgraph.graph import MessagesState, StateGraph, END

from agents.llms import get_anthropic_model

load_dotenv()

# =============================================================================
# Constants
# =============================================================================

VACANT_ROLE = "Frontend Developer in react with 3 years of experience"

# =============================================================================
# Data Models
# =============================================================================

class Aspirant(BaseModel):
    """Data model representing a job aspirant's profile."""
    
    name: str = Field(description="The full name of the aspirant")
    base_technical_skills: List[str] = Field(description="A list of the aspirant's technical skills")
    ideal_role: str = Field(description="The ideal role the aspirant is seeking")
    years_of_experience: int = Field(description="The number of years of experience the aspirant has")
    psicological_traits: List[str] = Field(description="A list of psychological traits of the aspirant")

    def to_string(self) -> str:
        """Convert aspirant data to a human-readable string format."""
        return (
            f"Name: {self.name}, "
            f"Technical Skills: {', '.join(self.base_technical_skills)}, "
            f"Ideal Role: {self.ideal_role}, "
            f"Experience: {self.years_of_experience} years, "
            f"Psychological Traits: {', '.join(self.psicological_traits)}"
        )

class AspirantResponse(BaseModel):
    """Response model for aspirant profile extraction."""
    
    aspirant: Aspirant | None = Field(description="The aspirant being evaluated")
    no_intro_provided: bool = Field(description="Indicates if no introduction was provided")

# =============================================================================
# LLM Configuration
# =============================================================================

llm_base = get_anthropic_model()
llm_with_structured_output = llm_base.with_structured_output(schema=AspirantResponse)

# =============================================================================
# Core Functions
# =============================================================================

def extractAspirantMetadata(aspirant_intro: str) -> AspirantResponse:
    """
    Extract structured aspirant profile from a professional introduction.
    
    Args:
        aspirant_intro: The aspirant's professional introduction text
        
    Returns:
        AspirantResponse containing the extracted profile or None if invalid
    """
    print("Extracting aspirant metadata...")
    print("Aspirant intro:", aspirant_intro)

    messages = [
        (
            "system",
            "You are an expert career advisor, provide a detailed profile of an aspirant, "
            "pay special attention to the psychological traits. If the introduced text is not "
            "a professional introduction, resolve aspirant as None and set no_intro_provided to true"
        ),
        ("user", aspirant_intro)
    ]
    
    try:
        return llm_with_structured_output.invoke(messages)
    except Exception as e:
        print(f"Error extracting aspirant metadata: {e}")
        return None

def answer_based_on_vacant(aspirant: Aspirant) -> AIMessage:
    """
    Evaluate an aspirant's suitability for the vacant role.
    
    Args:
        aspirant: The aspirant profile to evaluate
        
    Returns:
        AIMessage with the recruitment decision
    """
    messages = [
        (
            "system",
            f"You are an expert recruiter, and we are evaluating aspirants to a role of {VACANT_ROLE}. "
            "Based on the next professional profile summary, please tell the applicant whether or not "
            "they are suitable to continue in the selection process."
        ),
        ("user", aspirant.to_string())
    ]

    response = llm_base.invoke(messages)
    return response

# =============================================================================
# Graph State and Nodes
# =============================================================================

class State(MessagesState):
    """Extended state including aspirant profile data."""
    aspirant: Aspirant | None


def aspirant_metadata_extractor_node(state: State) -> dict:
    """
    Extract aspirant metadata from the user's introduction message.
    
    Args:
        state: Current graph state
        
    Returns:
        Updated state with aspirant data or a prompt message
    """
    messages = state.get("messages", [])
    aspirant = state.get("aspirant", None)

    if len(messages) == 0:
        return {
            "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
        }

    last_message = messages[-1]
    print("Last message content:", last_message.content)

    if aspirant is None and last_message.content.strip() != "":
        aspirant_metadata = extractAspirantMetadata(last_message.content)

        if aspirant_metadata.no_intro_provided and aspirant_metadata.aspirant is None:
            return {
                "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
            }
                        
        return {"aspirant": aspirant_metadata.aspirant}
        
    return {
        "messages": [AIMessage(content="Please provide a professional introduction to extract your profile.")]
    }

def answer_based_on_vacant_node(state: State) -> dict:
    """
    Evaluate the aspirant and provide recruitment feedback.
    
    Args:
        state: Current graph state with aspirant data
        
    Returns:
        Updated state with evaluation message
    """
    aspirant = state["aspirant"]

    if aspirant is None:
        return {
            "messages": [AIMessage(content="We could not extract your profile, please provide a professional introduction.")]
        }

    answer = answer_based_on_vacant(aspirant)
    return {"messages": [answer]}

from langgraph.graph import END

def route_after_extraction(state: State) -> str:
    """
    Route to answer node if aspirant is set, otherwise continue extracting.
    
    Args:
        state: Current graph state
        
    Returns:
        Name of the next node to execute
    """
    if state.get("aspirant", None) is not None:
        return "answer_based_on_vacant_node"
    else:
        return "aspirant_metadata_extractor"

# =============================================================================
# Graph Workflow Definition
# =============================================================================

# Initialize workflow
workflow = StateGraph(State)

# Add nodes
workflow.add_node("aspirant_metadata_extractor", aspirant_metadata_extractor_node)
workflow.add_node("answer_based_on_vacant_node", answer_based_on_vacant_node)

# Set entry point
workflow.set_entry_point("aspirant_metadata_extractor")

# Add conditional routing
workflow.add_conditional_edges(
    "aspirant_metadata_extractor",
    route_after_extraction,
    {
        "aspirant_metadata_extractor": END,
        "answer_based_on_vacant_node": "answer_based_on_vacant_node"
    }
)

# Add final edge
workflow.add_edge("answer_based_on_vacant_node", END)

# Compile the agent
agent = workflow.compile()

Structured Output para agentes en LangGraph

Fundamentos de LangGraph

Por qué LangGraph controla la IA agente

Configura tu primer agente con LangGraph

Arquitectura profesional de agentes con UV

El Núcleo del Agente: Estado y LLMs

Memoria compartida entre nodos en LangGraph

Gestión de historial de mensajes en LangGraph

Cómo conectar LLMs a un grafo multiagente

Integración de LLM en grafos para agentes que razonan

RAG con file search de OpenAI

Lógica y Estructura de Nodos

Prompt chaining en LangGraph paso a paso