Creación de Agentes en LangChain con Tavily Search y OpenAI

Clase 23 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Los modelos de lenguaje ya no se limitan a generar texto. Gracias a los agentes en LangChain, es posible conectar un LLM con herramientas externas para ejecutar tareas complejas como búsquedas en Internet o consultas a bases vectoriales. Aquí se explica paso a paso cómo construir un agente que combine ambas capacidades usando Tavily search y una base de datos vectorial con documentación de LangSmith.

¿Qué son los agentes en LangChain y por qué importan?

Un agente en LangChain es un sistema que utiliza un modelo de lenguaje como motor de razonamiento para decidir qué acciones tomar y qué entradas proporcionar a esas acciones [00:02]. A diferencia de una cadena simple, el agente puede controlar partes del código o llamar a APIs externas para obtener datos en tiempo real [00:18].

Esto significa que el LLM no solo responde preguntas con su conocimiento preentrenado, sino que puede seleccionar dinámicamente la herramienta adecuada según la consulta del usuario.

¿Cómo funciona Tavily search como herramienta del agente?

Tavily search es una herramienta que permite realizar búsquedas en Internet en tiempo real [00:27]. Para usarla se necesita:

Crear una cuenta en Tavily y obtener una API key.
Importar TavilySearchResults desde langchain_community [01:02].
Configurar el número máximo de resultados, por ejemplo max_results=2 [01:20].

Al ejecutar una consulta como "¿Qué es OpenAI O1-mini?", Tavily devuelve URLs con la información encontrada junto con un extracto del contenido [01:35]. En el ejemplo, la primera URL corresponde a la documentación oficial de OpenAI.

¿Cómo se construye la base vectorial con documentación web?

El agente también necesita acceder a información específica almacenada localmente. Para esto se carga la documentación de LangSmith desde una URL y se procesa en varios pasos [02:20]:

Se utiliza un web base loader para importar el contenido de la página.
Se divide el texto en fragmentos con RecursiveCharacterTextSplitter, usando un tamaño de 1000 caracteres y un overlap de 200 [03:05].
Se crea la base vectorial usando OpenAI embeddings mediante el método from_documents [03:28].
Se genera un retriever a partir del vector store [03:42].

El concepto de overlap es importante: significa que cada fragmento comparte 200 caracteres con el anterior, lo que ayuda a mantener contexto entre fragmentos consecutivos.

¿Cómo se combinan las herramientas y se configura el agente?

Este agente está compuesto por dos tools [03:48]:

Tavily search: para búsquedas en Internet.
Retriever tool: para consultar la base vectorial con documentación de LangSmith.

Para crear el retriever tool se importa desde langchain.tools y se le asigna un nombre descriptivo como "Langsmith search", junto con un prompt que indica: "para cualquier pregunta sobre LangSmith, debes utilizar esta herramienta" [04:20]. Ambas herramientas se agrupan en una lista llamada tools.

Después se vinculan al modelo. En este caso se utiliza GPT-4o, al que se le pasa el conjunto de herramientas mediante bind_tools(tools) [05:15].

¿Cómo decide el agente qué herramienta usar?

Al enviar un mensaje del usuario se utiliza un HumanMessage importado desde langchain_core.messages [05:30]. El modelo evalúa la consulta y decide si necesita una herramienta o puede responder por sí solo.

Cuando el input es un simple "hi", no se llama a ninguna herramienta porque el LLM puede responder sin ayuda externa [06:05].
Cuando se pregunta "¿cuál es el clima en Bogotá?", el agente identifica que necesita datos en tiempo real y llama a Tavily automáticamente [06:25].

La respuesta incluye tanto el contenido generado como información sobre qué herramienta fue invocada, lo que permite verificar el comportamiento del agente.

¿Qué sigue para completar el agente?

Hasta este punto el agente funciona con llamadas individuales sin mantener contexto entre interacciones. El siguiente paso es darle estructura con memoria para que pueda sostener conversaciones y generar respuestas más completas para el usuario [06:50].

¿Ya has experimentado combinando herramientas en tus agentes? Comparte qué tipo de tools te gustaría integrar.

Comentarios

Edward Trigos Lopez

student•

La importacion de Tavily cambio, por si a alguien mas no le funciona:

# from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_community.tools import TavilySearchResults

Ikal Esteban Fernández Galván

student•

Ha cambiado más, "TavilySearchResults" ha sido descontinuada.

Hay que instalar "langchain_tavily":

!pip install -U langchain_tavily

y luego importar "TavilySearch" en lugar de "TavilySearchResults":

Antiguo: from langchain_community.tools import TavilySearchResults

Nuevo: from langchain_tavily import TavilySearch

Giancarlo Zevallos Lecca

student•

A día de hoy gpt-5 ya trae nativamente un buscador web que podemos invocar

from langchain_openai import ChatOpenAI

# Inicializa el modelo con web search habilitado

llm = ChatOpenAI(

model="gpt-5",

temperature=0,

tools=[{"type": "web_search"}] # Activa búsqueda web nativa

)

response = llm.invoke(

"¿Cuáles son las noticias más recientes sobre inteligencia artificial hoy?"

)

print(response.content)

Sandra Milena RAIRAN PINILLA

student•

Genial!!! muchas gracias por hacer un curso tan organizado.

Juan Pablo Ramos Torres

student•

El enlace al Google Colab requiere permisos

Daniel Jaramillo

student•

Si tienen problemas de importación para el metodo create_retriever_tool deben importarlo e la siguiente forma.

from langchain_classic.tools.retriever import create_retriever_tool

Juan Camilo Mejía Rodríguez

student•

El enlace me solicita permisos

Karina Zertuche Corona

student•

AIMessage es la respuesta del modelo, ok!

Alejandro Nieto

student•

Bien, esto empieza a tomar forma😏

Creación de Agentes en LangChain con Tavily Search y OpenAI

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain

Creación de Agentes Inteligentes con LangChain

Instalación y uso de API Keys para modelos de lenguaje en Google Collab

Chat Models y Prompt templates

Chat Messages con OpenAI

Conexión y uso de modelos de chat con LangChain y OpenAI

Uso de Modelos de Google AI Gemini en LangChain

Creación de Plantillas de Prompts en LangChain

Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Cadenas en LangChain

Creación de Cadenas en LangChain con String Output Parser

Gestión de Historial de Chat con LangChain

Integración de Herramientas Claves en LangChain: Runnable, OutputParser, Streaming

Creación de Chatbots Inteligentes con Memoria Conversacional

Cadena de Procesos para Memoria Conversacional con GPT-3.5 Turbo

Carga de documentos en LangChain

Carga y procesamiento de archivos HTML con LangChain y Beautiful Soup

Carga de PDFs y CSVs en LangChain con PyPDF y CSV Loader

División de Texto en Fragmentos con TextSplitters en LangChain

Retrieval-augmented generation (RAG)

Gestión de Vectores de Texto con Chroma y LangChain

Embeddings y su aplicación en modelos de lenguaje y RAG

Pinecone: Implementación de Bases de Datos Vectoriales Escalables

Creación de Chatbot RAG con LangChain y ChromaDB

Construcción de un Asistente Conversacional con LangChain y RAG

Agentes en LangChain

Creación de Agentes en LangChain con Tavily Search y OpenAI

Integración de Toolkits en LangChain para Modelos de Lenguaje

Creación de Agentes Inteligentes con LangChain y Memoria

Ecosistema de LangChain

Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph