Contenido del curso

Cómo conectar GPT con funciones externas

Resumen

Los modelos GPT pueden hacer mucho más que conversar. Cuando aprendes a conectarlos con herramientas y funciones externas, abres la puerta a integraciones con APIs, generación de reportes, búsquedas en la web y datos en tiempo real que el modelo no conoce por sí mismo. Esto es clave si construyes aplicaciones con la API de OpenAI y quieres respuestas que vayan más allá del entrenamiento original.

¿Por qué GPT necesita herramientas externas?

Un modelo GPT solo conoce lo que aprendió durante su entrenamiento. Si le preguntas por el clima de Buenos Aires hoy, no puede responder. No tiene acceso a internet, ni a APIs, ni a tu base de datos.

Ahí entran las tools. En 2022 OpenAI introdujo las functions, que hoy se llaman tools [1:00]. Por ahora hay equivalencia entre ambos términos, pero las tools eventualmente incluirán capacidades nativas como búsqueda web. Pensar en ellas como funciones programables sigue siendo la mejor analogía.

¿Qué son las tools en GPT? Son funciones externas que el modelo puede invocar para obtener información o ejecutar acciones que están fuera de su conocimiento, como consultar el clima, generar PDFs o llamar a una API.

¿Cómo funciona una llamada a función paso a paso?

El flujo entre el usuario, el asistente y la función sigue una secuencia clara que conviene tener fija en la cabeza.

  1. El usuario pregunta algo, por ejemplo: "¿Cuál es el clima de Buenos Aires?".
  2. El asistente identifica que necesita ayuda externa y elige la función obtener clima.
  3. El asistente genera los parámetros que la función necesita, como latitud y longitud.
  4. Tú, como desarrollador, ejecutas esa función llamando a la API real.
  5. Devuelves el resultado al asistente, por ejemplo: 17 grados Celsius.
  6. El asistente interpreta el dato y le responde al usuario en lenguaje natural.

El detalle importante: el modelo GPT no ejecuta la función. Solo te dice qué función quiere usar y con qué parámetros [2:30]. La ejecución corre por tu cuenta, en tu servidor, con tu código. Esa separación es lo que mantiene el sistema seguro y flexible.

¿Cómo se define una tool para que GPT la use bien?

Para que el asistente elija correctamente entre varias funciones disponibles, necesitas describirle cada una con precisión. Imagina que tienes tres herramientas: obtener clima, obtener hora y enviar reporte. ¿Cómo sabe cuál usar?

Cada función se define con cuatro elementos clave:

  • Nombre de la función: identificador claro como obtener_clima.
  • Parámetros: los datos que la función acepta, por ejemplo latitud y longitud.
  • Parámetros requeridos: los que son obligatorios para que la función pueda ejecutarse. En este caso ambos.
  • Contexto del output: qué va a devolver y para qué sirve. Aquí, el clima de la ciudad solicitada por el usuario.

Además, igual que haces con el system prompt, le indicas al asistente cuándo usar cada herramienta: "usa esta función cuando el usuario te pida obtener el clima" [4:30]. Esa instrucción guía la decisión del modelo.

¿Quién ejecuta la función, GPT o yo? Tú la ejecutas. GPT solo decide qué función llamar y arma los parámetros. La lógica real corre en tu código, y luego le devuelves el resultado al modelo para que lo interprete.

¿Qué tipos de herramientas puedes conectar?

Las posibilidades crecen rápido cuando entiendes el patrón. Algunos ejemplos prácticos:

  • Consumir una API externa para obtener datos en tiempo real, como clima o cotizaciones.
  • Generar archivos, por ejemplo un reporte en PDF.
  • Descargar documentos desde internet.
  • Buscar en la web y alimentar al propio modelo con esa información.
  • Conectar con bases de datos internas o servicios privados.

Cada una de estas funciones se define con la misma estructura: nombre, parámetros, requeridos y contexto del output. Eso le da al asistente la capacidad de orquestar varias herramientas según lo que pida el usuario.

¿Qué papel juegan los roles assistant y user en este flujo?

En la API de OpenAI manejas tres roles: system, assistant y user. En una conversación normal sin tools, el user pregunta y el assistant responde con lo que sabe. Cuando agregas funciones, el assistant gana una capacidad nueva: en lugar de responder directo, puede pedirte que ejecutes una función primero.

Ese intercambio convierte al modelo en un orquestador. Tú le das herramientas bien descritas, él decide cuándo usarlas, tú ejecutas y devuelves el resultado, y él arma la respuesta final para el usuario. Es la base de cualquier agente inteligente que veas funcionando hoy.

Cuéntame en los comentarios qué función te gustaría conectar primero a tu modelo GPT.

      Cómo conectar GPT con funciones externas