Integración de Herramientas con Modelos GPT

Clase 6 de 24Curso de OpenAI API

Resumen

¿Cómo los modelos GPT pueden comunicarse con herramientas externas?

Los avances en inteligencia artificial han hecho posible que los modelos GPT no solo mantengan conversaciones fluidas con los seres humanos, sino que también se comuniquen eficazmente con herramientas de terceros. Esto abre una gran cantidad de posibilidades, desde obtener información en tiempo real, como el clima, hasta realizar tareas más complejas como generar reportes PDF o descargar archivos de Internet.

La comunicación con estas herramientas se realiza a través de lo que se conoce como "funciones". Estas funciones permiten al modelo GPT interactuar con APIs, solicitar datos y, posteriormente, entender y transmitir la información obtenida al usuario. Este proceso es revolucionario, brindando a los modelos capacidades que se asemejan mucho más a las de un asistente personal humano.

¿Cuáles son los principales roles en la comunicación de modelos GPT?

Dentro de la interacción con modelos GPT, existen tres roles fundamentales: sistema, asistente y usuario. Sin embargo, el enfoque principal suele estar en la interacción entre el asistente y el usuario.

  • Asistente: Actúa como el mediador que interpreta y responde a las peticiones del usuario.
  • Usuario: Es la fuente de solicitudes e interactúa directamente con el asistente.

Por ejemplo, en una conversación típica, el usuario podría saludar con un "Hola", a lo que el asistente respondería "Hola, ¿en qué te puedo asistir hoy?". La interacción avanza así, con el asistente proporcionando ayuda basada en las capacidades del modelo y las funciones disponibles.

¿Qué son y cómo funcionan las herramientas en los modelos GPT?

En 2022 se introdujo la posibilidad de que GPT utilice "herramientas" (anteriormente conocidas como "funciones"). Estas herramientas son esenciales para dotar al modelo de la capacidad de ofrecer información actualizada y en tiempo real, como el clima o la hora en diferentes ubicaciones.

Ejemplo de uso de herramientas

Cuando se solicita al modelo que proporcione el clima en Buenos Aires, el asistente llama a la función "obtener clima". Esta función recupera la información necesaria, como por ejemplo, "17 grados Celsius", y el asistente comunica esta información al usuario.

Detalles de la función "obtener clima":

  • Nombre de la función: obtener_clima
  • Parámetros requeridos: Latitud y longitud, que indican la ubicación deseada.
  • Output esperado: El clima actual en la ciudad solicitada por el usuario.

El modelo elige la función adecuada de entre un conjunto de herramientas disponibles, utilizando parámetros específicos según la función solicitada. Es responsabilidad de los desarrolladores implementar la ejecución de estas funciones y facilitar al asistente la información resultante.

Implementación y uso de múltiples herramientas

El asistente no se limita a una sola herramienta; puede usar múltiples funciones conforme al contexto de la interacción. Además de obtener el clima, pueden abarcar desde obtener la hora hasta enviar reportes.

Para que el asistente utilice correctamente una función, debemos comunicárselo claramente. Esto incluye proporcionar información sobre el uso, los parámetros requeridos y el contexto del output. Al clarificar estos aspectos, logramos que el modelo GPT seleccione y aplique la herramienta más adecuada, optimizando así la interacción y utilidad para el usuario.

Esta capacidad de interacción con funciones externas potencia enormemente lo que los modelos GPT pueden ofrecer. Los desarrolladores deben, por tanto, enfocarse en diseñar estas funciones con precisión, asegurando que el modelo pueda integrarlas y utilizarlas eficazmente en el mundo real.