Roles en Chat Completions con GPT-3.5

Curso de Desarrollo de Chatbots con OpenAI

Contenido del curso

OpenAI API

Fine-tuning de modelos de OpenAI

Integración de modelo a aplicación de chat

Conclusión

24
Proyectos de Fine Tuning y Procesamiento de Lenguaje Natural
02:58 min

Tomar examen

Roles en Chat Completions con GPT-3.5

Resumen

Cuando trabajas con la API de OpenAI, chat completions es la herramienta que te permite darle contexto al modelo mediante roles y ejemplos, para que sus respuestas sean más precisas y alineadas con tu objetivo. Aquí te muestro cómo configurar roles, ajustar la temperatura y evitar alucinaciones usando GPT 3.5 Turbo.

¿Qué son los chat completions en OpenAI y para qué sirven?

Los chat completions son una funcionalidad de la API que te permite construir conversaciones estructuradas con el modelo. En lugar de mandar un prompt suelto, le pasas una lista de mensajes con roles definidos para que el modelo entienda quién dice qué y cómo debe responder.

La documentación oficial sugiere dos modelos para estas tareas: GPT 3.5 Turbo y GPT 4. Con cualquiera de los dos puedes redactar emails, generar estructuras de código o construir agentes conversacionales completos.

¿Qué hace chat completions diferente de un prompt simple? Te permite pasar varios mensajes con roles (system, user, assistant) para que el modelo siga un flujo conversacional y mantenga coherencia con el contexto que tú definiste.

¿Cómo se usan los roles system, user y assistant?

La estructura de mensajes en chat completions gira alrededor de tres roles, y cada uno cumple una función específica dentro de la conversación [02:10].

system: define el contexto principal y la personalidad del asistente. La documentación recomienda siempre empezar por aquí. Por ejemplo: "Eres un asistente que da información sobre deportes".
user: representa lo que pregunta o pide la persona que interactúa con el modelo.
assistant: muestra cómo debería responder el modelo, sirviendo como ejemplo del comportamiento esperado.

En la práctica, podrías configurar al asistente como agente de marketing, soporte técnico o cualquier otro rol. Lo importante es que las preguntas y respuestas que vengan después estén alineadas con ese contexto inicial.

¿Cómo se construye una llamada a chat completions paso a paso?

El flujo básico arranca llamando a openai.ChatCompletion.create() y pasándole dos parámetros esenciales: el modelo y la lista de mensajes [01:40].

Selecciona el modelo, en este caso gpt-3.5-turbo.
Arma la lista messages con el rol system y su contenido.
Agrega un mensaje con rol user haciendo una pregunta, por ejemplo: "¿Quién ganó el Mundial de fútbol?".
Incluye un mensaje con rol assistant mostrando la respuesta esperada: "El Mundial de 2022 lo ganó Argentina".
Cierra con una nueva pregunta del user, como "¿Dónde se jugó?", para que el modelo continúe el flujo.

Para leer la respuesta de forma limpia, accede a response.choices[0].message.content. Esto te devuelve solo el texto generado, sin todo el objeto que retorna OpenAI.

¿Cómo afecta la temperatura a las respuestas del modelo?

La temperatura controla cuánta libertad creativa tiene el modelo al generar texto, y su impacto se nota mucho cuando ya configuraste roles claros [05:30].

Con una temperatura de 0.2, el modelo se vuelve más restrictivo y tiende a dar respuestas extensas pero apegadas al contexto. Por ejemplo, ante la pregunta "¿Dónde se jugó?", devolvió: "El mundial de fútbol de 2022 se jugó en Catar" y agregó información adicional coherente.

Con temperatura en 1, la libertad aumenta tanto que el modelo puede equivocarse. En la prueba, respondió que "el mundial de fútbol de 2022 aún no se ha celebrado", una respuesta incorrecta.

¿Qué son las alucinaciones en modelos de OpenAI? Son respuestas inventadas o incorrectas que el modelo genera cuando no encuentra información clara o cuando la temperatura le da demasiada libertad creativa. Pueden parecer convincentes, pero no son confiables.

Por eso, ajustar la temperatura según el caso de uso es clave: bajo para tareas factuales, alto para creatividad.

¿Qué otros parámetros y recursos vale la pena explorar?

Más allá del modelo y los mensajes, la documentación de chat completions cubre temas que afectan directamente tu producto y tu presupuesto.

Formato de respuesta: define cómo recibes el output del modelo.
Manejo de tokens: controla los costos asociados al prompt y al resultado generado.
API references: en la sección chat encuentras todos los parámetros disponibles para personalizar las llamadas.

Un detalle importante: si no defines el parámetro de máximo de tokens, las respuestas pueden variar mucho en longitud. Definirlo te ayuda a mantener consistencia y a controlar el gasto.

La estructura básica siempre será la misma: llamas a la funcionalidad, eliges el modelo, y pasas los ejemplos de conversación empezando por el rol system. A partir de ahí, puedes sumar tantos pares user-assistant como necesites para guiar el comportamiento.

Con esto ya tienes la base para construir asistentes con contexto. El siguiente paso natural es llevarlo más lejos con fine tuning, que te permite entrenar un modelo de OpenAI con tus propios datos. ¿Qué tipo de asistente quieres construir tú? Cuéntame en los comentarios.

Mateo Montoya Henao

Estudiante

Chat Completions en OpenAI

El Chat Completions API de OpenAI es una herramienta poderosa para integrar inteligencia artificial en aplicaciones que requieren interacciones conversacionales. Este API permite generar respuestas a partir de un conjunto de mensajes proporcionados por el usuario, sin necesidad de mantener un contexto de conversación persistente.

Características Principales

Fácil de Usar: No requiere configuración avanzada y es ideal para desarrolladores que necesitan funcionalidades básicas de inteligencia artificial.
Independencia de Mensajes: Cada solicitud es procesada de manera independiente, lo que la hace adecuada para escenarios de consulta-respuesta simples.
Flexibilidad: Permite a los usuarios controlar la dirección de la conversación basándose en la entrada proporcionada.

Ejemplos de Uso

Ejemplo 1: Bot de Soporte al Cliente

Un bot de soporte al cliente puede responder preguntas frecuentes (FAQ) o proporcionar detalles específicos de productos de manera instantánea, sin necesidad de mantener el historial de conversación.

import openai

response = openai.Completion.create(
    engine="text-davinci-003",
    prompt="How do I reset my password?",
    max_tokens=50
)
print(response.choices[0].text.strip())
```Ejemplo 2: Bot de Información del Tiempo

Un bot puede proporcionar actualizaciones del tiempo en respuesta a consultas del usuario, sin necesidad de mantener un contexto de conversación.

```js
import openai

response = openai.Completion.create(
    engine="text-davinci-003",
    prompt="What is the weather like in Paris today?",
    max_tokens=50
)
print(response.choices[0].text.strip())
```Ejemplo 3: Asesor de Productos

Un asesor de productos puede proporcionar recomendaciones específicas basadas en las preferencias o necesidades del usuario, sin necesidad de mantener un contexto de conversación.

```js
import openai

def product_advisor(question):
    prompt = f"Customer: {question}\nAdvisor: Based on your preferences, I recommend "
    response = openai.Completion.create(
        engine="text-davinci-003",
        prompt=prompt,
        max_tokens=100,
        temperature=0.7
    )
    return response.choices[0].text.strip()

# Ejemplo de uso
print(product_advisor("I need a durable and lightweight hiking backpack."))
```Ventajas

* **Implementación Rápida**: Es relativamente fácil de implementar y usar, requiriendo una configuración mínima.
* **Ideal para Respuestas Inmediatas**: Es adecuado para aplicaciones que requieren respuestas inmediatas sin contexto.
* **Control del Usuario**: El usuario tiene un control significativo sobre la dirección de la conversación basándose en la entrada proporcionada.

#### Limitaciones

* **Falta de Contexto**: No puede mantener el contexto de la conversación a lo largo de varias interacciones.
* **Dependencia de la Entrada del Usuario**: La calidad y relevancia de las respuestas dependen fuertemente de la entrada proporcionada por el usuario.
* **Ejecución Sincrónica**: Procesa cada solicitud de manera independiente y no puede manejar múltiples solicitudes en paralelo.

En resumen, el Chat Completions API de OpenAI es una herramienta versátil y fácil de usar para aplicaciones que requieren respuestas rápidas y sin contexto. Sin embargo, para aplicaciones que necesitan un contexto persistente y múltiples interacciones, puede ser necesario considerar otras soluciones como el **Assistants API**.

Paolo Joaquin Pinto Perez

Mauricio Martínez Orjuela

Luis Rogelio Reyes Hernandez

Kevin Costa

Camilo Moreno

Andrés Felipe Díaz Rodríguez

Endy Bermúdez R

Jason Nicolas Arias

Alexander Armúa Abregu

Ivan Rodríguez Coapio

John Fredy Ramirez Bedoya

Jose Daniel Velasquez H

Company_admin

Daniel Fernando Murcia Perdomo

Sebastian Gaviria

Fabian Villada

Elver Tobo

Orlando castellanos

Luis Antonio Aguilar

Brayan Jiménez

Pablo Martinez

Jeremy Quintero Rocha

Raul Mercado

NESTOR IVAN RONCANCIO CABALLERO

Pedro Matías Cuevas Meza

Roles en Chat Completions con GPT-3.5

OpenAI API

Análisis de sentimiento con la API de OpenAI

Uso de la Documentación de OpenAI para Fine Tuning y Text Completion