Temperatura y top P en la API de OpenAI

Curso de Desarrollo de Chatbots con OpenAI

Contenido del curso

OpenAI API

Fine-tuning de modelos de OpenAI

Integración de modelo a aplicación de chat

Conclusión

24
Proyectos de Fine Tuning y Procesamiento de Lenguaje Natural
02:58 min

Tomar examen

Temperatura y top P en la API de OpenAI

Resumen

Ajustar los parámetros de un modelo de OpenAI cambia por completo la calidad de la respuesta que obtienes. Si ya sabes cargar el modelo y enviar un prompt, el siguiente paso es dominar temperatura, top P, max tokens y N para controlar longitud, libertad creativa y número de resultados.

¿Qué hace el parámetro max tokens en OpenAI?

El parámetro max tokens define la longitud máxima de la respuesta. Si lo configuras en 100, obtendrás una respuesta más amplia que con 50, porque le estás dando al modelo el doble de espacio para desarrollar la idea.

En el ejemplo del prompt "¿qué es IA?", al duplicar el número de tokens, la respuesta pasa de un texto corto a una explicación más detallada que arranca con: "La inteligencia artificial, IA, es un campo de la informática que se centra…".

¿Qué es un token en OpenAI? Es la unidad mínima en la que el modelo divide el texto. Más tokens permitidos significa respuestas más largas, pero también mayor costo de uso.

¿Cómo afecta la temperatura a las respuestas del modelo?

La temperatura controla cuánta libertad tiene el modelo para elegir entre sus posibles respuestas. Acepta valores entre 0 y 2, aunque el rango más usado va de 0 a 1.

Con valores cercanos a cero, el modelo se vuelve restrictivo y elige siempre la opción con mayor probabilidad. Con valores cercanos a uno, le das libertad para diversificar y devolver respuestas más creativas.

Ejemplo práctico de temperatura con un prompt real

Imagina el prompt: "mi curso favorito de Platzi es". El modelo evalúa tres continuaciones posibles con estas probabilidades:

Curso de API de OpenAI: 60%.
Curso de fundamentos de ETL con Python y Pentaho: 30%.
Curso de Python, PIP y entornos virtuales: 10%.

Si configuras la temperatura en 0, el modelo casi siempre escoge la opción del 60%. Si la subes a 0.3, sigue eligiendo la más probable la mayoría de las veces, pero ya puede saltar a la del 30%. Con 0.8, las respuestas se diversifican y empiezan a aparecer variaciones reales.

En el ejercicio con "¿qué es IA?", al cambiar la temperatura de 0.3 a 0.8, el inicio se mantiene parecido, pero hacia el final la respuesta varía: en una versión dice "se centra" y en otra dice "abarca". Esa es la huella de la temperatura.

¿Para qué sirven top P y N en la API de OpenAI?

El parámetro top P funciona como un filtro previo. Si lo pones en 0.1, le estás diciendo al modelo que solo considere el 10% de las respuestas más probables. Con top P igual a 1, abres el universo completo de opciones, y dentro de ese universo, la temperatura decide qué tan restrictivo o libre es.

El parámetro N define cuántas respuestas quieres recibir por cada prompt. Si N es igual a 2, el modelo te devolverá dos resultados distintos para la misma pregunta.

En el ejemplo de "quién descubrió América" con N igual a 2, el modelo devuelve dos respuestas diferentes: una empieza con "Cristóbal Colón descubrió América en 1492" y la otra con "El descubrimiento de América fue realizado por el navegador italiano…". Misma pregunta, dos formulaciones distintas.

¿Cuál es la diferencia entre temperatura y top P? Top P filtra cuántas opciones entran al juego según probabilidad acumulada. La temperatura decide qué tan aleatoria es la elección dentro de ese conjunto. Se complementan.

Cómo combinar los parámetros para obtener mejores resultados

La receta no es única, depende de lo que necesites. Si buscas respuestas precisas y consistentes, baja la temperatura. Si buscas creatividad o variedad, súbela.

Una guía rápida para empezar:

Define primero max tokens según la longitud que esperas en la respuesta.
Ajusta la temperatura entre 0 y 1 según qué tan creativa quieras la salida.
Usa top P para acotar el universo de opciones probables.
Configura N si necesitas comparar varias respuestas en una sola corrida.

Los caracteres extraños que a veces aparecen en las respuestas, como en palabras con acentos, son un detalle de codificación que verás cuando trabajes con texto en español. No afectan los parámetros, pero conviene tenerlo presente al imprimir resultados.

Toda esta información, junto con parámetros adicionales que puedes explorar, está documentada en la sección de API reference de OpenAI, específicamente en completions. Ahí encuentras el detalle técnico de cada parámetro y otros menos comunes con los que puedes experimentar.

El reto ahora es tuyo: modifica los parámetros, prueba combinaciones distintas y observa cuál se adecua mejor a tu caso. ¿Qué configuración te dio el resultado más útil? Compártelo en los comentarios.

Francisco Espinoza

Estudiante

Alguien me podria explicar porfavor a mas a detalle lo que distingue en la practica a top_p de temperature?

Mateo Montoya Henao

Estudiante

Claro, aquí tienes un análisis detallado de cómo distinguen en la práctica los parámetros top_p y temperature en el OpenAI Chat Completions API:

1. Temperature (Temperatura)

El parámetro temperature controla la "creatividad" o la aleatoriedad del texto generado. Afecta la distribución de probabilidades de los tokens posibles en cada paso de generación.

Valores bajos (0.0 - 0.5):
- Efecto: Hace que el modelo sea más determinista y enfocado, seleccionando tokens más probables.
- Uso: Ideal para tareas que requieren precisión, como la generación de código o respuestas factuales.
- Ejemplo: temperature=0.2 generará respuestas más precisas y menos creativas.
Valores altos (0.5 - 2.0):
- Efecto: Hace que el modelo sea más creativo y diverso, seleccionando tokens menos probables.
- Uso: Ideal para tareas que requieren creatividad, como escritura creativa o generación de historias.
- Ejemplo: temperature=1.5 generará respuestas más creativas y variadas.

2. Top_p (Núcleo)

El parámetro top_p utiliza una técnica llamada "núcleo" o "núcleo de probabilidad" para controlar la aleatoriedad del texto generado.

Valores bajos (0.0 - 0.5):
- Efecto: Limita la selección a los tokens más probables, resultando en respuestas más deterministas y enfocadas.
- Uso: Ideal para tareas que requieren precisión y coherencia, como la generación de código.
- Ejemplo: top_p=0.2 considera solo los tokens que representan el 20% de la masa de probabilidad más alta.
Valores altos (0.5 - 1.0):
- Efecto: Incorpora un espectro más amplio de tokens, resultando en respuestas más creativas y variadas.
- Uso: Ideal para tareas que requieren creatividad y diversidad, como escritura creativa.
- Ejemplo: top_p=0.9 considera un espectro más amplio de tokens, resultando en respuestas más variadas.

Comparación y Uso Combinado

Ambos parámetros pueden usarse de manera independiente o combinada para lograr diferentes niveles de creatividad y control en las respuestas generadas.

Low temperature + Low top_p: Produce respuestas muy determinísticas y enfocadas, ideal para tareas precisas.
High temperature + High top_p: Produce respuestas muy creativas y variadas, ideal para tareas creativas.
Medio temperature + Medio top_p: Produce respuestas equilibradas en términos de creatividad y coherencia, ideal para conversaciones naturales.

Ejemplo Práctico

Supongamos que queremos generar respuestas para una aplicación de chat que requiere respuestas equilibradas en términos de creatividad y coherencia. Podríamos usar los siguientes parámetros:

import openai

response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "¿Cuál es la capital de Francia?"}],
    temperature=0.5,
    top_p=0.7,
    n=1
)

print(response.choices[0].message.content)
```En este ejemplo, `temperature=0.5` y `top_p=0.7` proporcionan un equilibrio entre creatividad y coherencia, resultando en respuestas naturales y equilibradas.

### Conclusión

El `temperature` controla la distribución de probabilidades de los tokens posibles, afectando la creatividad o la determinación de las respuestas. El `top_p` limita la selección de tokens a los más probables, afectando la coherencia y la diversidad de las respuestas. Al ajustar estos parámetros, puedes lograr diferentes niveles de creatividad y control en las respuestas generadas, dependiendo de las necesidades específicas de tu aplicación.

Alexander Velasquez

Paulo Esteban Orsini

Jonathan Vera Segura

Andrés Felipe Díaz Rodríguez

Patricio Sánchez Fernández

Fernando Josué Rodríguez Herrera

Endy Bermúdez R

Raul Mercado

John Fredy Ramirez Bedoya

LUIS ELISEO RODRIGUEZ ARGUELLO

Enrique Valdés García

Angelica Cassano

Mauricio Martínez Orjuela

Nelson Chicas

Pepe Sosa

Juan Alvaro Montoya Villada

VICTOR MANUEL MURILLO CAMAYO

Joseph Corona

Willian Diaz Pabón

Pablo Mederos

Hector M. Vazquez Morales

Fidel Parabacuto

Temperatura y top P en la API de OpenAI

OpenAI API

Análisis de sentimiento con la API de OpenAI

Uso de la Documentación de OpenAI para Fine Tuning y Text Completion

Roles en Chat Completions con GPT-3.5