Configuración de temperatura, Top P y Top K en modelos de lenguaje

Clase 2 de 4Curso de tips y trucos de IA

Resumen

Cuando trabajamos con modelos de lenguaje grande (LLM), generalmente ajustamos dos aspectos cruciales para mejorar nuestras respuestas: el prompt y la temperatura. Sin embargo, existen más hiperparámetros que podemos cambiar, ofreciéndonos flexibilidad para obtener resultados diversos, creativos o precisos según sea nuestro objetivo.

¿Qué es la temperatura en los modelos de lenguaje grande?

La temperatura determina el grado de creatividad o aleatoriedad en las respuestas del modelo. Normalmente, varía entre 0 (muy estable y predecible) y 2 (extremadamente creativo).

Cuando se mantiene en el valor estándar, que es alrededor de 1, obtenemos respuestas promedio del conjunto de entrenamiento del LLM. Si aumentamos la temperatura:

  • El modelo selecciona tokens menos probables.
  • Las respuestas serán más variadas, con textos y comentarios más detallados y creativos, tal como se observa en ejemplos de código en Python.

¿Qué es y cómo ajustar Top P y Top K?

Además de la temperatura, podemos controlar la respuesta usando otros parámetros como Top P y Top K.

¿Qué es Top P (Nucleus Sampling)?

Top P dirige al modelo a usar solo los tokens cuya probabilidad acumulativa cumpla un umbral determinado. Si ajustamos este valor:

  • Un Top P bajo (0.5) limita al modelo a elegir entre pocos tokens altamente probables.
  • Un Top P alto (0.95 o más) permite elegir entre una variedad más amplia de opciones, aumentando diversidad.

La configuración recomendada para generar código podría ser Top P de 0.80 junto con una temperatura moderada (0.92).

¿Qué significa Top K?

Disponible en algunos modelos como los creados por Anthropic y en plataformas como Vertex AI, el Top K especifica el número exacto de tokens candidatos que el modelo considera al generar respuestas. Ajustando este valor:

  • Un Top K pequeño promueve respuestas más deterministas.
  • Un Top K grande genera respuestas más variadas.

¿Cómo combinar temperatura, Top P y Top K según el objetivo?

La combinación ideal de estos parámetros depende de la tarea que estés realizando:

  • Para textos creativos como historias de ciencia ficción, considera:

  • Temperatura alta.

  • Top K elevado.
  • Top P cercano al máximo.

  • Para tareas técnicas precisas como código o cálculos matemáticos:

  • Reduce significativamente la temperatura.

  • Utiliza un valor relativamente bajo de Top P.

La experimentación continua es esencial para adaptarse a las fortalezas particulares de cada modelo y tarea específica. Por ejemplo, otros modelos incluyen hiperparámetros adicionales como present penalty o repeat penalty, penalizando repeticiones de palabras o frases para optimizar resultados.

Recuerda la importancia de practicar y experimentar periódicamente con estos ajustes para mejorar significativamente tus resultados con modelos de inteligencia artificial.