Cuándo hacer fine tuning a modelos OpenAI

Curso de Desarrollo de Chatbots con OpenAI

Contenido del curso

OpenAI API

Fine-tuning de modelos de OpenAI

Integración de modelo a aplicación de chat

Conclusión

24
Proyectos de Fine Tuning y Procesamiento de Lenguaje Natural
02:58 min

Tomar examen

Cuándo hacer fine tuning a modelos OpenAI

Resumen

El fine tuning en modelos de OpenAI consiste en reentrenar un modelo ya existente con datos nuevos para ajustarlo a tareas específicas. Antes de aplicarlo conviene saber cuándo realmente vale la pena y cuándo otras técnicas resuelven mejor el problema, sobre todo si estás construyendo un chatbot o un asistente.

¿Cuándo no deberías hacer fine tuning a un modelo de OpenAI?

La primera pregunta no es cómo hacerlo, sino si de verdad lo necesitas. Muchas veces no.

Antes de tocar el modelo, conviene agotar tres caminos más rápidos y baratos:

Prompt engineering: las técnicas de diseño de prompts resuelven la mayoría de los casos al trabajar con estos modelos. Iterar y ajustar tus prompts con feedback continuo suele dar mejores resultados de los que esperas.
Encadenamiento de prompts: puedes armar una secuencia de prompts con diferentes contenidos hasta llegar a la salida esperada. Aquí entran frameworks como LangChain o LlamaIndex.
Function calling: una característica de la API de OpenAI que permite hacer llamados a funciones propias para que el modelo consuma datos con estructura específica.

¿Qué es prompt engineering? Es la práctica de diseñar y ajustar las instrucciones que le das a un modelo para que entregue mejores respuestas, sin necesidad de reentrenarlo.

Y aquí viene lo interesante: aunque después decidas hacer fine tuning, todo el trabajo previo de prompts no se pierde. Le sigue sirviendo al modelo una vez que lo reentrenas.

¿Cuándo sí conviene hacer fine tuning en OpenAI?

Hay casos de uso bastante claros donde el fine tuning es la mejor jugada. La idea es identificar si tu problema cae en alguno de estos escenarios.

¿Qué casos justifican entrenar el modelo con tus propios datos?

Estos son los escenarios donde el fine tuning se vuelve la opción correcta:

Estilo, tono o formato definidos. Si tienes una forma particular de hablarle a tus clientes y estás creando un chatbot, el modelo se acostumbrará a responder con esa voz.
Mejorar la confiabilidad de la salida. Cuando manejas información muy específica, pasarla en el fine tuning ayuda a que las respuestas sean más confiables.
Corregir fallas al seguir instrucciones complejas. Si tu modelo no logra ejecutar varios procesos encadenados solo con prompts, entrenarlo con datos nuevos puede solucionarlo.
Muchos casos especiales. Esos escenarios que hay que mirar con lupa porque son muy específicos. Solo viendo ejemplos claros de cómo manejarlos el modelo aprende a resolverlos.
Tareas difíciles de articular en una sola solicitud. Cuando el modelo necesita más contexto del que cabe en un prompt, los datos de fine tuning aportan esa información extra.

¿Qué es fine tuning? Es el proceso de tomar un modelo ya entrenado y reentrenarlo con un dataset nuevo para que se especialice en tareas concretas.

¿Por qué el fine tuning encaja tan bien en chatbots y asistentes?

Todos los casos anteriores aparecen seguido en chatbots y asistentes virtuales. Y aunque podrías recurrir a encadenamiento de prompts o a técnicas más avanzadas como una base de datos vectorial para montar un Retrieval-Augmented Generation (RAG), el fine tuning suele ser un buen primer paso.

¿La razón? Cuando quieres darle al modelo un estilo propio, un formato fijo o tareas muy específicas, esos rasgos solo se aprenden integrando los datos directamente al modelo.

¿Cuándo elegir fine tuning en lugar de RAG? Usa fine tuning cuando necesitas estilo, tono o comportamiento específicos. Usa RAG cuando lo que buscas es traer información actualizada o externa al modelo.

En el camino de construir un PlatziBot, un chatbot de atención a estudiantes que responde con información específica de Platzi y con la voz con la que le hablarías a tus estudiantes, el fine tuning aparece como una opción natural para arrancar.

El proceso, además, es sencillo, accesible y de bajo costo, así que el siguiente paso es entrar de lleno al flujo completo de fine tuning sobre modelos de OpenAI. ¿En qué caso de uso lo aplicarías tú primero? Cuéntalo en los comentarios.

Mauricio Martínez Orjuela

Estudiante

Me surgió la pregunta

El concepto de fine-tuning es parecido a RAG?

y ChatGPT me responde lo siguiente:

El concepto de fine-tuning (ajuste fino) y RAG (Retrieval-Augmented Generation) son técnicas distintas en el ámbito de los modelos de lenguaje, aunque ambas se enfocan en mejorar la capacidad de los modelos para responder preguntas o generar texto relevante. Aquí te explico las diferencias y similitudes clave entre ellos:

Fine-tuning: ¿Qué es?

El fine-tuning es el proceso de ajustar un modelo preentrenado (como GPT) utilizando un conjunto de datos específico para un caso de uso concreto. El objetivo es especializar el modelo para tareas o dominios particulares.

Características principales:

Entrenamiento adicional:
- Se entrena el modelo con datos adicionales relevantes para la tarea, ajustando los pesos del modelo.
Dependencia del entrenamiento:
- Los datos del fine-tuning se integran permanentemente en el modelo. Después del ajuste fino, el modelo tiene el conocimiento directamente incorporado.
Requiere recursos computacionales:
- Realizar fine-tuning puede ser costoso y requiere infraestructura adecuada.
Especialización:
- Ideal para casos en los que el modelo necesita responder consistentemente en un dominio específico (legal, médico, etc.).

Ejemplo práctico:

Un modelo GPT ajustado con datos legales podría responder preguntas legales con un lenguaje técnico y específico.

RAG (Retrieval-Augmented Generation): ¿Qué es?

Retrieval-Augmented Generation es una técnica que combina la generación de texto de un modelo de lenguaje (como GPT) con un sistema de recuperación de información. En lugar de ajustar el modelo, se amplía su capacidad al proporcionarle información externa en tiempo real.

Características principales:

Uso de datos externos:
- El modelo accede a una base de datos, documentos o información externa en el momento de la consulta.
No modifica el modelo:
- La recuperación de información no requiere ajustar los pesos del modelo. Los datos se usan como contexto para generar una respuesta.
Flexibilidad y actualización:
- Ideal para dominios donde la información cambia frecuentemente (noticias, datos financieros, etc.).
Eficiencia computacional:
- Es menos costoso que el fine-tuning porque no implica entrenar el modelo de nuevo.

Ejemplo práctico:

Un sistema RAG podría buscar información actualizada en una base de datos sobre regulaciones legales y usarla para responder una pregunta específica.

Comparación: Fine-tuning vs RAG

AspectoFine-tuningRAGBase de conocimientoIntegrado directamente en el modelo.Recuperado dinámicamente de fuentes externas.Actualización de datosRequiere reentrenar el modelo.Los datos pueden actualizarse en tiempo real.Costo computacionalAlto (durante el ajuste fino).Bajo (no requiere reentrenamiento).FlexibilidadMenos flexible (dominio fijo).Muy flexible (cualquier dominio o dato externo).Velocidad de respuestaRespuesta inmediata, sin consultas externas.Puede ser más lenta por la búsqueda de información.Uso típicoTareas específicas y recurrentes (e.g., chatbot médico).Dominios dinámicos o grandes repositorios de datos.

¿Son parecidos?

No son directamente comparables porque abordan problemas diferentes:

Fine-tuning es útil cuando necesitas que el modelo sea experto en un dominio específico y no dependes de datos externos dinámicos.
RAG es ideal cuando necesitas respuestas basadas en datos que cambian frecuentemente o son demasiado extensos para integrarse directamente en el modelo.

¿Pueden combinarse?

¡Sí! De hecho, es común combinar ambas técnicas:

Fine-tuning para especializar un modelo en un dominio específico.
RAG para permitirle acceder a información actualizada en tiempo real.

Si necesitas ayuda para implementar alguna de estas técnicas o quieres profundizar más en su aplicación, ¡puedes preguntar! 😊

Paolo Joaquin Pinto Perez

Patricio Sánchez Fernández

Daniel Cutipa

Gabriel Ichcanziho Pérez Landa

Juan R. Vergara M.

Jaime Joaquín Gonzalez Bosch

Mateo Montoya Henao

Aldo Andres Delgado Castillo

david alvarez

Diego Jurado

Jose Miguel Lopez

Arístides Pérez Hernández

Carlo Wesley Martinez Ortiz

Rommer Batista

Daniel Omar Perez Godinez

Gildder Guerrero Ramirez

John Fredy Ramirez Bedoya

Eduardo Enrique Morales Martínez

Diego Alejandro Lesmes

Hector M. Vazquez Morales

Nelson Andrés Loyola Salas

Cuándo hacer fine tuning a modelos OpenAI

OpenAI API

Análisis de sentimiento con la API de OpenAI

Uso de la Documentación de OpenAI para Fine Tuning y Text Completion

Roles en Chat Completions con GPT-3.5

Temperatura y top P en la API de OpenAI

Juego de adivinanza de animales con OpenAI en Python

Soft limit y hard limit en OpenAI

Actualización de Modelos y Funcionalidades de OpenAI

Fine-tuning de modelos de OpenAI