Cómo elegir el modelo GPT correcto

Curso de OpenAI API

Contenido del curso

Open AI API

1
Qué es la API de OpenAI y para qué sirve
02:08 min

Fundamentos de la API de OpenAI

Control de Respuestas

Desarrollo de 'PlatziVision'

Fine-Tuning

OpenAI Batch

OpenAI Assistants

Proyecto Final y Cierre del Curso

Tomar examen

Cómo elegir el modelo GPT correcto

Resumen

Elegir el modelo de OpenAI correcto no se trata de usar siempre el más nuevo. Detrás de nombres como GPT-4o, GPT-4o Mini u o1 Preview hay diferencias de razonamiento, costo y ventana de contexto que cambian por completo el resultado de tu proyecto. Esta guía te ayuda a decidir cuál conviene para tu caso de uso.

¿Qué criterios definen al mejor modelo de OpenAI?

Antes de mirar nombres, mira variables. Hay tres factores que pesan al comparar modelos de lenguaje y casi nunca apuntan al mismo ganador.

Razonamiento: qué tan bien resuelve tareas complejas, medido con benchmarks que comparan modelos entre sí.
Costo: los modelos más inteligentes suelen ser los más caros. No siempre necesitas el tope de gama.
Ventana de contexto: cuánta información puede procesar el modelo a la vez. Hoy importa menos porque las ventanas crecieron muchísimo, pero sigue siendo un dato a vigilar.

¿Qué es un token? Un token es una unidad con la que el modelo predice texto. No equivale a un carácter: la frase Hola, Plaxi tiene 12 caracteres pero solo 4 tokens [2:00].

Antes los modelos como GPT-3.5 Turbo se quedaban sin aire cerca de los 8.000 o 9.000 tokens. Hoy hablamos de hasta 100.000 tokens de capacidad, así que rara vez te vas a topar con ese muro.

¿Cuál es la diferencia entre GPT-3.5, GPT-4, GPT-4o y GPT-4o Mini?

Dentro de la familia GPT cada modelo tiene un propósito distinto, y entender la jerarquía te ahorra dinero y dolores de cabeza.

GPT-3.5 Turbo y GPT-4

GPT-3.5 Turbo fue el modelo que llegó con ChatGPT: generación de texto apta para chat, bajo costo y útil para tareas simples como resúmenes.

GPT-4 cambió el juego al mejorar el razonamiento y duplicar la ventana de contexto. La contraparte es clara: cuesta mucho más. Por eso conviene reservarlo para tareas exigentes como programación.

GPT-4o y GPT-4o Mini

GPT-4o trajo soporte de imágenes desde su lanzamiento, una ventana de contexto hasta 14 veces mayor que GPT-4 y un costo menor. Para la mayoría de los casos, es preferible a GPT-4 [4:30].

GPT-4o Mini razona mejor que GPT-3.5 Turbo, ofrece mayor ventana de contexto y cuesta menos. Es ideal para tareas rápidas, simples y de bajo volumen donde no necesitas potencia máxima.

¿Qué aporta la serie o1 frente a GPT-4o?

Los modelos o1 nacieron para resolver un problema concreto del razonamiento. Cuando un modelo de lenguaje enfrenta, por ejemplo, una ecuación matemática larga, tiende a fallar si lo fuerzas a responder corto. La técnica que mejora esto se llama chain of thought o cadena de pensamiento: obligas al modelo a explicar paso a paso antes de dar el resultado.

¿Qué es chain of thought? Es una estrategia que fuerza al modelo a pensar paso por paso antes de responder. Aumenta la precisión en tareas de razonamiento como matemáticas o lógica.

OpenAI integró esa estrategia por defecto en la serie o1.

o1 Preview: razonamiento muy superior a GPT-4o, respuestas más extensas y tiempos de respuesta más largos porque piensa más antes de contestar.
o1 Mini: usa la misma estrategia de razonamiento, cuesta menos que o1 Preview, pero tiene un conocimiento del mundo más limitado, así que no es tan apto para cualquier tarea.

¿Cómo manejar versiones y modelos obsoletos en OpenAI?

Los modelos se actualizan constantemente: razonamiento, velocidad y conocimiento del mundo cambian con el tiempo. Para diferenciar versiones, OpenAI les coloca un código de fecha. Por ejemplo, al 2 de diciembre de 2024, GPT-4 redirige a GPT-4-0613, es decir la versión del 13 de junio. Antes existió GPT-4-0314, totalmente distinta [9:30].

La recomendación práctica:

Usa el código oficial (ej. gpt-4o) para la mayoría de los proyectos.
Usa el código versionado (ej. gpt-4-0613) cuando necesites estabilidad garantizada.

OpenAI también marca modelos como obsoletos. Si uno de los que usas entra en esa lista, consulta la guía de deprecations de OpenAI, que indica qué modelo lo reemplaza. Por ejemplo, GPT-4 32K hoy se reemplaza por GPT-4o.

¿Qué herramientas sirven para comparar modelos de IA?

Decidir a ojo no escala. Hay dos recursos que te dan datos duros para elegir.

Context.ai: compara dos modelos lado a lado en input context window, tokens de salida, fecha de lanzamiento y conocimiento del mundo. GPT-4o llega hasta octubre de 2023, mientras que GPT-4 se queda en septiembre de 2021 [12:30].
Chatbot Arena (LMArena.ai): muestra un leaderboard donde los desarrolladores votan modelos. Ahí puedes ver cómo se posicionan Gemini, GPT-4o, o1 Preview y o1 Mini frente al resto del mercado.

Para cerrar con una guía rápida según tu caso: