Resumen

Cuando ya dominas la regresión logística binaria y su característica curva en forma de S, surge una pregunta inevitable: ¿cómo clasificar más de dos categorías? La respuesta está en dos estrategias fundamentales que transforman un problema multiclase en algo manejable, cada una con sus propias ventajas y consideraciones técnicas.

¿Cómo funciona la estrategia One versus Rest en clasificación multiclase?

La técnica One versus Rest (también conocida como One vs All) es la forma más intuitiva de extender la regresión logística a múltiples clases [01:07]. Su principio es sencillo: si tienes tres clases posibles —por ejemplo, triángulos, equis y cuadrados—, entrenas un clasificador binario por cada clase.

  • En el primer modelo, la pregunta es: ¿es triángulo o es otra cosa?
  • En el segundo: ¿es cuadrado o es otra cosa?
  • En el tercero: ¿es equis o es otra cosa?

Cada modelo devuelve una probabilidad. Al final, simplemente se vota por la clase con mayor probabilidad y esa será la predicción [02:07]. Así, un problema de clasificación múltiple se reduce a varios problemas de clasificación binomial resueltos en paralelo.

¿Qué es la regresión logística multinomial y cómo se aplica Softmax?

La segunda estrategia se llama Multinomial Logistic Regression [02:24]. A diferencia de One versus Rest, aquí todas las clases se evalúan simultáneamente dentro de un solo modelo. La clave está en la función Softmax.

¿Qué papel juegan los logits en la salida del modelo?

El modelo genera tantas salidas como clases existan. Esas salidas iniciales se denominan logits [03:04]: valores continuos que no representan directamente una probabilidad, pero contienen la distribución de datos necesaria para calcularla.

Al aplicar la función Softmax sobre esos logits, se obtiene la probabilidad de pertenencia a cada clase. Por ejemplo, si tienes tres salidas, podrías obtener valores como 0.7, 0.2 y 0.1 [03:21]. La suma siempre es igual a uno, lo que representa el 100% de probabilidad. Softmax selecciona la clase con mayor valor y esa es la predicción final.

¿Qué son los solvers y cómo elegir el adecuado?

Los solvers son un parámetro dentro de la regresión logística que define qué algoritmo matemático optimiza el descenso del gradiente para minimizar la función de costo [03:55]. Entre las opciones disponibles se encuentran:

  • Liblinear.
  • LBFGS.
  • Newton-CG.
  • SAG.
  • SAGA.

No todos los solvers son compatibles con ambas estrategias multiclase. Existe una tabla de compatibilidad que relaciona el tipo de regresión (multinomial u One versus Rest), el tipo de regularización (L1, L2 o sin penalidad) y los solvers disponibles [04:18]. Por ejemplo, si usas regresión multinomial con regularización L2, no puedes emplear Liblinear, pero sí el resto de opciones.

Un dato práctico importante: si trabajas con datasets grandes, los solvers recomendados son SAG y SAGA, ya que ofrecen mejor rendimiento en términos de velocidad [05:00]. Los demás solvers pueden funcionar correctamente, pero no tendrán un comportamiento óptimo con volúmenes elevados de datos.

¿Cuándo usar cada estrategia de clasificación multiclase?

La elección entre One versus Rest y la regresión multinomial depende del contexto. One versus Rest es más simple de implementar y comprender, mientras que la regresión multinomial con Softmax evalúa todas las clases de forma conjunta, lo que puede capturar mejor las relaciones entre ellas. Combinado con la selección correcta del solver y el tipo de regularización, puedes construir modelos de clasificación multiclase robustos y eficientes.

Si ya tienes clara la teoría, el siguiente paso es ponerla en práctica resolviendo un problema de clasificación múltiple desde cero. ¿Qué estrategia crees que funcionará mejor en tu caso? Comparte tu experiencia en los comentarios.