RMSE y R cuadrado para evaluar modelos de regresión

Clase 17 de 20Curso de Fundamentos para AI y Machine Learning

Resumen

Objetivo del profesor

El objetivo de esta clase era que los estudiantes comprendieran dos métricas fundamentales para evaluar modelos de regresión: RMSE (Root Mean Square Error) y R² (coeficiente de determinación), incluyendo cómo calcularlas, interpretarlas y utilizarlas de manera complementaria para evaluar el rendimiento de modelos de machine learning.

Habilidades desarrolladas

  • Evaluación de modelos: Capacidad para medir y comparar el rendimiento de diferentes modelos de regresión
  • Interpretación de métricas: Habilidad para entender qué significan los valores de RMSE y R² en contextos específicos
  • Programación en Python: Implementación práctica de cálculos de métricas usando librerías como scikit-learn
  • Análisis comparativo: Capacidad para evaluar múltiples modelos y determinar cuál es más adecuado
  • Pensamiento crítico: Comprensión de que ninguna métrica cuenta toda la historia por sí sola

Conceptos clave

  • RMSE (Root Mean Square Error): [00:08] Raíz del error cuadrático medio que mide el tamaño promedio de los errores en las mismas unidades que la variable objetivo
  • R² (R cuadrado): [00:12] Coeficiente de determinación que mide qué proporción de la variabilidad de los datos puede explicar el modelo
  • MSE (Mean Square Error): [01:18] Error cuadrático medio, paso intermedio para calcular RMSE
  • Elevación al cuadrado: [01:04] Técnica para eliminar signos positivos y negativos de los errores
  • Variabilidad: [02:01] Dispersión de los datos que el modelo intenta explicar
  • Relación lineal fuerte vs débil: [04:02] Diferentes grados de correlación entre variables
  • Análisis de residuos: [08:06] Método complementario para evaluar modelos

Palabras clave importantes

  • Métricas de evaluación
  • Error cuadrático medio
  • Coeficiente de determinación
  • Predicciones vs valores reales
  • Sobreajuste (overfitting)
  • Validación cruzada
  • Regresión lineal
  • Variables objetivo
  • Residuos

Hechos importantes

  • [01:26] La elevación al cuadrado evita que errores positivos y negativos se cancelen
  • [01:39] Un RMSE de 20,000 en predicción de precios de casas puede ser bueno o malo dependiendo del contexto (bueno para casas de 3 millones, malo para casas de 50,000)
  • [02:08] Un R² cercano a 1 significa que el modelo explica casi toda la variabilidad
  • [02:13] Un R² cercano a 0 significa que el modelo explica muy poco, casi como adivinar al azar
  • [02:17] Un R² alto no garantiza que el modelo sea útil si no se cumplen los supuestos de regresión
  • [08:02] Ninguna métrica cuenta toda la historia por sí sola; se necesita análisis conjunto

Datos principales del experimento

  • [03:13] Semilla aleatoria: 42
  • [03:18] Número de observaciones: 200
  • [05:25] Modelo lineal fuerte: MSE = 0.934, RMSE = 0.96, R² = 0.97
  • [07:07] Modelo lineal débil: MSE = 16.1, RMSE = 4.03, R² ≈ 0 (cercano a cero)
  • [07:34] Modelo no lineal: MSE y RMSE más altos, pero R² con mayor capacidad explicativa que el modelo débil