Evaluando el modelo: R^2 y MSE

Curso de Regresión Lineal con Python y scikit-learn

Contenido del curso

Introducción al curso

Cómo funciona la regresión lineal

Regresión lineal multivariable

Proyecto práctico

Pasos siguientes

Tomar examen

Evaluando el modelo: R^2 y MSE

Paola Alapizco

Estudiante

📊 Ejemplo de la gráfica de residuales del modelo que entrenamos en clases previas.

⚠️ Agrego únicamente el código de evaluación del modelo y la gráfica de residuales, asumiendo que se conoce el código del entrenamiento del modelo de regresión lineal para predecir los valores de las viviendas de Boston.

Evaluamos el modelo con R^2 y MSE, utilizamos la librería scikit learn:

# Importamos los métodos para evaluar el modelo
from sklearn.metrics import mean_squared_error, r2_score

  # Obtenemos los valores predichos por el modelo
predicted_values = slr.predict(X_std)

mse = mean_squared_error(X_std, predicted_values)
r2 = r2_score(X_std, predicted_values)

print("Evalucaicón del modelo con Mean Square Error: %.4f" % mse)
print("Evalucaicón del modelo R^2: %.4f" % r2)

Obtendremos un output similar a este:

Evalucaicón del modelo con Mean Square Error: 0.0928
Evalucaicón del modelo R^2: 0.9072

Creamos los gráficos:

plt.figure(figsize=(12,10))

# Reescalamos los datos predichos a valores reales.
trans_predictet_values = y_scaler.inverse_transform(predicted_values)

# Calculamos los residuos (valor real - valor predicho)
residuals = housing_df["MEDV"] - trans_predictet_values.reshape(506)

# Estandarizamos los residuos 
residuals_std = x_scaler.fit_transform(np.array(residuals).reshape(-1,1))

plt.subplot(2, 2, 1)
plt.scatter(
  trans_predictet_values.reshape(506),
  housing_df["MEDV"],
  alpha=.5
)

plt.xlabel("Valores predecidos para MEDV")
plt.ylabel("Valores actuales de MEDV")
plt.title("Predicción vs Reales")

plt.subplot(2, 2, 2)
plt.scatter(
  trans_predictet_values,
  residuals_std,
  alpha=.5
)

plt.ylabel("Residuos Estandarizados")
plt.xlabel("Valores predichos")
plt.title("Valores residuales")

plt.axhline(
  y=0,
  color="black",
  linestyle="dashed"
)
plt.show()

Resultado:

🎯 El objetivo de este gráfico es observar:

Que los datos estén distribuidos simétricamente.
Que los datos estén agrupados (acumulados) al rededor de los valores más pequeños del eje y (0, 0.5, 1 o ,1.5).
Que no sigan un patron o tendencia aparente.

📢Para crear el gráfico de residuos me base en uno de los recursos que dejó el profesor en la clase (https://www.qualtrics.com/support/stats-iq/analyses/regression-guides/interpreting-residual-plots-improve-regression/#ExaminingPredictedResidual)

Espero este aporte les sea de ayuda!

Evaluando el modelo: R^2 y MSE

Introducción al curso

Tu primera regresión lineal con scikit-learn

Análisis de datos para tu primera regresión lineal

Entrenando un modelo de regresión lineal con scikit-learn

Cómo funciona la regresión lineal

¿Qué es la regresión lineal?

Cuándo utilizar un modelo de regresión lineal

Función de pérdida y optimización: mínimos cuadrados

Evaluando el modelo: R^2 y MSE

Regresión lineal multivariable

Regresión lineal multivariable

Análisis de regresión multivariable

Proyecto práctico

Regresión lineal para predecir los gastos médicos de pacientes

Exploración y preparación de datos

Análisis de correlación de los datos

Entrenamiento del modelo

Evaluando el modelo

Mejorando el modelo

Pasos siguientes

¿Qué hay más allá de la linealidad?

Siguientes pasos en modelos de inteligencia artificial

Comparte tu proyecto de regresión lineal y certifícate