Función de pérdida y optimización: mínimos cuadrados

Curso de Regresión Lineal con Python y scikit-learn

Contenido del curso

Introducción al curso

Cómo funciona la regresión lineal

Regresión lineal multivariable

Proyecto práctico

Pasos siguientes

Tomar examen

Función de pérdida y optimización: mínimos cuadrados

Mario Alexander Vargas Celis

Estudiante

En regresión lineal, la función de pérdida más común es la de mínimos cuadrados. Aquí te explico qué es y cómo se usa para la optimización del modelo:

🎯 ¿Qué es la función de pérdida de mínimos cuadrados?

Es una función que mide el error entre los valores predichos por el modelo y los valores reales. La idea es minimizar ese error durante el entrenamiento.

📐 Definición matemática

Dada una muestra de datos con n observaciones:

Peˊrdida=∑i=1n(yi−y^i)2\text{Pérdida} = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

Donde:

yiy_i = valor real
y^i\hat{y}_i = valor predicho por el modelo
La diferencia yi−y^iy_i - \hat{y}_i se llama residuo
Se eleva al cuadrado para:
- Penalizar más los errores grandes
- Evitar que errores positivos y negativos se cancelen

Esta pérdida también se conoce como Error Cuadrático Total (SSE) o Suma de los errores al cuadrado.

🛠 ¿Cómo se optimiza?

El modelo de regresión lineal busca los coeficientes (pendientes y término independiente) que minimizan esta función de pérdida.

Esto se puede hacer con:

Solución analítica (ecuación normal): Para modelos pequeños o simples.
Descenso del gradiente: Método iterativo que ajusta los coeficientes paso a paso en la dirección que reduce el error.

📉 ¿Por qué mínimos cuadrados?

Porque es:

Rápido y computacionalmente eficiente.
Fácil de interpretar.
Funciona bien si los errores siguen una distribución normal.

📌 En Python con scikit-learn:

Cuando usas:

from sklearn.linear_model import LinearRegression modelo = LinearRegression() modelo.fit(X, y)

Internamente se está minimizando la función de mínimos cuadrados para encontrar los mejores coeficientes.

Función de pérdida y optimización: mínimos cuadrados

Introducción al curso

Tu primera regresión lineal con scikit-learn

Análisis de datos para tu primera regresión lineal

Entrenando un modelo de regresión lineal con scikit-learn

Cómo funciona la regresión lineal

¿Qué es la regresión lineal?

Cuándo utilizar un modelo de regresión lineal