Mínimos cuadrados para datos con ruido

Clase 22 de 29 • Curso de Álgebra Lineal: Fundamentos y Aplicaciones

Resumen

Cuando los datos tienen ruido, AX = b suele ser inconsistente. La aproximación por mínimos cuadrados ofrece una solución clara: proyectar b sobre el espacio columna de A para hallar x sombrerito que minimiza el error. Con esta técnica, pasas de lo imposible a lo mejor posible con base matemática sólida.

¿Qué es la aproximación por mínimos cuadrados y cuándo aplicarla?

En un sistema AX = b inconsistente, b está fuera del espacio columna de A. No existe combinación lineal de las columnas de A que iguale b. La idea es buscar P, la proyección ortogonal de b sobre el espacio columna de A, y un x sombrerito tal que A x sombrerito = P.

Vector de error E: E = b − P.
Criterio de optimalidad: minimizar la longitud de E.
Condición clave: E es ortogonal al espacio columna de A.
Forma compacta: A transpuesta por E igual a 0.

¿Cómo se obtienen las ecuaciones normales desde la proyección?

Partimos de la ortogonalidad: A^T E = 0. Sustituimos E = b − P y luego P = A x sombrerito. Con la distributiva se obtiene: A^T b − A^T A x sombrerito = 0. Reordenando: A^T A x sombrerito = A^T b. Estas son las ecuaciones normales y permiten calcular la mejor aproximación cuando no hay solución exacta.

Ortogonalidad del error: asegura la distancia mínima.
Proyección como AX: garantiza que trabajamos dentro del espacio columna.
Ecuación normal: puente entre geometría y álgebra.

¿Cómo ajustar una línea con mínimos cuadrados paso a paso?

Se busca la relación entre horas de estudio y calificación con el modelo: calificación = c1 + c2 · horas. Datos: (2, 70), (3, 90), (4, 80). El sistema es sobredeterminado: tres ecuaciones, dos incógnitas, e inconsistente.

¿Cómo construir AX = b y detectar un sistema sobredeterminado?

Ecuaciones:
- c1 + 2 c2 = 70.
- c1 + 3 c2 = 90.
- c1 + 4 c2 = 80.
Matriz A: filas [1, 2], [1, 3], [1, 4].
Vector b: [70, 90, 80].
Vector x: [c1, c2].
Diagnóstico: más ecuaciones que incógnitas, sin solución exacta.

¿Cómo calcular A transpuesta A y A transpuesta b?

A^T A: [[3, 9], [9, 29]].
A^T b: [240, 730].
Ecuación normal: [[3, 9], [9, 29]] · [c1, c2]^T = [240, 730]^T.

¿Cómo resolver con eliminación gaussiana y leer el modelo?

Operación: fila 2 − 3 · fila 1 → [0, 2 | 10].
Resultado: c2 = 5, c1 = 65.
Modelo final: calificación = 65 + 5 · horas.
Lectura: por cada hora extra, la calificación sube en 5 puntos; base de 65 puntos.

¿Te animas a validar tu comprensión? Si los puntos fueran (1, 1), (2, 2), (3, 3): al plantear AX = b, ¿sería un sistema inconsistente o no? Explica tu razonamiento en los comentarios y comparte tu procedimiento.