Cuando los datos tienen ruido, AX = b suele ser inconsistente. La aproximación por mínimos cuadrados ofrece una solución clara: proyectar b sobre el espacio columna de A para hallar x sombrerito que minimiza el error. Con esta técnica, pasas de lo imposible a lo mejor posible con base matemática sólida.
¿Qué es la aproximación por mínimos cuadrados y cuándo aplicarla?
En un sistema AX = b inconsistente, b está fuera del espacio columna de A. No existe combinación lineal de las columnas de A que iguale b. La idea es buscar P, la proyección ortogonal de b sobre el espacio columna de A, y un x sombrerito tal que A x sombrerito = P.
- Vector de error E: E = b − P.
- Criterio de optimalidad: minimizar la longitud de E.
- Condición clave: E es ortogonal al espacio columna de A.
- Forma compacta: A transpuesta por E igual a 0.
¿Cómo se obtienen las ecuaciones normales desde la proyección?
Partimos de la ortogonalidad: A^T E = 0. Sustituimos E = b − P y luego P = A x sombrerito. Con la distributiva se obtiene: A^T b − A^T A x sombrerito = 0. Reordenando: A^T A x sombrerito = A^T b. Estas son las ecuaciones normales y permiten calcular la mejor aproximación cuando no hay solución exacta.
- Ortogonalidad del error: asegura la distancia mínima.
- Proyección como AX: garantiza que trabajamos dentro del espacio columna.
- Ecuación normal: puente entre geometría y álgebra.
¿Cómo ajustar una línea con mínimos cuadrados paso a paso?
Se busca la relación entre horas de estudio y calificación con el modelo: calificación = c1 + c2 · horas. Datos: (2, 70), (3, 90), (4, 80). El sistema es sobredeterminado: tres ecuaciones, dos incógnitas, e inconsistente.
¿Cómo construir AX = b y detectar un sistema sobredeterminado?
- Ecuaciones:
- c1 + 2 c2 = 70.
- c1 + 3 c2 = 90.
- c1 + 4 c2 = 80.
- Matriz A: filas [1, 2], [1, 3], [1, 4].
- Vector b: [70, 90, 80].
- Vector x: [c1, c2].
- Diagnóstico: más ecuaciones que incógnitas, sin solución exacta.
¿Cómo calcular A transpuesta A y A transpuesta b?
- A^T A: [[3, 9], [9, 29]].
- A^T b: [240, 730].
- Ecuación normal: [[3, 9], [9, 29]] · [c1, c2]^T = [240, 730]^T.
¿Cómo resolver con eliminación gaussiana y leer el modelo?
- Operación: fila 2 − 3 · fila 1 → [0, 2 | 10].
- Resultado: c2 = 5, c1 = 65.
- Modelo final: calificación = 65 + 5 · horas.
- Lectura: por cada hora extra, la calificación sube en 5 puntos; base de 65 puntos.
¿Te animas a validar tu comprensión? Si los puntos fueran (1, 1), (2, 2), (3, 3): al plantear AX = b, ¿sería un sistema inconsistente o no? Explica tu razonamiento en los comentarios y comparte tu procedimiento.