Cómo resolver theta con np.linalg.solve

Clase 13 de 16 • Curso de Álgebra Lineal para Machine Learning

Resumen

Aprende a calcular los pesos de un modelo de regresión lineal usando álgebra lineal, la ecuación normal y las funciones de NumPy. Verás por qué np.linalg.solve es preferido frente a la inversa, cómo interpretar el intercepto y cómo generar predicciones y la línea de mejor ajuste con Matplotlib.

¿Cómo resolver theta con NumPy de forma eficiente?

La idea central: si A es invertible en AX = B, entonces X = A⁻¹B. Eso nos da una solución directa para los pesos (theta). Sin embargo, profesionalmente es mejor usar np.linalg.solve para resolver el sistema sin calcular la inversa: es más rápido y estable numéricamente en matrices grandes.

# Suponiendo que A, B, X, X_bias y y ya están definidos
import numpy as np

# 1) Verificar invertibilidad básica
print(np.linalg.norm(A) > 0)  # True si la norma es > 0
print(A.shape)                # ejemplo: (3, 3)

# 2) Inversa de A (opción teórica)
A_inv = np.linalg.inv(A)
theta_inv = A_inv @ B
print("Pesos (inversa):", np.round(theta_inv, 2))

# 3) Resolver con solve (recomendado)
theta_solve = np.linalg.solve(A, B)
print("Pesos (solve):", np.round(theta_solve, 2))

¿Por qué evitar calcular la inversa?

Porque es costoso computacionalmente en matrices grandes.
Porque puede ser numéricamente inestable.
Porque solve resuelve el sistema directamente y es más robusto.

¿Qué validar para que A sea invertible?

Que la norma de A sea mayor a cero.
Que A sea matriz cuadrada (por ejemplo, 3x3).

¿Qué roles cumplen intercepto, bias y pesos?

El primer peso es el intercepto: el precio base antes de considerar características. En términos prácticos, es lo que el modelo predice para una casa con cero metros cuadrados y cero habitaciones. A partir de ahí, el modelo suma o resta valor en función de cada columna de X: por ejemplo, metros cuadrados y número de habitaciones.

Bias: columna de unos añadida al inicio de X para aprender el intercepto.
Pesos: coeficientes que multiplican cada característica.
Mejor aproximación: cuando el sistema es inconsistente, proyectamos Y de forma ortogonal sobre el espacio columna de X; eso produce las predicciones.
Ecuación normal: permite despejar theta a partir de los componentes A y B que calculaste previamente.

¿Cómo predecir y trazar la mejor línea de ajuste?

Con theta calculado, puedes predecir con X_bias y comparar contra los precios reales. Luego, grafica los datos y la línea de regresión para verificar el ajuste visualmente.

# Usamos la solución con solve
theta = theta_solve

# Predicciones sobre el conjunto con bias
predicciones = X_bias @ theta
print("Precios reales:", np.round(y, 2))
print("Precios predichos:", np.round(predicciones, 2))

# Visualización de datos y línea de mejor ajuste
import matplotlib.pyplot as plt

plt.figure(figsize=(8, 6))
plt.scatter(X[:, 0], y, color="blue", label="Datos reales")

# Dos casas nuevas para trazar la línea (metros cuadrados): 50 y 160
X_line = np.array([[50],
                   [160]])

# Agregamos bias y número de habitaciones (2 y 4)
X_line_bias = np.c_[np.ones((2, 1)), X_line, np.array([[2], [4]])]

y_line = X_line_bias @ theta
print("Proyecciones:", np.round(y_line, 2))

plt.plot(X_line.ravel(), y_line, "r-", label="Línea de regresión lineal")
plt.xlabel("metros cuadrados")
plt.ylabel("precio en miles")
plt.title("Nuestro modelo de regresión lineal")
plt.grid(True)
plt.legend()
plt.show()

¿Cómo resolver el ejercicio propuesto?

Calcula el precio para una casa de 130 m² con 3 habitaciones. Recuerda incluir el bias al inicio y hacer el producto punto con theta.

casa = np.array([1, 130, 3])
precio_130_3 = casa @ theta
print(np.round(precio_130_3, 2))

Construye el vector con bias al inicio.
Multiplica por theta con producto punto.
Redondea a dos decimales para interpretar con claridad.

Comparte tu resultado y comenta cómo te fue al usar np.linalg.solve frente a la inversa.

Alex Francisco Bustos Pinzon

student•

me parece ver un error de concepto en el minuto 1:11 donde intentas ver si la matriz es invertible y para ello sacas la norma para verificar si es mayor a cero, pero la metrica es el determinate diferente de cero

Daniel Erazo

teacher•

Hola, gracias por la corrección, tienes razón, para que una matriz sea invertible su determinante tiene que ser distinto de cero.

Alberto Ezequiel Marin Chacon

student•

Sería de 432.19

casa = np.array([1, 130, 3])
precio = casa @ theta_solve
print(np.round(precio_130_3, 2))

Daniel Erazo

teacher•

Muy bien, es correcto!

Alejandro Senger

student•

casa = np.array([1, 130, 3])

print(f"Precio de la casa: {np.round(casa @ theta, 2)}")

Precio de la casa: 432.19

Daniel Erazo

teacher•

Muy bien, es correcto!

Bryan Castano

student••

Hola Chicos, X3 Cosas "Observaciones"

El Rsultado del ejercicio : House_price( 130,3) = 432.19 .
Auqnue ese modelo lineal "Ingenuo" que el profesor obtuvo en la clase genera resultado "aceptables" de prediccion && Inferencia, , incluso su linea reacta ajusta algo los puntos , Yo no me fiaria de el para una palciacion real de prediccion, porque uno de sus parametros $theta1$ es -11.84, lo cual no tiene logica ni sentido por l oque si aumenta el valor de m2 deberia ser positivo ascendente creciente proporcional, eso me hace ruido. ademas Este problema con dos variables ( m2, rooms) es un plano en R3 y deberia ser un plano creciente, no esta bien que uno de sus parametros sea Neg(-).
La Respuesta proque el metodo np.linalg.solve() es mejor np.linalg.inv() es facinante, primero debemos saber que La complejidad algorítmica Big O para el método np.linalg.inv(A) es típicamente $O(n^{3})$, donde $n$ es el número de filas (o columnas) de la matriz cuadrada $A$ . lo que es muy cosotoso en recurso y tiempo,

np.linalg.solve(A, b) no calcula la inversa de A. En su lugar, llama a una de las rutinas LAPACK de gesv, que primero factoriza A usando la descomposición LU y luego resuelve x usando sustitución hacia adelante y hacia atrás .

np.linalg.inv utiliza el mismo método para calcular la inversa de A, resolviendo A-1 en A·A-1 = I, donde I es la identidad*. El paso de factorización es exactamente el mismo que el anterior, pero se requieren más operaciones de punto flotante para resolver A-1 (una matriz n×n) que para x (un vector de longitud n). Además, si se desea obtener x mediante la identidad A-1·b = x, la multiplicación de matrices adicional implicaría aún más operaciones de punto flotante y, por lo tanto, un rendimiento más lento y un mayor error numérico.

EL Algoritmo: NumPy utiliza la biblioteca LAPACK (específicamente la rutina _gesv), la cual emplea una descomposición LU con pivoteo parcial para invertir la matriz.

Este proceso implica aproximadamente $n^{3}$ operaciones de punto flotante.Rango teórico:

Aunque existen algoritmos teóricos más rápidos (como el de Strassen que es $O(n^{2.81})$ o el de Coppersmith-Winograd que es $O(n^{2.37})$), estos rara vez se usan en bibliotecas estándar como NumPy debido a su complejidad de implementación y a que solo muestran ventajas reales con matrices extremadamente grandes.

Costo computacional: Si duplicas el tamaño de la matriz (por ejemplo, de $1000\times 1000$ a $2000\times 2000$), el tiempo de ejecución aumentará aproximadamente 8 veces ($2^{3}$).

Si tu objetivo es resolver un sistema de ecuaciones del tipo

Ax=bcap A x equals b

𝐴𝑥=𝑏

, es más eficiente y numéricamente estable usar np.linalg.solve(A, b) en lugar de calcular la inversa explícitamente con np.linalg.inv(A) y luego multiplicar.

Aqui esta el codigo primordial en FORTRAN 77, :

En lugar de métodos ingenuos como eliminación gaussiana simple, utiliza:

A = P * L * U donde P es matriz de permutación, L es triangular inferior unitaria, U es triangular superior
El pivoteo parcial mejora dramáticamente la estabilidad numérica al evitar divisiones por números muy pequeños que causan errores de redondeo catastróficos

stabilidad Numerica : El pivoteo previene problemas comunes en aritmética de punto flotante. Sin pivoteo, incluso sistemas bien condicionados pueden producir soluciones completamente erróneas debido a errores de redondeo acumulados.

LAPACK (Linear Algebra PACKage) está:

Extremadamente optimizado para arquitecturas modernas
Usa BLAS (Basic Linear Algebra Subprograms) nivel 3 que maximiza operaciones matriz-matriz
Aprovecha cache y vectorización de CPU
Escrito por expertos en análisis numérico con décadas de refinamiento

La complejidad es O(n³) para la factorización, pero:

Una vez factorizada la matriz A, resolver para múltiples lados derechos (NRHS) solo cuesta O(n²) cada uno
Reutiliza la factorización eficientemente.

Por tanto si que es mejor usar np.linalg.solv(A,b) que hacerlo pro la inversa.

Gabriel Obregón

student•

🧠📘 📈 Regresión lineal con álgebra lineal y NumPy

🎯 OBJETIVO

👉 Aprender a calcular los pesos (theta) de un modelo de regresión lineal usando:

✔ Álgebra lineal

✔ Ecuación normal

✔ NumPy

Y entender:

🔹 Por qué np.linalg.solve es mejor que la inversa

🔹 Qué representan intercepto, bias y pesos

🔹 Cómo generar predicciones

🔹 Cómo visualizar la línea de mejor ajuste

🧠 IDEA CENTRAL

📌 Sistema lineal:

A · X = B

Si A es invertible, entonces:

➡ X = A inversa · B

📍 En regresión lineal:

· X → theta (pesos del modelo)

⚠️ Esta solución es válida en teoría, pero no es la mejor en la práctica.

🚫 ¿POR QUÉ EVITAR LA INVERSA?

Usar la inversa de una matriz:

❌ Es costoso computacionalmente

❌ Puede ser numéricamente inestable

❌ No escala bien en matrices grandes

✅ Alternativa profesional: 👉 np.linalg.solve(A, B)

✔ Más rápido

✔ Más estable

✔ Resuelve el sistema directamente

✅ CONDICIONES PARA QUE A SEA INVERTIBLE

Antes de resolver:

🔹 La norma de A debe ser mayor que cero

🔹 A debe ser una matriz cuadrada (ej. 3×3)

📌 Comprobaciones típicas:

· np.linalg.norm(A) > 0

· A.shape

🧮 CÁLCULO DE LOS PESOS (theta)

🟡 Opción teórica: inversa

➕ Calcula A inversa

➕ Multiplica por B

➖ Funciona, pero no es recomendable

🟢 Opción recomendada: solve

✔ Usa np.linalg.solve(A, B)

✔ Más eficiente

✔ Más robusta

✔ Produce el mismo resultado

⭐ Opción preferida en la práctica

🧩 INTERCEPTO, BIAS Y PESOS

🔹 Intercepto

📍 Primer valor de theta

📍 Precio base del modelo

📍 Predicción para:

· 0 metros cuadrados

· 0 habitaciones

🔹 Bias

📍 Columna de unos al inicio de X

📍 Permite aprender el intercepto

🔹 Pesos

📍 Coeficientes del modelo

📍 Multiplican cada característica

📍 Ajustan el precio según:

· Metros cuadrados

· Número de habitaciones

📐 CUANDO NO HAY SOLUCIÓN EXACTA

⚠️ El sistema puede ser inconsistente

👉 Entonces:

🔹 Se proyecta Y de forma ortogonal

🔹 Sobre el espacio columna de X

🔹 Se obtienen las predicciones

📌 Esto es lo que hace la ecuación normal

🔮 PREDICCIONES DEL MODELO

Con theta calculado:

➡ Usar X con bias

➡ Aplicar producto punto con theta

➡ Comparar valores reales vs predichos

🎯 Resultado:

· Predicciones del modelo de regresión

📈 VISUALIZACIÓN DEL AJUSTE

Para validar el modelo:

1️⃣ Graficar los datos reales

2️⃣ Crear puntos nuevos

3️⃣ Dibujar la línea de regresión

👀 La gráfica permite:

· Evaluar el ajuste

· Detectar errores visuales

Johan L

student•

casa_ejemplo = np.array([[130, 3]])
print(casa_ejemplo.shape)
casa_ejemplo_bias = np.c_[np.ones((casa_ejemplo.shape[0], 1)), casa_ejemplo]
print(casa_ejemplo_bias)
print(theta)
y_pred = casa_ejemplo_bias @ theta
print(y_pred)

Resultado:

(1, 2) [[ 1. 130. 3.]] [-11.84210526 2.48245614 40.43859649] [432.19298246]

Juan Felipe Benavides

student•

# Definimos el vector de entrada, el cual es una casa de 130 metros cuadrados y 3 habitaciones: 

casa = np.array([130,3])
casa_bias = np.insert(casa, 0, 1)

# predecir el valor de la casa definida en el vector de entrada "casa"

print(f"el precio estimado de una casa con {casa[0]} metros cuadrados y {casa[1]} habitaciones es de {np.round(casa_bias @ theta, 2)} miles de USD aproximadamente")

Ruben Eduardo Acosta Vela

student••

Me quedo la duda de para que usamos lo del bias. Probé que pasaba si no lo usamos y el resultado es el mismo.

# Veamos que pasa sin el bias

x = np.array([

[80, 3],

[120, 3],

[100, 2],

[150, 4]

])

y = np.array([310, 390, 325, 530])

AA = x.T @ x

bb = x.T @ y

theta2 = np.linalg.solve(AA, bb)

plt.figure(figsize=(6, 4))

plt.scatter(x[:,0], y, color='b', label='Datos reales')

x_linea2 = np.array([[50], [160]])

x_linea_ext = np.c_[x_linea2, np.array([[2], [4]])]

y_linea2 = x_linea_ext @ theta2

plt.plot(x_linea2, y_linea2, color='r', label='Regresion')

plt.xlabel('Metros cuadrados')

plt.ylabel('Precios')

plt.title('Sin bias')

plt.legend()

plt.grid()

plt.show()

Diego Ortiz

student•

Aquí parece que intentan usar notación de Markdown o similar y el sistema de respuestas no lo soporta, se vuelve muy difícil de leer

Daniel Erazo

teacher•

Muchas gracias por tu comentario, le diré al equipo correspondiente para que pueda revisarlo.

Bryan Castano

student•

@mi me parece que eso se entiende bien.

casa_ejemplo = np.array([[130, 3]])
print(casa_ejemplo.shape)
casa_ejemplo_bias = np.c_[np.ones((casa_ejemplo.shape[0], 1)), casa_ejemplo]
print(casa_ejemplo_bias)
print(theta)
y_pred = casa_ejemplo_bias @ theta
print(y_pred)

# Definimos el vector de entrada, el cual es una casa de 130 metros cuadrados y 3 habitaciones: 

casa = np.array([130,3])
casa_bias = np.insert(casa, 0, 1)

# predecir el valor de la casa definida en el vector de entrada "casa"

print(f"el precio estimado de una casa con {casa[0]} metros cuadrados y {casa[1]} habitaciones es de {np.round(casa_bias @ theta, 2)} miles de USD aproximadamente")

Cómo resolver theta con np.linalg.solve

Introducción al Álgebra Lineal para Machine Learning

Cómo Netflix sabe qué quieres ver

Configurar Google Colab para álgebra lineal

NumPy y Matplotlib: de números a gráficos

Escalares, vectores y tensores en Machine Learning

Operaciones con Vectores y Matrices

Resta y multiplicación escalar en machine learning

Norma L2 vs L1 en vectores con NumPy

Producto punto: cómo mide similitud la IA

Ortogonalidad en machine learning con Python

Multiplicación de Matrices

Producto matriz-vector en NumPy para inferencia

Producto matriz matriz en NumPy

Matriz identidad e inversa en NumPy

Construcción de un Modelo de Regresión Lineal

Cómo predecir precios con álgebra lineal

Cómo resolver theta con np.linalg.solve

Determinante y rango en regresión lineal

Por qué la multicolinealidad rompe el entrenamiento

Pseudoinversa para multicolinealidad en NumPy