Aplicación de SVD en NumPy

Clase 11 de 12 • Curso Avanzado de Álgebra Lineal y Machine Learning: PCA y SVD

Resumen

Aplicar SVD con NumPy te permite descomponer cualquier matriz en tres piezas clave para entenderla, reconstruirla y, además, filtrar ruido en sistemas de recomendación. Aquí verás el flujo completo: crear A, obtener U, S y VT, formar Sigma correctamente y usar k para quedarte con los patrones que importan.

¿Cómo aplicar SVD en NumPy para descomponer y reconstruir matrices?

Empezamos en Google Colab importando NumPy y creando una matriz rectangular A de 3x2. Con np.linalg.svd obtenemos las tres transformaciones: U, S (valores singulares) y VT. En NumPy, S regresa como vector, así que formamos una Sigma rectangular para reconstruir A.

¿Qué hace np.linalg.svd y qué devuelve?

Descompone A en U, S y VT.
S contiene los valores singulares de mayor a menor.
VT contiene vectores relacionados con A transpuesta por A; sus columnas corresponden a los eigenvectores de AᵗA.

import numpy as np

A = np.array([[1, 2],
              [3, 4],
              [5, 6]])
print('shape:', A.shape)

U, S, VT = np.linalg.svd(A)
print('matriz U:\n', U)
print('Sigma (vector S):\n', S)
print('V transpuesta (VT):\n', VT)

¿Cómo formar Sigma y reconstruir A?

Creamos Sigma con ceros del mismo shape que A.
Incrustamos np.diag(S) en la esquina superior izquierda de Sigma.
Reconstruimos con el orden: U @ Sigma @ VT.
Interpretación: rotación, escalado y cambio de dimensión, luego rotación de salida.

Sigma = np.zeros(A.shape)
Sigma[:len(S), :len(S)] = np.diag(S)

A_reconstruida = U @ Sigma @ VT
print('A original:\n', A)
print('A reconstruida:\n', A_reconstruida)

¿Cómo filtrar ruido con SVD en un sistema de recomendación?

Modelamos 4 usuarios x 3 películas: Dune (ciencia ficción), Shrek (comedia) y Los Cazafantasmas (híbrida). Definimos dos patrones de gustos: uno de ciencia ficción y otro de comedia. Construimos una matriz señal de rango 2 combinando estos patrones y luego añadimos ruido para simular inconsistencias reales. Con SVD de la matriz ruidosa, los valores singulares revelan cuántos patrones dominan.

¿Cómo se construye la señal y el ruido?

Patrón sci-fi alto en Dune, bajo en Shrek, medio-alto en la híbrida.
Patrón comedia bajo en Dune, alto en Shrek, medio en la híbrida.
Señal: usuarios puros y combinaciones lineales de ambos patrones.
Ruido: matriz aleatoria con np.random.randn escalada por 0.3.

patron_sci_fi = np.array([5, 1, 4])
patron_comedia = np.array([1, 5, 3])

A_signal = np.array([
    patron_sci_fi,
    patron_comedia,
    0.5*patron_sci_fi + 0.5*patron_comedia,
    0.8*patron_sci_fi + 0.2*patron_comedia
])
print('shape:', A_signal.shape)  # 4 x 3

ruido = 0.3 * np.random.randn(4, 3)
A_ruidosa = A_signal + ruido

¿Cómo identificar k con valores singulares?

Aplicamos SVD a la matriz ruidosa.
Observamos S: dos valores grandes y un tercero muy pequeño.
Decisión: k = 2 para conservar los dos patrones fuertes y tratar el tercero como ruido.

U, S, VT = np.linalg.svd(A_ruidosa)
print('valores singulares:', np.round(S, 2))

¿Cómo reconstruir con k=2 y qué significa?

Tomamos U_k, S_k y VT_k con las primeras k componentes.
Reconstruimos A_filtrada: aproxima bien la señal original y elimina ruido.
Lectura práctica: te quedas con lo que más importa para recomendar mejor.

k = 2
U_k = U[:, :k]
S_k = np.diag(S[:k])
VT_k = VT[:k, :]

A_filtrada = U_k @ S_k @ VT_k
print('A_filtrada:\n', np.round(A_filtrada, 2))
print('A_signal:\n', A_signal)

¿Qué aprendizajes y habilidades clave obtienes con SVD?

SVD no solo descompone: también diagnostica patrones, filtra ruido y permite compresión eficiente. En matrices grandes, como las de plataformas con millones de usuarios y películas, se observan los valores singulares y suelen conservarse solo los principales (por ejemplo, 50 o 100) para capturar patrones de gusto latentes.

SVD: descomposición en U, Sigma y VT para entender transformaciones básicas.
Valores singulares: orden de importancia de patrones en los datos.
Sigma rectangular: construcción desde el vector S con np.diag y slicing.
Reconstrucción: U @ Sigma @ VT y lectura geométrica de las transformaciones.
Selección de k: conservar lo esencial y tratar lo pequeño como ruido.
Filtrado de ruido: mejora la señal de calificaciones y la estabilidad de recomendaciones.
Compresión: almacenar pocos patrones en lugar de matrices gigantes.
Interpretación de U y VT: U relaciona usuarios con patrones; VT relaciona películas con patrones; recomendación por similitud de perfiles.
Herramientas NumPy: np.array, np.linalg.svd, np.diag, np.zeros, np.random.randn, np.round.

Ponlo en práctica: vuelve al proyecto y reconstruye con k = 1. ¿Qué tan bien captura las preferencias originales de los usuarios? Comparte tu matriz y tu análisis en los comentarios.

Jesús Alberto Romero Hernández

student•

Ejercicio:

### Filtrar Ruido con SVD en un Sistema de Recomendación
import numpy as np
#### Patrones de Scifi y Comedia
patron_Scifi=np.array([5, 1, 4])
patron_Comedia=np.array([1, 5, 3])
#### Matriz Asignal
A_signal=np.array([patron_Scifi, patron_Comedia, patron_Scifi*0.5+patron_Comedia*0.5, patron_Scifi*0.8+patron_Comedia*0.2])
print(f"Matriz A signal: {A_signal}")
Matriz A signal: [[5.  1.  4. ]
 [1.  5.  3. ]
 [3.  3.  3.5]
 [4.2 1.8 3.8]]
print(f"Matriz A signal shape: {A_signal.shape}")
Matriz A signal shape: (4, 3)
#### Señal de Ruido y Señal Real
np.random.seed(42)
ruido=np.random.randn(*A_signal.shape)*0.3
print(f"Ruido: {ruido}")
Ruido: [[ 0.14901425 -0.04147929  0.19430656]
 [ 0.45690896 -0.07024601 -0.07024109]
 [ 0.47376384  0.23023042 -0.14084232]
 [ 0.16276801 -0.13902531 -0.13971893]]
señal_real=A_signal+ruido
print(f"Señal real (A_signal + ruido): {señal_real}")
Señal real (A_signal + ruido): [[5.14901425 0.95852071 4.19430656]
 [1.45690896 4.92975399 2.92975891]
 [3.47376384 3.23023042 3.35915768]
 [4.36276801 1.66097469 3.66028107]]
#### Descomposición SVD de la Señal Real
U, S, VT = np.linalg.svd(señal_real)
print(f'Vector de valores singulares: {S}')
#### Filtración de Ruido con SVD con k=1
k=1

Sigma_k = np.diag(S[:k])
Sigma=np.diag(S)
print(f'Matriz Sigma_k con los {k} valores singulares más grandes: {Sigma_k}')
Matriz Sigma_k con los 1 valores singulares más grandes: [[11.49314153]]
print(f'Matriz Sigma completa: {Sigma}')
Matriz Sigma completa: [[11.49314153  0.          0.        ]
 [ 0.          4.10354919  0.        ]
 [ 0.          0.          0.27576758]]
U_k=U[:,:k]
VT_k=VT[:k,:]
print(f'Matriz U_k: {U_k}')
Matriz U_k: [[-0.55286005]
 [-0.4308512 ]
 [-0.50160466]
 [-0.50705599]]
print(f'Matriz VT_k: {VT_k}')
Matriz VT_k: [[-0.64638715 -0.44517193 -0.61968185]]
A_filtrada = U_k @ Sigma_k @ VT_k
print(f'Matriz A Signal: {A_signal}')
Matriz A Signal: [[5.  1.  4. ]
 [1.  5.  3. ]
 [3.  3.  3.5]
 [4.2 1.8 3.8]]
print(f'Matriz A filtrada: {np.round(A_filtrada, decimals=2)}')
Matriz A filtrada: [[4.11 2.83 3.94]
 [3.2  2.2  3.07]
 [3.73 2.57 3.57]
 [3.77 2.59 3.61]]
varianza_explicada_k = np.sum(S[:k]**2) / np.sum(S**2)
print(f'Varianza explicada por los {k} primeros componentes: {varianza_explicada_k:.2f}')
Varianza explicada por los 1 primeros componentes: 0.89

P.D.: Al momento de crear la señal de ruido es necesario según mi opinion colocar la semilla :(np.random.seed(42))

Daniel Erazo

teacher•

Gran aportación, muy buen trabajo!

Gabriel Obregón

student•

🔹 SVD en NumPy: entender, reconstruir y filtrar ruido

🎯 ¿PARA QUÉ SIRVE SVD?

SVD permite trabajar con matrices de forma inteligente para:

✔ Entender su estructura interna

✔ Reconstruir la matriz original

✔ Detectar patrones relevantes

✔ Filtrar ruido en datos reales

✔ Comprimir información en sistemas grandes

👉 Idea central: no todo en los datos importa por igual.

🧠 IDEA CLAVE DE SVD

🔹 Toda matriz A se separa en 3 piezas:

🅤 U → patrones de las filas (ej. usuarios)

🅢 S → importancia de cada patrón

🅥ᵀ VT → patrones de las columnas (ej. películas)

🔁 Interpretación del flujo:

➡ Rotación de entrada

➡ Escalado + reducción

➡ Rotación de salida

🧩 PASO 1 · CREAR LA MATRIZ A

📦 Usamos NumPy

📐 Matriz rectangular 3 x 2

A = np.array([[1, 2],

[3, 4],

[5, 6]])

⚙️ PASO 2 · APLICAR SVD EN NUMPY

🛠 Función principal:

U, S, VT = np.linalg.svd(A)

📤 ¿Qué devuelve?

🔹 U → matriz

🔹 S → vector (⚠ no es matriz)

🔹 VT → matriz

🔍 ¿QUÉ REPRESENTA CADA COMPONENTE?

🅤 U (usuarios / filas)

🔹 Relaciona filas con patrones

🔹 Puede verse como una rotación del espacio original

🅢 S (valores singulares)

🔹 Vector ordenado de mayor a menor

🔹 Cada valor = peso de un patrón

📊 Interpretación:

⬆ Valores grandes → señal

⬇ Valores pequeños → ruido

🅥ᵀ VT (películas / columnas)

🔹 Relaciona columnas con patrones

🔹 Conectada con A transpuesta por A

🧱 PASO 3 · CONSTRUIR SIGMA

❗ Problema:

· S es solo un vector

✅ Solución:

✔ Crear matriz de ceros del tamaño de A

✔ Insertar S en la diagonal superior izquierda

Sigma = np.zeros(A.shape)

Sigma[:len(S), :len(S)] = np.diag(S)

🔄 PASO 4 · RECONSTRUIR LA MATRIZ

🔗 Orden de multiplicación:

➡ U @ Sigma @ VT

A_reconstruida = U @ Sigma @ VT

🎯 Resultado:

· A reconstruida ≈ A original

· Diferencias mínimas (precisión numérica)

### Filtrar Ruido con SVD en un Sistema de Recomendación
import numpy as np
#### Patrones de Scifi y Comedia
patron_Scifi=np.array([5, 1, 4])
patron_Comedia=np.array([1, 5, 3])
#### Matriz Asignal
A_signal=np.array([patron_Scifi, patron_Comedia, patron_Scifi*0.5+patron_Comedia*0.5, patron_Scifi*0.8+patron_Comedia*0.2])
print(f"Matriz A signal: {A_signal}")
Matriz A signal: [[5.  1.  4. ]
 [1.  5.  3. ]
 [3.  3.  3.5]
 [4.2 1.8 3.8]]
print(f"Matriz A signal shape: {A_signal.shape}")
Matriz A signal shape: (4, 3)
#### Señal de Ruido y Señal Real
np.random.seed(42)
ruido=np.random.randn(*A_signal.shape)*0.3
print(f"Ruido: {ruido}")
Ruido: [[ 0.14901425 -0.04147929  0.19430656]
 [ 0.45690896 -0.07024601 -0.07024109]
 [ 0.47376384  0.23023042 -0.14084232]
 [ 0.16276801 -0.13902531 -0.13971893]]
señal_real=A_signal+ruido
print(f"Señal real (A_signal + ruido): {señal_real}")
Señal real (A_signal + ruido): [[5.14901425 0.95852071 4.19430656]
 [1.45690896 4.92975399 2.92975891]
 [3.47376384 3.23023042 3.35915768]
 [4.36276801 1.66097469 3.66028107]]
#### Descomposición SVD de la Señal Real
U, S, VT = np.linalg.svd(señal_real)
print(f'Vector de valores singulares: {S}')
#### Filtración de Ruido con SVD con k=1
k=1

Sigma_k = np.diag(S[:k])
Sigma=np.diag(S)
print(f'Matriz Sigma_k con los {k} valores singulares más grandes: {Sigma_k}')
Matriz Sigma_k con los 1 valores singulares más grandes: [[11.49314153]]
print(f'Matriz Sigma completa: {Sigma}')
Matriz Sigma completa: [[11.49314153  0.          0.        ]
 [ 0.          4.10354919  0.        ]
 [ 0.          0.          0.27576758]]
U_k=U[:,:k]
VT_k=VT[:k,:]
print(f'Matriz U_k: {U_k}')
Matriz U_k: [[-0.55286005]
 [-0.4308512 ]
 [-0.50160466]
 [-0.50705599]]
print(f'Matriz VT_k: {VT_k}')
Matriz VT_k: [[-0.64638715 -0.44517193 -0.61968185]]
A_filtrada = U_k @ Sigma_k @ VT_k
print(f'Matriz A Signal: {A_signal}')
Matriz A Signal: [[5.  1.  4. ]
 [1.  5.  3. ]
 [3.  3.  3.5]
 [4.2 1.8 3.8]]
print(f'Matriz A filtrada: {np.round(A_filtrada, decimals=2)}')
Matriz A filtrada: [[4.11 2.83 3.94]
 [3.2  2.2  3.07]
 [3.73 2.57 3.57]
 [3.77 2.59 3.61]]
varianza_explicada_k = np.sum(S[:k]**2) / np.sum(S**2)
print(f'Varianza explicada por los {k} primeros componentes: {varianza_explicada_k:.2f}')
Varianza explicada por los 1 primeros componentes: 0.89

Aplicación de SVD en NumPy

Preparación y Transformaciones Lineales

Cómo descomponer matrices con PCA y SVD

Cómo las matrices transforman vectores en Python

Eigen-Análisis

Cómo verificar la ecuación A·v = λ·v con NumPy

Matriz de covarianza y eigenvectores en Python

Reducción de Dimensionalidad con PCA

Por qué más dimensiones empeoran tus modelos ML

PCA desde cero con NumPy paso a paso

Eigenfaces: cómo PCA comprime rostros

Cómo interpretar componentes principales en PCA

Descomposición en Valores Singulares (SVD)

Cómo SVD supera las limitaciones de eigenvectores

Cómo SVD transforma círculos en elipses

Aplicación de SVD en NumPy

Compresión de imágenes con SVD en Python