Compresión de imágenes con SVD en Python

Curso Avanzado de Álgebra Lineal y Machine Learning: PCA y SVD

Contenido del curso

Preparación y Transformaciones Lineales

Eigen-Análisis

Reducción de Dimensionalidad con PCA

Descomposición en Valores Singulares (SVD)

Tomar examen

Compresión de imágenes con SVD en Python

Resumen

La compresión de imágenes con SVD te permite reducir el tamaño de una foto conservando su estructura visual, usando solo los componentes más importantes de su descomposición matricial. Aprenderás a aplicarlo en Python con scikit-image y NumPy, una técnica clave si trabajas en machine learning y necesitas datasets más ligeros.

La idea central es tratar una imagen como una matriz de píxeles, descomponerla con Singular Value Decomposition y reconstruirla con solo los K valores singulares más representativos. Lo demás, en muchos casos, es ruido.

¿Por qué funciona SVD para comprimir imágenes?

Una imagen en escala de grises es, en esencia, una matriz numérica donde cada celda guarda la intensidad de un píxel. Al aplicar SVD, esa matriz se descompone en tres: U, Sigma y V transpuesta [0:30].

La matriz Sigma contiene los valores singulares ordenados de mayor a menor importancia. Los primeros valores capturan la estructura principal: formas, contrastes, bordes. Los últimos suelen representar ruido o detalles muy finos.

¿Qué es un valor singular en SVD? Es un número que mide cuánta información aporta cada componente de la descomposición. Mientras más alto, más relevante es ese componente para reconstruir la imagen original.

Descartando los componentes menos relevantes y reconstruyendo con los K más importantes, obtienes una imagen casi idéntica usando muchísima menos información.

¿Cómo aplicar SVD a una imagen en Python?

El primer paso es preparar la imagen. SVD no trabaja directamente con imágenes a color, así que necesitas convertirlas a escala de grises y opcionalmente redimensionarlas para que el cómputo sea más rápido [2:15].

Desde skimage importas tres piezas clave:

data para acceder a imágenes de prueba.
resize desde skimage.transform para ajustar dimensiones.
rgb2gray desde skimage.color para pasar a escala de grises.

Una vez tienes la imagen como matriz, la redimensionas a 300 por 200 píxeles para manejarla con eficiencia y aplicas la descomposición:

python U, S, Vt = np.linalg.svd(imagen)

Esto te devuelve U con forma 300 por 300, un vector S con 200 valores singulares y Vt con forma 200 por 200 [3:45].

¿Cómo reconstruir la imagen con K componentes?

La reconstrucción consiste en quedarte solo con las primeras K columnas de U, los primeros K valores singulares de S (convertidos a matriz diagonal con np.diag) y las primeras K filas de Vt. Después multiplicas las tres:

python def reconstruir_con_k(k): U_k = U[:, :k] S_k = np.diag(S[:k]) Vt_k = Vt[:k, :] return U_k @ S_k @ Vt_k

Probando con valores K de 5, 20 y 50, y graficando con matplotlib en una rejilla de subplots, puedes comparar visualmente cómo crece la fidelidad a medida que sumas componentes [5:50].

¿Qué resultados obtienes al variar el valor de K?

En el ejemplo de un cohete, la reconstrucción cuenta una historia clara:

Con K=5, la imagen es borrosa y apenas reconocible.
Con K=20, ya distingues que se trata de un cohete aunque falten detalles.
Con K=50, la similitud con la original es prácticamente idéntica.

Y aquí viene lo interesante: pasaste de necesitar 60.000 números (300 x 200 píxeles) a representar la misma imagen con apenas 50 valores singulares. Eso es una compresión cercana a seis veces.

¿Cuántos valores singulares necesito para una buena reconstrucción? Depende de la imagen, pero entre el 10% y el 25% de los valores totales suele ser suficiente para conservar la estructura visual reconocible.

¿Qué beneficios tiene la compresión SVD en machine learning?

Reducir dimensiones con SVD no es solo un truco visual, tiene impacto directo en el rendimiento de tus modelos.

Eficiencia en almacenamiento y velocidad

Pasar de 60.000 valores a 50 por imagen ahorra gigabytes cuando trabajas con datasets de millones de imágenes. Los tiempos de carga y procesamiento se aceleran de forma drástica [9:20].

Aceleración del entrenamiento

Si alimentas tu modelo con 50 valores singulares en lugar de 60.000 píxeles por imagen, el entrenamiento es muchísimo más rápido. Conservas la esencia de la información sin cargar al modelo con detalles redundantes.

Eliminación de ruido o denoising

Los componentes con valores singulares más pequeños suelen capturar grano de la imagen o imperfecciones del sensor. Al descartarlos, aplicas un filtrado automático de ruido que ayuda a que los modelos generalicen mejor, aprendiendo la estructura fundamental en lugar de memorizar imperfecciones específicas [10:40].

¿Cuál es el K mínimo para reconocer una imagen?

Este es el reto práctico: vuelve a ejecutar el código con distintos valores de K y descubre cuál es el mínimo con el que todavía identificas claramente el objeto. Comparte tu valor y una captura de pantalla en los comentarios para comparar resultados con otros estudiantes.

Bryan Castano

Estudiante

Hola Chicos, Yo os comparto algunas notas y outputs de mi tutot de LinAlg "Gemini" que es genial en su modo "learning".

Si el Eigendecomposition Av = lambda .v es como entender el ADN de una matriz cuadrada, la Descomposición en Valores Singulares (SVD) es como hacerle una radiografía completa a cualquier matriz, sea cuadrada o no.

La SVD establece que cualquier matriz $A$ de dimensiones $m x n$ puede ser factorizada en el producto de tres matrices especiales:

$$A = U \Sigma V^T$$

Donde:

$U$ ($m \times m$): Es una matriz ortogonal ($U^T U = I$). Sus columnas son los vectores singulares izquierdos. Representan una rotación en el espacio de llegada.
$\Sigma$ ($m \times n$): Es una matriz diagonal (no necesariamente cuadrada). Sus elementos en la diagonal son los valores singulares $\sigma_1 > \sigma_2 > ... > 0$. Indican cuánto se estira la matriz en cada dirección.
$V^T$ ($n x n$): Es la transpuesta de otra matriz ortogonal. Sus columnas son los vectores singulares derechos. Representan una rotación inicial en el espacio de partida.

Compresión de Datos: Los valores singulares en $\Sigma$ están ordenados por importancia. Si te quedas solo con los primeros $k$ valores (los más grandes), puedes reconstruir una aproximación muy cercana a la original usando mucho menos espacio.
PCA (Análisis de Componentes Principales): El PCA, que usas para reducir dimensiones en Machine Learning, es básicamente SVD aplicado a una matriz de datos centrada.
Sistemas de Recomendación: Algoritmos como los que usa Netflix para predecir qué película te gustará se basan en SVD para encontrar "factores latentes" entre usuarios y películas.

@Aqui un script de ejempl oque Gemini me ha dado :

import numpy as np
import matplotlib.pyplot as plt

def svd_compression_demo():
    # 1. Crear una matriz de 100x100 con un patrón (nuestra "imagen")
    # Usamos un producto exterior para crear una matriz de bajo rango
    x = np.linspace(-5, 5, 100)
    y = np.linspace(-5, 5, 100)
    X, Y = np.meshgrid(x, y)
    A = np.sin(X) + np.cos(Y) # Un patrón complejo

    # 2. Aplicar SVD
    # U: Vectores izquierdos, s: Valores singulares, Vt: Vectores derechos
    U, s, Vt = np.linalg.svd(A)

    # 3. Reconstrucción con diferentes rangos (k)
    # k es el número de valores singulares que decidimos mantener
    ranks = [2, 5, 10, 50]
    
    plt.figure(figsize=(12, 8))
    
    # Imagen Original
    plt.subplot(2, 3, 1)
    plt.imshow(A, cmap='viridis')
    plt.title("Original (Rango 100)")
    plt.axis('off')

    for i, k in enumerate(ranks):
        # Reconstrucción: U[:, :k] @ Sigma[:k, :k] @ Vt[:k, :]
        # En numpy, 's' es un vector, lo convertimos a diagonal
        A_approx = U[:, :k] @ np.diag(s[:k]) @ Vt[:k, :]
        
        plt.subplot(2, 3, i + 2)
        plt.imshow(A_approx, cmap='viridis')
        plt.title(f"Reconstrucción con k={k}")
        plt.axis('off')

    plt.tight_layout()
    plt.show()

    # Mostrar la importancia de los valores singulares
    plt.figure(figsize=(6, 4))
    plt.plot(s, 'ro-', markersize=2)
    plt.title("Magnitud de los Valores Singulares ($\sigma$)")
    plt.xlabel("Índice")
    plt.ylabel("Valor")
    plt.grid(True)
    plt.show()

if __name__ == "__main__":
    svd_compression_demo()

La jerarquía de la información: Verás que con solo k=5 o k=10 valores singulares, ya puedes reconocer la forma general del patrón. Esto es porque los primeros valores de $\sigma$ capturan la mayor parte de la varianza (energía) del sistema.
Reducción de ruido: En Machine Learning, a menudo los valores singulares más pequeños representan "ruido". Al descartarlos (Truncated SVD), no solo comprimes, sino que limpias tus datos.

recuerda siempre la conexión sagrada entre SVD y los Eigenvalores:

Los Valores Singulares ($\sigma_i$) son las raíces cuadradas de los eigenvalores de $A^T A$.
Los Vectores Singulares Derechos ($V$) son los eigenvectores de $A^T A$.
Los Vectores Singulares Izquierdos ($U$) son los eigenvectores de $AA^T$.

Much ode esto ha sido expliicado por el profesor durante esgte curso, por tanto si Gemini y @Daniel dicen l omismo es por la plena real.

Compresión de imágenes con SVD en Python

Preparación y Transformaciones Lineales

Cómo descomponer matrices con PCA y SVD

Cómo leer una matriz como transformación geométrica

Eigen-Análisis

Eigenvectores y eigenvalores con NumPy

Matriz de covarianza y eigenvectores en PCA

Reducción de Dimensionalidad con PCA

Reducción de dimensiones con PCA en Python

Cómo implementar PCA desde cero con NumPy

Eigenfaces: reconstruye rostros con PCA

Qué son las eigenfaces en PCA

Descomposición en Valores Singulares (SVD)

Cómo SVD supera las limitaciones de eigenvectores

Cómo SVD transforma círculos en elipses

Aplicación de SVD en NumPy

Compresión de imágenes con SVD en Python

Resumen