Eigenfaces: cómo PCA comprime rostros

Clase 7 de 12 • Curso Avanzado de Álgebra Lineal y Machine Learning: PCA y SVD

Resumen

¿Quieres comprimir y reconstruir rostros con alta fidelidad usando una fracción de los píxeles? Con eigenfaces y reducción de dimensionalidad mediante PCA en Python, es posible representar una cara como combinación de componentes principales y recuperar gran parte de los detalles con muy poca información. Ideal para reconocimiento facial y compresión de imágenes.

¿Qué son los eigenfaces y cómo reduce PCA un rostro?

Los componentes principales de PCA aplicados a imágenes de rostros no son ejes abstractos: son caras base o eigenfaces que capturan patrones de variación. El primer componente suele reflejar la iluminación general. Los siguientes concentran rasgos como nariz, mandíbula y ojos.

Un rostro se expresa como una combinación ponderada de eigenfaces.
Usando solo los componentes más importantes, se reconstruye la imagen con gran calidad.
Base de reconocimiento facial y compresión: menos datos, alta fidelidad.

¿Qué datos y dimensiones se manejan?

Se trabaja con las caras de Olivetti: 400 imágenes en escala de grises de 64×64 píxeles. Al vectorizar, cada imagen tiene 4096 características. La matriz de datos queda en forma (400, 4096).

Matriz de trabajo: X con forma (n_imágenes, n_pixeles).
Altura y ancho: h = 64, w = 64.
Configuración típica: 150 componentes para empezar; también se prueba con 300.

¿Cómo preparar los datos de Olivetti y configurar PCA en Python?

En Google Colab, se importan NumPy, Matplotlib y PCA de Scikit-learn, además del dataset de Olivetti con fetch_olivetti_faces y shuffle.

import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.datasets import fetch_olivetti_faces

faces_data = fetch_olivetti_faces(shuffle=True)
X = faces_data.data  # Matriz (400, 4096)
h, w = faces_data.images.shape[1], faces_data.images.shape[2]  # 64, 64

pca = PCA(n_components=150)
pca.fit(X)  # Ajuste sobre todo el conjunto

¿Qué significan fit, transform y fit_transform?

fit: encuentra los componentes principales del conjunto. Se usa para ajustar el modelo a todas las imágenes.
transform: proyecta nuevos datos en esos componentes ya aprendidos.
fit_transform: ajusta y proyecta en el mismo paso para todos los datos. Aquí se prefiere separar: fit sobre todas las caras y transform sobre una cara específica.

Ejemplo con una cara:

cara_original = X[0]
cara_comprimida = pca.transform([cara_original])  # Proyección en 150 componentes

¿Cómo reconstruir y visualizar con k componentes diferentes?

La idea es tomar los primeros k componentes, rellenar con ceros hasta 150 si hace falta y aplicar inverse_transform para volver al espacio de píxeles.

def reconstruir_con_k_componentes(k):
    cara_reducida = cara_comprimida[:, :k]
    if k < 150:  # Si luego usas 300, ajusta también aquí.
        padding = np.zeros((1, 150 - k))
        cara_reducida = np.c_[cara_reducida, padding]
    cara_k_reconstruida = pca.inverse_transform(cara_reducida)
    return cara_k_reconstruida.reshape(h, w)

Visualización con subplots, imshow, cmap='gray' y reshape para comparar original vs. reconstrucciones con k = 10, 50, 150:

fig, axes = plt.subplots(1, 4, figsize=(16, 5))
axes[0].imshow(cara_original.reshape(h, w), cmap='gray')
axes[0].set_title('Original')

axes[1].imshow(reconstruir_con_k_componentes(10), cmap='gray')
axes[1].set_title('Reconstrucción k=10')

axes[2].imshow(reconstruir_con_k_componentes(50), cmap='gray')
axes[2].set_title('Reconstrucción k=50')

axes[3].imshow(reconstruir_con_k_componentes(150), cmap='gray')
axes[3].set_title('Reconstrucción k=150')
plt.show()

Con k=10: se diferencian rasgos globales, pero se pierden detalles como barba, bigote y lentes.
Con k=50: mejora notable en contornos y textura.
Con k=150: la imagen es muy similar a la original usando solo una fracción de 4096 píxeles.
Al subir a k=300 (cambiando también la configuración y la función): la reconstrucción es prácticamente igual a la original.

¿Te animas a experimentar? Prueba con otro conjunto de rostros, incluso fotos de amistades o familia, y cuéntanos qué detalles se pierden o conservan con 10, 50, 100 o 150 componentes. ¿Con cuántos logras una reconstrucción satisfactoria? Deja tus resultados y observaciones en los comentarios. En la próxima sesión: interpretarás qué píxeles pesan más en cada eigenface con los componentes principales.

Comentarios

Jesús Alberto Romero Hernández

student••

Aplicamos La Biblioteca Pillow para crear un array de Numpy. Hay que tener presente que PCA solo trabaja con arrays de 2D máximo por lo que se transformará la ima´gen de 3D a 2D y luego se le devolverá la 3ra dimensión antes de graficar:

### Importación de Bibliotecas y Carga de Imágenes
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from PIL import Image

img = Image.open('../varian-halcyon.jpg')

# Convertir a array de numpy
img_array = np.array(img)

print(img_array.shape) 
# Suponiendo que img_array es (alto, ancho, 3)
(854, 1280, 3)
alto, ancho, canales = img_array.shape

''' Ya que PCA de Scikit-Learn solo acepta arreglos 2D, cambiamos la forma de 3D a 2D
(alto, ancho * 3(canales)) para que cada fila sea un píxel con sus 3 valores RGB'''
img_reshape = img_array.reshape(alto, ancho * canales)

pca = PCA(n_components=100) # Ajusta n_components según lo que querramos conservar
pca.fit(img_reshape)
def reconstruir_con_k_componentes(k):
    # Proyectamos los datos originales a los primeros k componentes
    # En lugar de hacer slice manual y padding, usamos transform e inverse_transform
    
    # 1. Transformar la imagen original a sus componentes principales
    proyeccion = pca.transform(img_reshape) 
    
    # 2. Creamos una copia donde borramos (ponemos a 0) los componentes &gt; k
    proyeccion_reducida = proyeccion.copy()
    proyeccion_reducida[:, k:] = 0
    
    # 3. Reconstruir al espacio original (alto * ancho * 3)
    reconstruccion = pca.inverse_transform(proyeccion_reducida)
    
    # 4. Volver a la forma de imagen original (con los 3 canales)
    return reconstruccion.reshape(alto, ancho, canales).astype(int)
fig, axes = plt.subplots(1, 4, figsize=(16, 5))

# Imagen Original (Asegúrate de pasarle los 3 canales si es color)
axes[0].imshow(img_reshape.reshape(alto, ancho, canales))
axes[0].set_title('Original')

# Reconstrucciones
for i, k_val in enumerate([10, 50, 100], 1):
    axes[i].imshow(reconstruir_con_k_componentes(k=k_val))
    axes[i].set_title(f'k={k_val}')

plt.show()

Gabriel Obregón

student•

📘PCA & EIGENFACES

🎯 ❓ Pregunta clave

➡️ ¿Se puede representar un rostro con mucha menos información sin perder su esencia?

✅ Sí, usando PCA y eigenfaces.

🧠 💡 Idea central

🧩 Un rostro puede expresarse como una combinación ponderada de eigenfaces.

✔️ Menos datos

✔️ Misma identidad

✔️ Estructura facial conservada

➡️ Base del reconocimiento facial y la compresión de imágenes.

👻 🧩 ¿Qué son los eigenfaces?

👤 Los eigenfaces son los componentes principales obtenidos al aplicar PCA a un conjunto de rostros.

Representan patrones comunes del conjunto:

🌗 Iluminación general (primer componente)
👁️ Posición de los ojos
👃 Forma de la nariz
🦷 Línea de la mandíbula

🧠 Cada eigenface es una “cara fantasma” que captura una parte de la variación total.

🔢 🧠 Representación de un rostro

📌 Un rostro se reconstruye así:

➕ Se combinan eigenfaces
⚖️ Cada una tiene un peso
🧮 La suma ponderada forma el rostro final

🔍 Efecto del número de componentes:

🔹 Pocos → se pierde textura fina (barba, lentes)
🔹 Muchos → imagen muy cercana al original

📉 🎯 ¿Por qué usar PCA?

✔️ Reduce dimensionalidad

✔️ Elimina redundancia

✔️ Mantiene la estructura esencial

📊 De 4096 píxeles → 150 valores con alta fidelidad.

🗂️ 📦 Dataset: Olivetti Faces

👥 400 imágenes de rostros 📐 Tamaño: 64 × 64 píxeles 🔢 4096 características por imagen 🧪 Dataset incluido en Scikit-learn

🛠️ 🧰 Herramientas usadas

🧮 NumPy → manejo de datos
📈 Matplotlib → visualización
🤖 Scikit-learn → PCA y dataset
☁️ Google Colab → entorno de trabajo

🔄 🔧 Flujo de trabajo con PCA

➡️ 1️⃣ Cargar imágenes

➡️ 2️⃣ Ajustar PCA (fit)

➡️ 3️⃣ Comprimir rostro (transform)

➡️ 4️⃣ Reconstruir rostro (inverse_transform)

➡️ 5️⃣ Visualizar y comparar resultados

⚠️ Si se usan menos componentes:

➕ Se completa con ceros (padding) antes de reconstruir

### Importación de Bibliotecas y Carga de Imágenes
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from PIL import Image

img = Image.open('../varian-halcyon.jpg')

# Convertir a array de numpy
img_array = np.array(img)

print(img_array.shape) 
# Suponiendo que img_array es (alto, ancho, 3)
(854, 1280, 3)
alto, ancho, canales = img_array.shape

''' Ya que PCA de Scikit-Learn solo acepta arreglos 2D, cambiamos la forma de 3D a 2D
(alto, ancho * 3(canales)) para que cada fila sea un píxel con sus 3 valores RGB'''
img_reshape = img_array.reshape(alto, ancho * canales)

pca = PCA(n_components=100) # Ajusta n_components según lo que querramos conservar
pca.fit(img_reshape)
def reconstruir_con_k_componentes(k):
    # Proyectamos los datos originales a los primeros k componentes
    # En lugar de hacer slice manual y padding, usamos transform e inverse_transform
    
    # 1. Transformar la imagen original a sus componentes principales
    proyeccion = pca.transform(img_reshape) 
    
    # 2. Creamos una copia donde borramos (ponemos a 0) los componentes &gt; k
    proyeccion_reducida = proyeccion.copy()
    proyeccion_reducida[:, k:] = 0
    
    # 3. Reconstruir al espacio original (alto * ancho * 3)
    reconstruccion = pca.inverse_transform(proyeccion_reducida)
    
    # 4. Volver a la forma de imagen original (con los 3 canales)
    return reconstruccion.reshape(alto, ancho, canales).astype(int)
fig, axes = plt.subplots(1, 4, figsize=(16, 5))

# Imagen Original (Asegúrate de pasarle los 3 canales si es color)
axes[0].imshow(img_reshape.reshape(alto, ancho, canales))
axes[0].set_title('Original')

# Reconstrucciones
for i, k_val in enumerate([10, 50, 100], 1):
    axes[i].imshow(reconstruir_con_k_componentes(k=k_val))
    axes[i].set_title(f'k={k_val}')

plt.show()

Eigenfaces: cómo PCA comprime rostros

Preparación y Transformaciones Lineales

Cómo descomponer matrices con PCA y SVD

Cómo las matrices transforman vectores en Python

Eigen-Análisis

Cómo verificar la ecuación A·v = λ·v con NumPy

Matriz de covarianza y eigenvectores en Python

Reducción de Dimensionalidad con PCA

Por qué más dimensiones empeoran tus modelos ML

PCA desde cero con NumPy paso a paso

Eigenfaces: cómo PCA comprime rostros

Cómo interpretar componentes principales en PCA

Descomposición en Valores Singulares (SVD)

Cómo SVD supera las limitaciones de eigenvectores

Cómo SVD transforma círculos en elipses

Aplicación de SVD en NumPy

Compresión de imágenes con SVD en Python