Eigenfaces: cómo PCA comprime rostros

Cursos Empresas Blog Live Conf Precios

Contenido del curso

Preparación y Transformaciones Lineales

Eigen-Análisis

Reducción de Dimensionalidad con PCA

Descomposición en Valores Singulares (SVD)

Tomar examen

Eigenfaces: cómo PCA comprime rostros

Resumen

¿Quieres comprimir y reconstruir rostros con alta fidelidad usando una fracción de los píxeles? Con eigenfaces y reducción de dimensionalidad mediante PCA en Python, es posible representar una cara como combinación de componentes principales y recuperar gran parte de los detalles con muy poca información. Ideal para reconocimiento facial y compresión de imágenes.

¿Qué son los eigenfaces y cómo reduce PCA un rostro?

Los componentes principales de PCA aplicados a imágenes de rostros no son ejes abstractos: son caras base o eigenfaces que capturan patrones de variación. El primer componente suele reflejar la iluminación general. Los siguientes concentran rasgos como nariz, mandíbula y ojos.

Un rostro se expresa como una combinación ponderada de eigenfaces.
Usando solo los componentes más importantes, se reconstruye la imagen con gran calidad.
Base de reconocimiento facial y compresión: menos datos, alta fidelidad.

¿Qué datos y dimensiones se manejan?

Se trabaja con las caras de Olivetti: 400 imágenes en escala de grises de 64×64 píxeles. Al vectorizar, cada imagen tiene 4096 características. La matriz de datos queda en forma (400, 4096).

Matriz de trabajo: X con forma (n_imágenes, n_pixeles).
Altura y ancho: h = 64, w = 64.
Configuración típica: 150 componentes para empezar; también se prueba con 300.

¿Cómo preparar los datos de Olivetti y configurar PCA en Python?

En Google Colab, se importan NumPy, Matplotlib y PCA de Scikit-learn, además del dataset de Olivetti con fetch_olivetti_faces y shuffle.

import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.datasets import fetch_olivetti_faces

faces_data = fetch_olivetti_faces(shuffle=True)
X = faces_data.data  # Matriz (400, 4096)
h, w = faces_data.images.shape[1], faces_data.images.shape[2]  # 64, 64

pca = PCA(n_components=150)
pca.fit(X)  # Ajuste sobre todo el conjunto

¿Qué significan fit, transform y fit_transform?

fit: encuentra los componentes principales del conjunto. Se usa para ajustar el modelo a todas las imágenes.
transform: proyecta nuevos datos en esos componentes ya aprendidos.
fit_transform: ajusta y proyecta en el mismo paso para todos los datos. Aquí se prefiere separar: fit sobre todas las caras y transform sobre una cara específica.

Ejemplo con una cara:

cara_original = X[0]
cara_comprimida = pca.transform([cara_original])  # Proyección en 150 componentes

¿Cómo reconstruir y visualizar con k componentes diferentes?

La idea es tomar los primeros k componentes, rellenar con ceros hasta 150 si hace falta y aplicar inverse_transform para volver al espacio de píxeles.

def reconstruir_con_k_componentes(k):
    cara_reducida = cara_comprimida[:, :k]
    if k < 150:  # Si luego usas 300, ajusta también aquí.
        padding = np.zeros((1, 150 - k))
        cara_reducida = np.c_[cara_reducida, padding]
    cara_k_reconstruida = pca.inverse_transform(cara_reducida)
    return cara_k_reconstruida.reshape(h, w)

Visualización con subplots, imshow, cmap='gray' y reshape para comparar original vs. reconstrucciones con k = 10, 50, 150:

fig, axes = plt.subplots(1, 4, figsize=(16, 5))
axes[0].imshow(cara_original.reshape(h, w), cmap='gray')
axes[0].set_title('Original')

axes[1].imshow(reconstruir_con_k_componentes(10), cmap='gray')
axes[1].set_title('Reconstrucción k=10')

axes[2].imshow(reconstruir_con_k_componentes(50), cmap='gray')
axes[2].set_title('Reconstrucción k=50')

axes[3].imshow(reconstruir_con_k_componentes(150), cmap='gray')
axes[3].set_title('Reconstrucción k=150')
plt.show()

Con k=10: se diferencian rasgos globales, pero se pierden detalles como barba, bigote y lentes.
Con k=50: mejora notable en contornos y textura.
Con k=150: la imagen es muy similar a la original usando solo una fracción de 4096 píxeles.
Al subir a k=300 (cambiando también la configuración y la función): la reconstrucción es prácticamente igual a la original.

¿Te animas a experimentar? Prueba con otro conjunto de rostros, incluso fotos de amistades o familia, y cuéntanos qué detalles se pierden o conservan con 10, 50, 100 o 150 componentes. ¿Con cuántos logras una reconstrucción satisfactoria? Deja tus resultados y observaciones en los comentarios. En la próxima sesión: interpretarás qué píxeles pesan más en cada eigenface con los componentes principales.

Gabriel Obregón

student

📘PCA & EIGENFACES

🎯 ❓ Pregunta clave

➡️ ¿Se puede representar un rostro con mucha menos información sin perder su esencia?

✅ Sí, usando PCA y eigenfaces.

🧠 💡 Idea central

🧩 Un rostro puede expresarse como una combinación ponderada de eigenfaces.

✔️ Menos datos

✔️ Misma identidad

✔️ Estructura facial conservada

➡️ Base del reconocimiento facial y la compresión de imágenes.

👻 🧩 ¿Qué son los eigenfaces?

👤 Los eigenfaces son los componentes principales obtenidos al aplicar PCA a un conjunto de rostros.

Representan patrones comunes del conjunto:

🌗 Iluminación general (primer componente)
👁️ Posición de los ojos
👃 Forma de la nariz
🦷 Línea de la mandíbula

🧠 Cada eigenface es una “cara fantasma” que captura una parte de la variación total.

🔢 🧠 Representación de un rostro

📌 Un rostro se reconstruye así:

➕ Se combinan eigenfaces
⚖️ Cada una tiene un peso
🧮 La suma ponderada forma el rostro final

🔍 Efecto del número de componentes:

🔹 Pocos → se pierde textura fina (barba, lentes)
🔹 Muchos → imagen muy cercana al original

📉 🎯 ¿Por qué usar PCA?

✔️ Reduce dimensionalidad

✔️ Elimina redundancia

✔️ Mantiene la estructura esencial

📊 De 4096 píxeles → 150 valores con alta fidelidad.

🗂️ 📦 Dataset: Olivetti Faces

👥 400 imágenes de rostros 📐 Tamaño: 64 × 64 píxeles 🔢 4096 características por imagen 🧪 Dataset incluido en Scikit-learn

🛠️ 🧰 Herramientas usadas

🧮 NumPy → manejo de datos
📈 Matplotlib → visualización
🤖 Scikit-learn → PCA y dataset
☁️ Google Colab → entorno de trabajo

🔄 🔧 Flujo de trabajo con PCA

➡️ 1️⃣ Cargar imágenes

➡️ 2️⃣ Ajustar PCA (fit)

➡️ 3️⃣ Comprimir rostro (transform)

➡️ 4️⃣ Reconstruir rostro (inverse_transform)

➡️ 5️⃣ Visualizar y comparar resultados

⚠️ Si se usan menos componentes:

➕ Se completa con ceros (padding) antes de reconstruir

### Importación de Bibliotecas y Carga de Imágenes
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from PIL import Image

img = Image.open('../varian-halcyon.jpg')

# Convertir a array de numpy
img_array = np.array(img)

print(img_array.shape) 
# Suponiendo que img_array es (alto, ancho, 3)
(854, 1280, 3)
alto, ancho, canales = img_array.shape

''' Ya que PCA de Scikit-Learn solo acepta arreglos 2D, cambiamos la forma de 3D a 2D
(alto, ancho * 3(canales)) para que cada fila sea un píxel con sus 3 valores RGB'''
img_reshape = img_array.reshape(alto, ancho * canales)

pca = PCA(n_components=100) # Ajusta n_components según lo que querramos conservar
pca.fit(img_reshape)
def reconstruir_con_k_componentes(k):
    # Proyectamos los datos originales a los primeros k componentes
    # En lugar de hacer slice manual y padding, usamos transform e inverse_transform
    
    # 1. Transformar la imagen original a sus componentes principales
    proyeccion = pca.transform(img_reshape) 
    
    # 2. Creamos una copia donde borramos (ponemos a 0) los componentes &gt; k
    proyeccion_reducida = proyeccion.copy()
    proyeccion_reducida[:, k:] = 0
    
    # 3. Reconstruir al espacio original (alto * ancho * 3)
    reconstruccion = pca.inverse_transform(proyeccion_reducida)
    
    # 4. Volver a la forma de imagen original (con los 3 canales)
    return reconstruccion.reshape(alto, ancho, canales).astype(int)
fig, axes = plt.subplots(1, 4, figsize=(16, 5))

# Imagen Original (Asegúrate de pasarle los 3 canales si es color)
axes[0].imshow(img_reshape.reshape(alto, ancho, canales))
axes[0].set_title('Original')

# Reconstrucciones
for i, k_val in enumerate([10, 50, 100], 1):
    axes[i].imshow(reconstruir_con_k_componentes(k=k_val))
    axes[i].set_title(f'k={k_val}')

plt.show()

### Importación de Bibliotecas y Carga de Imágenes
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from PIL import Image

img = Image.open('../varian-halcyon.jpg')

# Convertir a array de numpy
img_array = np.array(img)

print(img_array.shape) 
# Suponiendo que img_array es (alto, ancho, 3)
(854, 1280, 3)
alto, ancho, canales = img_array.shape

''' Ya que PCA de Scikit-Learn solo acepta arreglos 2D, cambiamos la forma de 3D a 2D
(alto, ancho * 3(canales)) para que cada fila sea un píxel con sus 3 valores RGB'''
img_reshape = img_array.reshape(alto, ancho * canales)

pca = PCA(n_components=100) # Ajusta n_components según lo que querramos conservar
pca.fit(img_reshape)
def reconstruir_con_k_componentes(k):
    # Proyectamos los datos originales a los primeros k componentes
    # En lugar de hacer slice manual y padding, usamos transform e inverse_transform
    
    # 1. Transformar la imagen original a sus componentes principales
    proyeccion = pca.transform(img_reshape) 
    
    # 2. Creamos una copia donde borramos (ponemos a 0) los componentes &gt; k
    proyeccion_reducida = proyeccion.copy()
    proyeccion_reducida[:, k:] = 0
    
    # 3. Reconstruir al espacio original (alto * ancho * 3)
    reconstruccion = pca.inverse_transform(proyeccion_reducida)
    
    # 4. Volver a la forma de imagen original (con los 3 canales)
    return reconstruccion.reshape(alto, ancho, canales).astype(int)
fig, axes = plt.subplots(1, 4, figsize=(16, 5))

# Imagen Original (Asegúrate de pasarle los 3 canales si es color)
axes[0].imshow(img_reshape.reshape(alto, ancho, canales))
axes[0].set_title('Original')

# Reconstrucciones
for i, k_val in enumerate([10, 50, 100], 1):
    axes[i].imshow(reconstruir_con_k_componentes(k=k_val))
    axes[i].set_title(f'k={k_val}')

plt.show()

Preparación y Transformaciones Lineales

Cómo descomponer matrices con PCA y SVD

Cómo las matrices transforman vectores en Python

Eigen-Análisis

Cómo verificar la ecuación A·v = λ·v con NumPy

Matriz de covarianza y eigenvectores en Python

Reducción de Dimensionalidad con PCA

Por qué más dimensiones empeoran tus modelos ML

PCA desde cero con NumPy paso a paso