Andrés Cardona
student•
hace 7 meses
Texto académico: ¿Cuándo usar cada tipo de pooling?
🔹 1. Max Pooling
- Qué hace: conserva el valor más alto de cada región.
- Cuándo usarlo:
- En las primeras capas de CNN, para detectar bordes, texturas y características locales dominantes.
- Cuando se busca robustez frente al ruido → el máximo suele sobrevivir aunque haya valores espurios pequeños.
- En problemas de clasificación de imágenes (ej. CIFAR, ImageNet), es el más usado.
- Ventaja clave: resalta patrones importantes y descarta detalles menores.
🔹 2. Average Pooling
- Qué hace: calcula el promedio de los valores en cada región.
- Cuándo usarlo:
- En redes donde interesa suavizar y mantener la información global, no solo los picos.
- En etapas intermedias o previas a capas densas, cuando se busca un resumen estable de la activación.
- En aplicaciones biomédicas, puede ser útil para no perder señales sutiles (ej. texturas celulares).
- Ventaja clave: produce representaciones más suaves y menos sesgadas hacia valores extremos.
🔹 3. Global Pooling (Global Average o Global Max)
- Qué hace: reduce cada mapa de características a un único valor (por canal).
- Cuándo usarlo:
- En arquitecturas modernas (ResNet, Inception, MobileNet) como alternativa a fully connected layers → reduce drásticamente parámetros.
- En problemas con gran riesgo de sobreajuste → evita usar millones de pesos de una capa densa.
- Para clasificación final, justo antes de la capa softmax.
- Ventaja clave: fuerza a la red a hacer un resumen global del feature map, favoreciendo generalización.
🔹 Otros Poolings
- Stochastic Pooling: elige aleatoriamente un valor de la región, proporcional a su magnitud.
- Útil para regularización en entrenamientos pequeños.
- Adaptive Pooling: ajusta dinámicamente el tamaño de salida (ej. para forzar siempre un 7×7 antes de la capa final, sin importar el tamaño de entrada).
- Útil en arquitecturas que reciben imágenes de dimensiones variables.
