Configuración de función de pérdida y optimizadores en redes neuronales

Clase 11 de 15 • Curso de Redes Neuronales Convolucionales

Resumen

Identificar enfermedades como neumonía mediante inteligencia artificial implica entrenar modelos capaces de reconocer patrones en imágenes médicas. Para crear un sistema así, es crucial entender cómo configurar correctamente la función de pérdida, el optimizador y el scheduler durante el entrenamiento.

¿Qué función de pérdida utilizar en clasificación médica?

La función de pérdida (loss function) mide cuán lejos están las predicciones del modelo respecto a las etiquetas reales. Para problemas de clasificación, como detectar neumonía, es habitual utilizar cross entropy loss o entropía cruzada porque permite trabajar con múltiples clases y añadir nuevas enfermedades en el futuro.

Esta función aplica internamente una operación matemática llamada softmax, que convierte valores crudos (logits) en probabilidades. Por ejemplo, si el modelo asigna probabilidades como 0.24, 0.59 o 0.0986 a diferentes categorías, la entropía cruzada determinará cuánto se alejan estas predicciones de la verdadera clase de la imagen médica.

En código, usando Torch, se vería así:

import torch
logits = torch.Tensor([0.24, 0.59, 0.0986])
etiqueta_real = torch.tensor([1])
loss_fn = torch.nn.CrossEntropyLoss()
loss = loss_fn(logits.unsqueeze(0), etiqueta_real)

¿Cuál optimizador elegir según el problema?

El optimizador es clave porque actualiza los pesos internos de la red neuronal, ayudándola a aprender durante cada iteración del entrenamiento. Existen diferentes tipos, como SGD, Adam y RMSProp.

SGD: recomendado generalmente para clasificación multiclase por su estabilidad.
Adam: aconsejable cuando no hay claridad sobre cuál optimizador usar dado su costo computacional bajo.

¿Cómo ajustar dinámicamente el Learning Rate con el Scheduler?

El scheduler facilita el entrenamiento al modificar dinámicamente la tasa de aprendizaje (learning rate) del modelo en cada etapa o iteración. Utilizando valores pequeños, como 0.001, y multiplicando periódicamente esta tasa por un factor pequeño, el modelo logra ajustar con más precisión sus parámetros, acelerando la convergencia hacia mejores predicciones.

Por ejemplo:

optimizer = torch.optim.SGD(model.parameters(), lr=0.001)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

Aquí, cada siete iteraciones, el learning rate disminuye multiplicándose por 0.1, permitiendo un aprendizaje más fino con el paso del tiempo.

¿Cómo funciona el entrenamiento de un modelo de detección de neumonía?

Durante el entrenamiento, se combina todo lo anterior en un proceso iterativo:

Se define la arquitectura del modelo, la función de pérdida, el optimizador y el scheduler.
Se realiza el entrenamiento a lo largo de un número definido de epochs (iteraciones).
Se lleva control del tiempo y se guardan los mejores pesos obtenidos para lograr mayor efectividad.
En cada epoch se realizan fases separadas de entrenamiento (train) y validación (eval) para optimizar memoria y desempeño.

Al terminar, la métrica de precisión (accuracy) indica cuántas predicciones fueron correctas sobre el total realizadas. Generalmente, en la práctica médica e industrial, valores superiores al 70% se consideran aceptables e indicativos de un buen modelo.

¿Qué esperar tras finalizar el entrenamiento?

Una vez entrenado, el modelo podrá predecir casos de neumonía en nuevas imágenes médicas. Mediante visualizaciones simples, es posible confirmar la efectividad visualmente:

Predicciones correctas coincidiendo entre la categoría predicha por el modelo y la real.
Fácil identificación de diagnósticos visualizando imágenes etiquetadas correctamente por la red entrenada.

Finalmente, tras verificar el rendimiento de las predicciones, se puede guardar y usar este modelo para analizar nuevas imágenes médicas propias en futuras aplicaciones clínicas o investigativas.