Entrenamiento y Evaluación de Modelos en PyTorch

Curso de Redes Neuronales con PyTorch

Contenido del curso

Fundamentos de PyTorch

Estructura de modelo de deep learning en PyTorch

Redes neuronales con PyTorch

Cierre del curso

24
Qué aprendiste en el curso de PyTorch
01:13 min

Tomar examen

Entrenamiento y Evaluación de Modelos en PyTorch

Resumen

Entrenar un modelo de deep learning para clasificación de texto es el paso donde todo cobra sentido. Después de definir hiperparámetros, funciones de procesamiento, optimizador y función de pérdida, llega el momento de poner el modelo a aprender y verificar si realmente puede generalizar a datos nuevos.

¿Cómo se estructura el loop de entrenamiento en PyTorch?

El proceso arranca inicializando una variable llamada best validation loss con un valor positivo infinito [01:00]. Esto funciona como referencia: cualquier pérdida real será menor que infinito, así que el primer modelo entrenado siempre se guardará como el mejor hasta ese momento.

El loop principal recorre cada época en un rango definido previamente. En cada iteración ocurren tres cosas fundamentales:

Se llama a la función entrena pasándole el dataloader de entrenamiento, lo que devuelve el accuracy promedio y la pérdida promedio de esa época.
Se llama a la función evalúa con el dataloader de validación, obteniendo también accuracy y pérdida de validación.
Se compara la pérdida de validación actual con la mejor registrada.

¿Cómo se guardan los mejores pesos del modelo?

Si la pérdida de validación actual es menor que la mejor pérdida almacenada, el modelo se considera superior y se actualiza la referencia [02:30]. En ese momento se ejecuta torch.save para guardar el state dict del modelo, que representa el estado de todos sus pesos. El archivo se guarda con extensión .pt, una convención estándar en PyTorch para almacenar pesos de modelos.

¿Qué hacer cuando aparece un error durante el entrenamiento?

Al ejecutar el entrenamiento por primera vez, apareció un error en la función evalúa [03:30]. El mensaje unsupported operand indicaba que faltaba especificar la dimensión cero al obtener el tamaño del tensor en la variable total_count. La corrección fue agregar .size(0) para extraer el entero correspondiente al tamaño del batch. Después de corregir, se usó la opción run after en el menú de runtime para reejecutar desde ese punto.

¿Qué resultados obtuvo el modelo entrenado?

El modelo alcanzó un accuracy de 0.79, lo que significa que acierta la clase correcta aproximadamente el 80% de las veces [04:15]. Un resultado sólido considerando los hiperparámetros iniciales.

Existe un detalle importante sobre el comportamiento del modelo: no desaprende. Si se vuelve a ejecutar la función de entrenamiento, el modelo continúa aprendiendo desde donde se quedó, no desde cero. Para reiniciar completamente el aprendizaje, sería necesario inicializar el modelo de nuevo [04:50].

¿Cómo ajustar hiperparámetros para mejorar el rendimiento?

Se recomienda experimentar con diferentes configuraciones:

Aumentar el learning rate por encima de 0.2, lo cual mostró mejores resultados en pruebas previas.
Modificar el número de épocas, tanto incrementándolas como reduciéndolas.
Variar el tamaño del batch para observar cómo impacta en la convergencia.

¿Qué tan bien generaliza el modelo con datos nuevos?

Hasta este punto se utilizaron dos particiones del dataset: entrenamiento y validación. Pero la prueba definitiva es evaluar con el conjunto de test, datos que el modelo nunca vio durante el entrenamiento [05:30].

Al pasar el test dataloader a la función evalúa, los resultados fueron reveladores:

El accuracy en testing fue prácticamente del 80%.
Incluso resultó ligeramente superior al obtenido en validación.

Esto confirma que el modelo aprendió patrones reales y no simplemente memorizó los datos de entrenamiento. La capacidad de generalización es la métrica que realmente importa cuando se construye un clasificador de texto.

El concepto de generalización es clave: un modelo que funciona bien solo con datos conocidos pero falla con datos nuevos sufre de overfitting. En este caso, el rendimiento consistente entre validación y test indica un entrenamiento saludable.

Si lograste resultados diferentes al modificar los hiperparámetros, comparte tu experiencia y los valores que utilizaste.

Mario Alexander Vargas Celis

Estudiante

Aquí tienes un ejemplo completo de cómo puedes realizar el **entrenamiento** y la **evaluación** de un modelo de clasificación de texto utilizando PyTorch y TorchText, asumiendo que ya tienes los datos preparados y tokenizados.

### Paso 1: Preparación de los datos

Para este ejemplo, asumiremos que ya has cargado el dataset (como **DBpedia**) y creado tu vocabulario. También vamos a usar un DataLoader para manejar los datos en mini-lotes.

### Paso 2: Definir el modelo

El modelo que vamos a usar es una simple red neuronal con una capa de embeddings, una capa recurrente (GRU), y una capa completamente conectada para la clasificación.


import torch

import torch.nn as nn

import torch.optim as optim



class TextClassificationModel(nn.Module):

&#x20;   def \_\_init\_\_(self, vocab\_size, embed\_dim, num\_class):

&#x20;       super(TextClassificationModel, self).\_\_init\_\_()

&#x20;       self.embedding = nn.EmbeddingBag(vocab\_size, embed\_dim, sparse=True)

&#x20;       self.fc = nn.Linear(embed\_dim, num\_class)

&#x20;       self.init\_weights()



&#x20;   def init\_weights(self):

&#x20;       initrange = 0.5

&#x20;       self.embedding.weight.data.uniform\_(-initrange, initrange)

&#x20;       self.fc.weight.data.uniform\_(-initrange, initrange)

&#x20;       self.fc.bias.data.zero\_()



&#x20;   def forward(self, text, offsets):

&#x20;       embedded = self.embedding(text, offsets)

&#x20;       return self.fc(embedded)

### Paso 3: Entrenamiento del modelo

#### Función de entrenamiento


def train(dataloader, model, criterion, optimizer):

&#x20;   model.train()

&#x20;   total\_acc, total\_count = 0, 0

&#x20;   log\_interval = 500

&#x20;   for idx, (label, text, offsets) in enumerate(dataloader):

&#x20;       optimizer.zero\_grad()

&#x20;       predicted\_label = model(text, offsets)

&#x20;       loss = criterion(predicted\_label, label)

&#x20;       loss.backward()

&#x20;       torch.nn.utils.clip\_grad\_norm\_(model.parameters(), 0.1)  # Evitar gradientes explosivos

&#x20;       optimizer.step()



&#x20;       total\_acc += (predicted\_label.argmax(1) == label).sum().item()

&#x20;       total\_count += label.size(0)



&#x20;       if idx % log\_interval == 0 and idx > 0:

&#x20;           print(f'Batch {idx}: Accuracy: {total\_acc/total\_count:.4f}')

&#x20;           total\_acc, total\_count = 0, 0

### Paso 4: Evaluación del modelo

#### Función de evaluación

Para evaluar el modelo, no aplicamos gradientes, y calculamos la precisión en el conjunto de prueba.


def evaluate(dataloader, model, criterion):

&#x20;   model.eval()

&#x20;   total\_acc, total\_count = 0, 0

&#x20;   with torch.no\_grad():

&#x20;       for label, text, offsets in dataloader:

&#x20;           predicted\_label = model(text, offsets)

&#x20;           loss = criterion(predicted\_label, label)

&#x20;           total\_acc += (predicted\_label.argmax(1) == label).sum().item()

&#x20;           total\_count += label.size(0)

&#x20;   return total\_acc/total\_count

### Paso 5: Entrenar y evaluar


VOCAB\_SIZE = len(vocab)  # Tamaño del vocabulario

EMBED\_DIM = 64  # Dimensión de los embeddings

NUM\_CLASS = len(set(\[label for (label, text) in train\_iter]))  # Número de clases



model = TextClassificationModel(VOCAB\_SIZE, EMBED\_DIM, NUM\_CLASS).to(device)

optimizer = optim.SGD(model.parameters(), lr=0.001)

criterion = nn.CrossEntropyLoss()



\# Entrenamiento

for epoch in range(10):

&#x20;   train(train\_dataloader, model, criterion, optimizer)

&#x20;   acc = evaluate(test\_dataloader, model, criterion)

&#x20;   print(f'Epoch {epoch+1}: Test Accuracy: {acc:.4f}')

### Paso 6: Preparar los datos para DataLoader

Antes de entrenar el modelo, es necesario definir un DataLoader que maneje cómo se cargarán los datos en mini-lotes. Aquí te dejo un ejemplo de cómo preparar los datos:


from torch.utils.data import DataLoader

from torchtext.datasets import DBpedia

from torchtext.data.utils import get\_tokenizer



tokenizer = get\_tokenizer('basic\_english')



def yield\_tokens(data\_iter):

&#x20;   for \_, text in data\_iter:

&#x20;       yield tokenizer(text)



vocab = build\_vocab\_from\_iterator(yield\_tokens(train\_iter), specials=\["\<unk>"])

vocab.set\_default\_index(vocab\["\<unk>"])



def collate\_batch(batch):

&#x20;   label\_list, text\_list, offsets = \[], \[], \[0]

&#x20;   for (\_label, \_text) in batch:

&#x20;       label\_list.append(int(\_label) - 1)

&#x20;       processed\_text = torch.tensor(vocab(tokenizer(\_text)), dtype=torch.int64)

&#x20;       text\_list.append(processed\_text)

&#x20;       offsets.append(processed\_text.size(0))

&#x20;   label\_list = torch.tensor(label\_list, dtype=torch.int64)

&#x20;   text\_list = torch.cat(text\_list)

&#x20;   offsets = torch.tensor(offsets\[:-1]).cumsum(dim=0)

&#x20;   return label\_list, text\_list, offsets



train\_iter = DBpedia(split='train')

test\_iter = DBpedia(split='test')



train\_dataloader = DataLoader(train\_iter, batch\_size=8, shuffle=True, collate\_fn=collate\_batch)

test\_dataloader = DataLoader(test\_iter, batch\_size=8, shuffle=True, collate\_fn=collate\_batch)

### Conclusión

Este es un flujo básico de cómo entrenar y evaluar un modelo de clasificación de texto con PyTorch. El modelo usa embeddings simples y una capa de clasificación, pero puedes mejorarlo añadiendo capas más complejas como LSTM o CNN. También puedes probar diferentes optimizadores, tasas de aprendizaje y técnicas de regularización para obtener mejores resultados.

Entrenamiento y Evaluación de Modelos en PyTorch

Fundamentos de PyTorch

Clasificación de Texto con PyTorch y TorchText en Google Colab

Introducción a PyTorch: Ventajas y Comparación con Otros Frameworks

Clasificador de texto con nn.Module en PyTorch

Tensores en PyTorch desde cero

Debuguea tensores en PyTorch sin errores

Operaciones con tensores y conversión NumPy-PyTorch

Estructura de modelo de deep learning en PyTorch

Regresión Lineal con PyTorch: Creación y Partición de Datos Artificiales

Regresión lineal desde cero en PyTorch

Bucle de entrenamiento con SGD en PyTorch

Entrenamiento y Visualización de Modelos de Regresión Lineal en PyTorch

Inferencia y predicciones con PyTorch

Redes neuronales con PyTorch

Clasificación de texto con TorchText y DBpedia

Tokenización y Vocabulario en TorchText para DBpedia

DataLoader y collate function en PyTorch

Arquitectura de clasificación de texto en PyTorch

Entrenamiento de Modelos de Clasificación con DBpedia Dataset

Evaluación de Modelos de Aprendizaje Automático en PyTorch

Optimizador y splits de datos en PyTorch