Entrenamiento de Modelos de Clasificación con DBpedia Dataset

Curso de Redes Neuronales con PyTorch

Contenido del curso

Fundamentos de PyTorch

Estructura de modelo de deep learning en PyTorch

Redes neuronales con PyTorch

Cierre del curso

24
Qué aprendiste en el curso de PyTorch
01:13 min

Tomar examen

Entrenamiento de Modelos de Clasificación con DBpedia Dataset

Resumen

¿Cómo diseñar una función de entrenamiento para un modelo de Machine Learning?

Diseñar una función de entrenamiento efectiva es crucial para mejorar el rendimiento de un modelo de clasificación. En esta clase, hemos creado una función llamada Entrena que se utiliza para fomentar el aprendizaje de un modelo en base a un conjunto de datos. A continuación, desglosamos los elementos clave y pasos seguidos para lograrlo.

¿Qué pasos iniciales se deben considerar?

Definir el modo del modelo: Al comienzo de la función, se coloca el modelo en modo de entrenamiento (train). Esto permite que el modelo se ajuste y modifique sus parámetros.
Inicializar variables: Se establece un seguimiento de métricas esenciales, como la precisión de la época (Epoch Accuracy o ACK) y la pérdida (Epoch Loss). Además, se cuenta con Total Count, el total de ejemplos en el lote o batch.

¿Cómo se iteran los datos con un Data Loader?

Utilizamos un bucle sobre el data loader para extraer la información necesaria:

Índice del ejemplo: Relevante para el seguimiento del progreso.
Datos de cada lote: Incluyen etiqueta, texto y offsets definidos en la función de agrupación (Colate Function).

Una vez extraídos, los gradientes deben restablecerse a cero para evitar acumulación de errores de iteraciones anteriores.

¿Cuál es la importancia de la predicción y la pérdida?

Predicción: Utilizamos el modelo para obtener predicciones basadas en el texto y los offsets.
Cálculo de pérdida: Esta se determina comparando las predicciones con las etiquetas reales. Se utiliza un criterio específico para medir y evaluar qué tanto mejora o empeora el modelo.

prediccion = modelo(texto, offsets)
perdida = criterio(prediccion, etiqueta)

¿Cómo se manejan los gradientes y la actualización de pesos?

Propagación hacia atrás: A través de backward, se calculan los gradientes de pérdida con respecto a los pesos del modelo.
Normalización de gradientes: Para evitar que se eleve y desestabilice, se utiliza clip-rat-norm, limitando la norma a un valor máximo de 0.1.
Actualización de pesos: Con step, los pesos se ajustan en función de los gradientes calculados, mejorando así el modelo.

¿Cómo se reporta el progreso del entrenamiento?

Es fundamental reportar métricas para monitorear el avance:

Imprimir informe: Si el índice es múltiplo de 500 (y mayor a cero), se imprimen detalles del progreso, como el número de época, ejemplos procesados, pérdida promedio y precisión.

if idx > 0 and idx % 500 == 0:
    print(f"Época {nro_epoca}, Procesados {idx}/{len(data_loader)} ejemplos, Pérdida: {epoch_loss/total_count}, Precisión: {epoch_accuracy/total_count}")

¿Cuál es el valor de separar funciones de entrenamiento?

Separar las funciones en secciones (como entrenamiento y validación) permite un código más limpio, fácil de mantener y depurar. Esto facilita identificar y corregir errores, promoviendo un enfoque más sistemático en el aprendizaje automático.

Este proceso de diseño de funciones es una habilidad fundamental en el desarrollo de modelos de Machine Learning. ¡Sigue adelante con tu práctica y mejora continua!

import torch

import torch.nn as nn

import torch.optim as optim

def train\_model(model, train\_loader, valid\_loader, optimizer, criterion, num\_epochs, device):

&#x20;   model.to(device)

&#x20;  &#x20;

&#x20;   \# Bucle de entrenamiento

&#x20;   for epoch in range(num\_epochs):

&#x20;       model.train()  # Poner el modelo en modo de entrenamiento

&#x20;       running\_loss = 0.0

&#x20;       correct\_predictions = 0

&#x20;       total\_samples = 0

&#x20;       for inputs, labels in train\_loader:

&#x20;           inputs, labels = inputs.to(device), labels.to(device)

&#x20;           \# Reiniciar gradientes

&#x20;           optimizer.zero\_grad()

&#x20;           \# Forward pass

&#x20;           outputs = model(inputs)

&#x20;           loss = criterion(outputs, labels)

&#x20;          &#x20;

&#x20;           \# Backward pass y optimización

&#x20;           loss.backward()

&#x20;           optimizer.step()

&#x20;           \# Acumular la pérdida y calcular predicciones correctas

&#x20;           running\_loss += loss.item() \* inputs.size(0)

&#x20;           \_, predicted = torch.max(outputs, 1)

&#x20;           correct\_predictions += (predicted == labels).sum().item()

&#x20;           total\_samples += labels.size(0)

&#x20;      &#x20;

&#x20;       epoch\_loss = running\_loss / total\_samples

&#x20;       epoch\_acc = correct\_predictions / total\_samples

&#x20;       print(f"Epoch {epoch+1}/{num\_epochs} - Loss: {epoch\_loss:.4f}, Accuracy: {epoch\_acc:.4f}")

&#x20;       \# Validación al final de cada época

&#x20;       model.eval()  # Poner el modelo en modo de evaluación

&#x20;       val\_loss = 0.0

&#x20;       val\_correct\_predictions = 0

&#x20;       val\_total\_samples = 0

&#x20;       with torch.no\_grad():

&#x20;           for val\_inputs, val\_labels in valid\_loader:

&#x20;               val\_inputs, val\_labels = val\_inputs.to(device), val\_labels.to(device)

&#x20;               val\_outputs = model(val\_inputs)

&#x20;               loss = criterion(val\_outputs, val\_labels)

&#x20;               val\_loss += loss.item() \* val\_inputs.size(0)

&#x20;               \_, val\_predicted = torch.max(val\_outputs, 1)

&#x20;               val\_correct\_predictions += (val\_predicted == val\_labels).sum().item()

&#x20;               val\_total\_samples += val\_labels.size(0)

&#x20;       val\_loss /= val\_total\_samples

&#x20;       val\_acc = val\_correct\_predictions / val\_total\_samples

&#x20;       print(f"Validation Loss: {val\_loss:.4f}, Validation Accuracy: {val\_acc:.4f}")

\# Inicializar el modelo, optimizador, y función de pérdida

model = MyTextClassifierModel()  # Reemplaza con tu modelo

optimizer = optim.Adam(model.parameters(), lr=0.001)

criterion = nn.CrossEntropyLoss()

\# Llamar a la función de entrenamiento

train\_model(model, train\_loader, valid\_loader, optimizer, criterion, num\_epochs=10, device="cuda")

import torch

import torch.nn as nn

import torch.optim as optim

def train\_model(model, train\_loader, valid\_loader, optimizer, criterion, num\_epochs, device):

&#x20;   model.to(device)

&#x20;  &#x20;

&#x20;   \# Bucle de entrenamiento

&#x20;   for epoch in range(num\_epochs):

&#x20;       model.train()  # Poner el modelo en modo de entrenamiento

&#x20;       running\_loss = 0.0

&#x20;       correct\_predictions = 0

&#x20;       total\_samples = 0

&#x20;       for inputs, labels in train\_loader:

&#x20;           inputs, labels = inputs.to(device), labels.to(device)

&#x20;           \# Reiniciar gradientes

&#x20;           optimizer.zero\_grad()

&#x20;           \# Forward pass

&#x20;           outputs = model(inputs)

&#x20;           loss = criterion(outputs, labels)

&#x20;          &#x20;

&#x20;           \# Backward pass y optimización

&#x20;           loss.backward()

&#x20;           optimizer.step()

&#x20;           \# Acumular la pérdida y calcular predicciones correctas

&#x20;           running\_loss += loss.item() \* inputs.size(0)

&#x20;           \_, predicted = torch.max(outputs, 1)

&#x20;           correct\_predictions += (predicted == labels).sum().item()

&#x20;           total\_samples += labels.size(0)

&#x20;      &#x20;

&#x20;       epoch\_loss = running\_loss / total\_samples

&#x20;       epoch\_acc = correct\_predictions / total\_samples

&#x20;       print(f"Epoch {epoch+1}/{num\_epochs} - Loss: {epoch\_loss:.4f}, Accuracy: {epoch\_acc:.4f}")

&#x20;       \# Validación al final de cada época

&#x20;       model.eval()  # Poner el modelo en modo de evaluación

&#x20;       val\_loss = 0.0

&#x20;       val\_correct\_predictions = 0

&#x20;       val\_total\_samples = 0

&#x20;       with torch.no\_grad():

&#x20;           for val\_inputs, val\_labels in valid\_loader:

&#x20;               val\_inputs, val\_labels = val\_inputs.to(device), val\_labels.to(device)

&#x20;               val\_outputs = model(val\_inputs)

&#x20;               loss = criterion(val\_outputs, val\_labels)

&#x20;               val\_loss += loss.item() \* val\_inputs.size(0)

&#x20;               \_, val\_predicted = torch.max(val\_outputs, 1)

&#x20;               val\_correct\_predictions += (val\_predicted == val\_labels).sum().item()

&#x20;               val\_total\_samples += val\_labels.size(0)

&#x20;       val\_loss /= val\_total\_samples

&#x20;       val\_acc = val\_correct\_predictions / val\_total\_samples

&#x20;       print(f"Validation Loss: {val\_loss:.4f}, Validation Accuracy: {val\_acc:.4f}")

\# Inicializar el modelo, optimizador, y función de pérdida

model = MyTextClassifierModel()  # Reemplaza con tu modelo

optimizer = optim.Adam(model.parameters(), lr=0.001)

criterion = nn.CrossEntropyLoss()

\# Llamar a la función de entrenamiento

train\_model(model, train\_loader, valid\_loader, optimizer, criterion, num\_epochs=10, device="cuda")

Entrenamiento de Modelos de Clasificación con DBpedia Dataset

Fundamentos de PyTorch

Clasificación de Texto con PyTorch y TorchText en Google Colab

Introducción a PyTorch: Ventajas y Comparación con Otros Frameworks

Clasificador de texto con nn.Module en PyTorch

Tensores en PyTorch desde cero

Debuguea tensores en PyTorch sin errores

Operaciones con tensores y conversión NumPy-PyTorch

Estructura de modelo de deep learning en PyTorch

Regresión Lineal con PyTorch: Creación y Partición de Datos Artificiales

Regresión lineal desde cero en PyTorch

Bucle de entrenamiento con SGD en PyTorch

Entrenamiento y Visualización de Modelos de Regresión Lineal en PyTorch

Inferencia y predicciones con PyTorch

Redes neuronales con PyTorch

Clasificación de texto con TorchText y DBpedia

Tokenización y Vocabulario en TorchText para DBpedia

DataLoader y collate function en PyTorch

Arquitectura de clasificación de texto en PyTorch