En PyTorch, el proceso de entrenamiento de un modelo implica definir una \*\*función de pérdida\*\* (loss function) y un \*\*optimizador\...

Mario Alexander Vargas Celis

Pregunta

student•

En PyTorch, el proceso de entrenamiento de un modelo implica definir una **función de pérdida** (loss function) y un **optimizador**, que se encargan de actualizar los pesos del modelo en función del error entre las predicciones del modelo y los valores reales. Aquí te explico cada uno de estos elementos y te doy un ejemplo práctico.

### Entrenamiento en PyTorch: Conceptos Clave

1. **Función de Pérdida (Loss Function):**

La función de pérdida mide la diferencia entre las predicciones del modelo y los valores verdaderos. Su valor se minimiza durante el entrenamiento. Algunas funciones comunes son:

nn.MSELoss

: Para problemas de regresión (Minimiza el error cuadrático medio).

nn.CrossEntropyLoss

: Para problemas de clasificación múltiple.

nn.BCELoss

: Para problemas de clasificación binaria.

2. **Optimizador:**

El optimizador es el algoritmo que ajusta los pesos del modelo para reducir la función de pérdida. Un optimizador popular es **Stochastic Gradient Descent (SGD)**, pero PyTorch también ofrece otros optimizadores como **Adam**.

torch.optim.SGD

: Descenso de gradiente estocástico.

torch.optim.Adam

: Un optimizador más avanzado, que a menudo funciona mejor en redes más complejas.

3. **Ciclo de Entrenamiento:**

- **Paso 1:** Pasar los datos de entrada a través del modelo.

- **Paso 2:** Calcular la pérdida entre las predicciones y los valores reales.

- **Paso 3:** Retropropagar el error (backpropagation).

- **Paso 4:** Actualizar los pesos utilizando el optimizador.

### Ejemplo Completo

Este es un ejemplo de entrenamiento de un modelo simple con una función de pérdida y un optimizador.


import torch

import torch.nn as nn

import torch.optim as optim



\# Definición del modelo (similar al ejemplo anterior)

class SimpleNN(nn.Module):

&#x20;   def \_\_init\_\_(self, input\_size, hidden\_size, output\_size):

&#x20;       super(SimpleNN, self).\_\_init\_\_()

&#x20;       self.fc1 = nn.Linear(input\_size, hidden\_size)  # Capa oculta

&#x20;       self.fc2 = nn.Linear(hidden\_size, output\_size)  # Capa de salida

&#x20;       self.relu = nn.ReLU()  # Función de activación ReLU



&#x20;   def forward(self, x):

&#x20;       x = self.fc1(x)

&#x20;       x = self.relu(x)

&#x20;       x = self.fc2(x)

&#x20;       return x



\# Parámetros del modelo

input\_size = 10

hidden\_size = 5

output\_size = 1

learning\_rate = 0.01



\# Crear una instancia del modelo

model = SimpleNN(input\_size, hidden\_size, output\_size)



\# Definir la función de pérdida y el optimizador

criterion = nn.MSELoss()  # Pérdida para regresión

optimizer = optim.SGD(model.parameters(), lr=learning\_rate)  # Optimizador SGD



\# Datos ficticios para entrenamiento

inputs = torch.randn(100, input\_size)  # 100 ejemplos, 10 características

targets = torch.randn(100, output\_size)  # 100 etiquetas de salida



\# Entrenamiento del modelo

num\_epochs = 100



for epoch in range(num\_epochs):

&#x20;   \# Paso hacia adelante (Forward pass): calcular predicciones

&#x20;   outputs = model(inputs)

&#x20;  &#x20;

&#x20;   \# Calcular la pérdida

&#x20;   loss = criterion(outputs, targets)

&#x20;  &#x20;

&#x20;   \# Paso hacia atrás (Backward pass): retropropagación

&#x20;   optimizer.zero\_grad()  # Resetear los gradientes

&#x20;   loss.backward()  # Calcular los gradientes

&#x20;  &#x20;

&#x20;   \# Actualizar los pesos

&#x20;   optimizer.step()  # Actualizar los parámetros del modelo

&#x20;  &#x20;

&#x20;   \# Imprimir la pérdida en intervalos

&#x20;   if (epoch+1) % 10 == 0:

&#x20;       print(f'Epoch \[{epoch+1}/{num\_epochs}], Loss: {loss.item():.4f}')



\# Predicción con el modelo entrenado

test\_input = torch.randn(1, input\_size)

predicted\_output = model(test\_input)

print(f'Predicted Output: {predicted\_output}')

### Explicación Paso a Paso

1. **Modelo:** Usamos una red neuronal simple con una capa oculta y una función de activación ReLU.

2. **Función de pérdida (

criterion

):** Se utiliza

MSELoss

(Error Cuadrático Medio) para este ejemplo de regresión.

3. **Optimizador (

optimizer

):** Se usa SGD (Stochastic Gradient Descent) con una tasa de aprendizaje de 0.01.

4. **Datos de Entrenamiento:** Generamos datos ficticios aleatorios para los ejemplos y etiquetas.

5. **Ciclo de Entrenamiento:**

- Se calculan las predicciones del modelo.

- Se calcula la pérdida comparando las predicciones con las etiquetas reales.

- Se retropropaga el error para calcular los gradientes.

- Se actualizan los pesos del modelo con el optimizador.

6. **Impresión del Progreso:** Se imprime la pérdida cada 10 épocas.

### Otras Funciones de Pérdida y Optimizadores

#### Funciones de Pérdida Comunes:

nn.CrossEntropyLoss

: Para clasificación múltiple.

nn.BCELoss

: Para clasificación binaria.

#### Optimizadores Comunes:

torch.optim.Adam

: Un optimizador avanzado que usa tasas de aprendizaje adaptativas.

torch.optim.RMSprop

: Similar a Adam, pero con algunas diferencias en cómo actualiza los parámetros.

Este es el flujo básico del entrenamiento de modelos en PyTorch. ¿Te gustaría ver más ejemplos o detalles sobre algún otro optimizador o tipo de función de pérdida?

Platzi

Generado con IA•

{"Función de Pérdida (Loss Function)":"La función de pérdida mide la diferencia entre las predicciones del modelo y los valores verdaderos.","Optimizador":"El optimizador ajusta los pesos del modelo para reducir la función de pérdida."}

En PyTorch, el proceso de entrenamiento de un modelo implica definir una \\función de pérdida\\ (loss function) y un \\optimizador\...

Curso de Redes Neuronales con PyTorch

Curso de Redes Neuronales con PyTorch