Redes neuronales con PyTorch paso a paso

Curso de Fundamentos de Machine Learning

Contenido del curso

No sé dónde empezar

Fundamentos de Machine Learning y Contexto Deportivo

Preparación y Exploración de Datos

Ingeniería de Características

Modelado Predictivo Supervisado

Aprendizaje No Supervisado

Redes neuronales con PyTorch paso a paso

Resumen

Las redes neuronales artificiales (RNA) son la base del deep learning y permiten que un modelo aprenda patrones a partir de datos sin reglas explícitas. Aquí verás cómo construir, entrenar y evaluar una RNA en PyTorch aplicada a clasificación binaria, ideal para quienes inician en inteligencia artificial aplicada al deporte.

¿Qué librerías necesitas para construir una red neuronal en PyTorch?

Antes de escribir la primera capa, conviene tener claro qué hace cada herramienta. La combinación de PyTorch y NumPy cubre desde el manejo de tensores hasta la actualización automática de pesos.

torch: librería base para tensores y autograd.
torch.nn: contiene capas y bloques de construcción de redes.
torch.optim: gestiona la actualización de pesos durante el entrenamiento.
NumPy: trabaja con arrays en Python y alimenta los datos iniciales.

¿Qué es autograd en PyTorch? Es el motor que calcula gradientes automáticamente durante el backward pass, evitando que tengas que derivar funciones a mano.

¿Cómo se preparan los datos para entrenar una RNA?

El ejemplo parte de un dataset sintético de 100 muestras, cada una con cuatro características y una etiqueta binaria. Primero generas entradas y etiquetas con NumPy y después las conviertes a tensores con torch.from_numpy para que PyTorch las procese [00:48].

Este paso es clave: una red neuronal no entiende arrays de NumPy directamente, necesita tensores que soporten operaciones diferenciables.

¿Cómo se define la arquitectura de la red neuronal?

La red del ejemplo tiene dos capas: una oculta de ocho neuronas y una salida sigmoide para clasificación binaria [01:25]. Se construye con nn.Linear, que define capas totalmente conectadas, y se combinan dos funciones de activación.

¿Qué hacen ReLU y Sigmoid dentro del modelo?

ReLU: introduce no linealidad en la capa oculta, permitiendo que la red aprenda patrones complejos.
Sigmoid: comprime la salida a un rango entre 0 y 1, perfecto para clasificación binaria.

En el método forward defines el flujo: linear → ReLU → linear → Sigmoid. Ese orden marca cómo viaja la información desde la entrada hasta la predicción.

¿Qué función de pérdida y optimizador usar para clasificación binaria?

La función de pérdida elegida es BCELoss (Binary Cross Entropy), que espera salidas entre 0 y 1, justo lo que entrega la sigmoide [02:05]. Para actualizar los pesos se usa Adam desde torch.optim, que ajusta los parámetros usando los gradientes calculados automáticamente.

¿Por qué Adam y no otro optimizador? Adam combina velocidad de convergencia y estabilidad, adaptando la tasa de aprendizaje por parámetro. Es una opción robusta para empezar sin afinar demasiados hiperparámetros.

¿Cómo es el ciclo de entrenamiento de una red en PyTorch?

El entrenamiento itera por épocas y batches. En cada paso ocurre lo siguiente:

Calcular y_pred con el forward pass.
Comparar la predicción con y_batch mediante la función loss.
Limpiar gradientes previos con zero_grad.
Calcular nuevos gradientes con backward.
Actualizar los pesos con optimizer.step.

Al final de cada época se imprime la pérdida del último batch para monitorear el avance [02:38]. Si la pérdida baja de forma consistente, la red está aprendiendo.

¿Cómo evaluar la precisión del modelo entrenado?

La evaluación se hace dentro de un bloque torch.no_grad, que desactiva el cálculo de gradientes para acelerar la inferencia [03:05]. Las probabilidades de la sigmoide se convierten en etiquetas binarias usando un umbral de 0.5 y luego se calcula la media de aciertos.

En este caso, la precisión obtenida fue del 57%, cercana al 60%. Es un punto de partida razonable para un dataset sintético pequeño, y deja espacio para mejorar con más datos o ajustes de arquitectura.

¿Cómo afecta la profundidad de la red a la precisión?

La parte interactiva del ejercicio usa una clase RedIn que permite crear entre una y cinco capas ocultas dinámicas, cada una con cuatro neuronas, apoyándose en ModuleList para iterarlas dentro del forward [03:55]. El entrenamiento corre tres épocas rápidas por configuración para comparar resultados.

Mover el slider deja ver el famoso trade off del deep learning:

Pocas capas: la red puede quedarse corta y no captar patrones suficientes.
Muchas capas: gana capacidad pero crece el riesgo de sobreajuste, sobre todo con datasets pequeños.

Inspeccionar el modelo imprimiéndolo te muestra las dimensiones de cada capa y el número total de parámetros entrenables, una verificación rápida antes de escalar el experimento.

¿Cuántas capas ocultas te dieron la mejor precisión al mover el slider? Cuéntame en los comentarios cómo te fue y qué configuración usarías para un caso real de análisis de video deportivo.

Mario Alexander Vargas Celis

Estudiante

Las redes neuronales artificiales (ANN) con PyTorch son una herramienta poderosa para tareas como clasificación binaria, por ejemplo:

¿Un equipo gana (1) o no gana (0) un partido?

⚙️ ¿Qué cubriremos?

Estructura de una red neuronal para clasificación binaria
Código en PyTorch paso a paso
Entrenamiento, evaluación y predicción

✅ Paso 1: Librerías necesarias

import torch import torch.nn as nn import torch.optim as optim from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score import numpy as np

✅ Paso 2: Datos de ejemplo

Supongamos que tienes estadísticas de partidos:

# X = tiros al arco, posesión, pases, etc. X = np.array([ [5, 60, 300], [2, 45, 150], [8, 70, 400], [3, 40, 100], [6, 65, 280] ])

# y = 1 si ganó el equipo, 0 si no y = np.array([1, 0, 1, 0, 1])

✅ Paso 3: Preprocesamiento

scaler = StandardScaler() X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split( X_scaled, y, test_size=0.2, random_state=42)

X_train = torch.tensor(X_train, dtype=torch.float32) X_test = torch.tensor(X_test, dtype=torch.float32) y_train = torch.tensor(y_train, dtype=torch.float32).view(-1, 1) y_test = torch.tensor(y_test, dtype=torch.float32).view(-1, 1)

✅ Paso 4: Red neuronal

class RedBinaria(nn.Module): def __init__(self): super(RedBinaria, self).__init__() self.net = nn.Sequential( nn.Linear(3, 8), # 3 features de entrada nn.ReLU(), nn.Linear(8, 4), nn.ReLU(), nn.Linear(4, 1), nn.Sigmoid() # Activación para clasificación binaria )

def forward(self, x): return self.net(x)

✅ Paso 5: Entrenamiento

modelo = RedBinaria() criterio = nn.BCELoss() # Binary Cross Entropy optimizador = optim.Adam(modelo.parameters(), lr=0.01)

# Entrenar for epoch in range(200): modelo.train() salida = modelo(X_train) loss = criterio(salida, y_train) optimizador.zero_grad() loss.backward() optimizador.step()

if epoch % 20 == 0: print(f"Epoch {epoch}, Loss: {loss.item():.4f}")

✅ Paso 6: Evaluación

modelo.eval() with torch.no_grad(): pred = modelo(X_test) pred_labels = (pred >= 0.5).float()

accuracy = accuracy_score(y_test, pred_labels) print(f"Accuracy: {accuracy:.2f}")

✅ ¿Qué puedes ajustar?

Cantidad de capas o neuronas
Activaciones (ReLU, Tanh)
Métricas (F1, precisión, recall)
Función de pérdida (por ejemplo BCEWithLogitsLoss sin Sigmoid)

Alexis Aquino Noriega

Juan Acevedo

Juan Manuel Pinto Hernández

Franco Sosa

Diego Díaz Mendaña

Gabriel Obregón

Wilson Stiven Aguirre Mahecha

Javier Emanuel González Andrade

Madison Eduardo Herrera Carrión

Bryan Castano

Mauricio García Grajales

Juan Osorio

Profesor

Amelia Esther Alter Pino

Juan Riquelme

Daniel Condía Figueredo

Daniel Guerrero

Esteban Bastías B.

Fernando Lavao Orjuela

Nicolás Melgarejo

Valentina Cobo Paz

Jason Sepulveda

Michael Heredia Pérez

Redes neuronales con PyTorch paso a paso

Fundamentos de Machine Learning y Contexto Deportivo

Supervisado, no supervisado o refuerzo: cuál elegir

Modelos supervisados para predecir partidos

Clustering y PCA sin etiquetas en datos

Configuración de Python y Jupyter para análisis deportivo

Preparación y Exploración de Datos

Limpieza de datos CSV con Pandas

Estadística descriptiva para analizar partidos

MinMaxScaler y StandardScaler en Python

Ingeniería de Características

Feature engineering con pandas para fútbol

Selección de características con SelectKBest y árboles de decisión

Modelado Predictivo Supervisado

División de datos en machine learning con train_test_split

Regresión lineal para predecir goles en Python

Cómo saber si tu modelo de regresión funciona

Análisis de métricas R² en modelos de regresión deportiva

Árbol de decisión vs regresión lineal

Aprendizaje No Supervisado

Clustering de jugadores con K-Means

Interpretación de clusters de K-means para perfiles de jugadores

Visualización de perfiles de jugadores con análisis PCA

Pipeline y Proyecto Final

Pipeline ML que une predicción y scouting

Introducción al Deep Learning

Redes neuronales con PyTorch paso a paso

NLP en nuestro caso de uso

Análisis de sentimientos de fans con NLP

Resumen