Depuración y operación con tensores en PyTorch

Clase 5 de 24 • Curso de Redes Neuronales con PyTorch

Contenido del curso

Fundamentos de PyTorch

Estructura de modelo de deep learning en PyTorch

Redes neuronales con PyTorch

Cierre del curso

24
Aplicación de PyTorch en Proyectos de IA
01:13 min

Tomar examen

Resumen

Trabajar con tensores en PyTorch puede generar errores frustrantes si no se controlan tres factores fundamentales: la forma (shape), el tipo de dato (dtype) y el dispositivo (device) donde se ejecutan. Dominar estos tres aspectos es lo que separa a quien escribe código funcional de quien pasa horas buscando bugs invisibles.

¿Cómo verificar la forma y las dimensiones de un tensor?

Cada tensor tiene un atributo llamado shape que devuelve un objeto torch.Size con el tamaño de cada dimensión [0:42]. Por ejemplo, una matriz de dos por dos devuelve torch.Size([2, 2]), lo que indica dos dimensiones con dos elementos cada una. Un tensor más complejo como uno de forma cinco por dos por tres tendrá tres dimensiones, y shape lo refleja con claridad.

matriz.shape → devuelve las dimensiones y sus grados.
tensor.ndim → devuelve únicamente el número de dimensiones.

El atributo ndim es útil para confirmar rápidamente cuántas dimensiones tiene un tensor [1:23], aunque shape ofrece más información al mostrar también el tamaño de cada una.

¿Por qué el tipo de dato puede causar errores entre tensores?

Los tensores almacenan valores con un tipo específico. El atributo dtype permite consultarlo [1:47]. El tipo por defecto en PyTorch es torch.float32, el más utilizado y recomendado para la mayoría de operaciones.

¿Qué tipos de datos existen en PyTorch?

PyTorch ofrece una variedad considerable de tipos [2:08]:

torch.float32 (o torch.float): punto flotante de 32 bits, el default.
torch.float64 (o torch.double): punto flotante de 64 bits, mayor precisión.
torch.bool: valores booleanos, verdadero o falso.
torch.int8: enteros con signo (signed integers).
torch.uint8: enteros sin signo (unsigned integers), solo positivos.

Entre más bits tenga un tipo, mayor precisión numérica ofrece. Sin embargo, al trabajar con GPUs limitadas como las de Colab, conviene usar tipos con menos bits como float32 para equilibrar precisión y rendimiento [3:05].

¿Qué sucede al operar tensores con tipos distintos?

Cuando se suman dos tensores de tipos diferentes, PyTorch toma la decisión automáticamente y convierte el resultado al tipo más adecuado [4:20]. Por ejemplo, sumar una matriz float32 con una int64 produce un tensor float32. PyTorch es inteligente al elegir la representación más óptima.

Para cambiar el tipo manualmente se usa la función .to() [4:55]:

python matriz_float = matriz_uint64.to(dtype=torch.float32)

Esta función es extremadamente versátil y aparece constantemente en cualquier proyecto con PyTorch.

¿Cómo mover tensores entre CPU y GPU con CUDA?

El device indica el hardware donde vive un tensor: puede ser CPU o GPU [5:40]. Dos tensores deben estar en el mismo dispositivo para poder operar entre ellos.

CUDA es la plataforma de computación de NVIDIA que permite aprovechar el poder de las GPUs para acelerar operaciones como la multiplicación de matrices, esenciales en machine learning [6:15]. Para verificar su disponibilidad se utiliza:

python torch.cuda.is_available() # Devuelve True si hay GPU disponible

Una vez confirmada la disponibilidad [6:30], la función .to() permite mover un tensor entre dispositivos e incluso cambiar su tipo en una sola instrucción:

python

Mover a GPU

tensor_cuda = tensor.to(torch.device("cuda"))

Mover de vuelta a CPU y cambiar tipo simultáneamente

tensor_cpu = tensor_cuda.to("cpu", dtype=torch.float32)

Este doble cambio en un solo comando hace que .to() sea una de las funciones más prácticas de PyTorch [7:45].

¿Qué error aparece al operar tensores en dispositivos diferentes?

Si se intenta sumar un tensor en CUDA con otro en CPU, PyTorch lanza un error claro [8:40]: "expected all tensors to be on the same device". El mensaje indica que encontró al menos dos dispositivos distintos, por ejemplo cuda:0 y cpu. El número después de cuda identifica la GPU específica; si hubiera cinco GPUs, se numerarían del cero al cuatro.

Solo es posible operar cuando ambos tensores comparten el mismo dispositivo. Este error es uno de los más frecuentes al comenzar con PyTorch.

Mantener alineados la forma, el tipo y el dispositivo de tus tensores evita la mayoría de errores comunes. Si dominas la función .to() y los atributos shape, dtype y device, tendrás las herramientas necesarias para debuggear con confianza. ¿Cuál de estos tres factores te ha dado más problemas? Compártelo en los comentarios.

Comentarios

Alejandro Giraldo Londoño

student•

■ Resumen:

Para operar entre tensores es clave entender que:

El tipo de tensor: PyTorch interpretará las unidades de los tensores basándose en sus tipos de datos (por ejemplo, torch.float32, torch.int64, etc.). La conversión implícita puede llevar a resultados no deseados o errores.
Dispositivo del Tensor: Los tensores deben estar en el mismo dispositivo (device) para realizar operaciones entre ellos. Esto significa que todos deben estar en CPU (cpu), GPU (cuda), o cualquier otro dispositivo como NPU o TPU, dependiendo del entorno de ejecución. PyTorch permite mover tensores entre dispositivos usando métodos como .to(), .cuda(), o .cpu().
Forma del Tensor: La forma (shape) de los tensores debe ser compatible para las operaciones que desea realizar. Por ejemplo, la suma de tensores requiere que sus formas sean iguales o que sean broadcastables, mientras que la multiplicación matricial requiere que las dimensiones sean compatibles de acuerdo a las reglas del álgebra lineal.

Sebastian Galindez Tapia

student•

Si alguien esta utilizando una Mac con los chips nuevos de Apple, se puede usar torch.backends.mps.is_available(), para checar la disponibilidad del GPU

Daniel Moreno

student•

que pasa si dice que es false? yo tengo el chip M3 pero me devuelve clase en el google colab

Mario Alexander Vargas Celis

student•

El proceso de depuración ("debugging") de operaciones con tensores en PyTorch implica revisar el estado y las transformaciones que sufren los tensores durante el proceso de cálculo. Aquí te ofrezco algunas técnicas y herramientas útiles para depurar operaciones con tensores:

### 1. **Verificar las dimensiones de los tensores (shape)**

Un error común al trabajar con tensores es que no coincidan sus dimensiones para las operaciones. Usar tensor.shape te permite revisar la forma (dimensión) de los tensores.


import torch



tensor = torch.rand(3, 4)

print(tensor.shape)  # Salida: torch.Size(\[3, 4])

Si una operación falla, lo primero que deberías hacer es verificar que las dimensiones sean compatibles.

### 2. **Imprimir el tensor en varios puntos del código**

Cuando algo no sale como esperas, puedes imprimir el tensor en diferentes etapas del cálculo para verificar su contenido.


tensor = torch.rand(3, 4)

print(tensor)  # Imprime el contenido del tensor

También puedes verificar propiedades como:

- **dtype** (tipo de dato del tensor)

- **device** (si está en CPU o GPU)


print(tensor.dtype)  # Tipo de dato del tensor (float, int, etc.)

print(tensor.device)  # Verificar si el tensor está en CPU o GPU

### 3. **Usar assert para validar condiciones**

Puedes usar assert para validar que ciertas propiedades del tensor sean las correctas antes de realizar una operación.


tensor = torch.rand(3, 4)

assert tensor.shape == (3, 4), "El tensor no tiene la forma correcta"

### 4. **Tener cuidado con la asignación en GPU**

Si trabajas con GPU y ocurre un error, asegúrate de que los tensores estén en el mismo dispositivo. No puedes realizar operaciones entre tensores en dispositivos diferentes.


if torch.cuda.is\_available():

&#x20;   tensor\_cpu = torch.rand(3, 4)

&#x20;   tensor\_gpu = tensor\_cpu.to('cuda')

&#x20;   print(tensor\_gpu.device)  # Verifica que el tensor esté en la GPU

Si intentas operar entre un tensor en CPU y otro en GPU, obtendrás un error, así que asegúrate de moverlos al mismo dispositivo:


\# tensor\_cpu + tensor\_gpu  -> Esto generará un error

tensor\_cpu = tensor\_cpu.to('cuda')  # Movemos ambos tensores a la GPU

result = tensor\_cpu + tensor\_gpu

### 5. **Comprobar errores numéricos (NaN, Inf)**

En ocasiones, los valores de los tensores pueden convertirse en NaN o Inf debido a cálculos mal condicionados (como divisiones por cero o logaritmos de valores negativos).

Puedes verificar si un tensor contiene estos valores:


tensor = torch.tensor(\[float('inf'), -float('inf'), float('nan'), 1.0])



\# Comprobar si hay NaNs

print(torch.isnan(tensor))  # Salida: tensor(\[False, False,  True, False])



\# Comprobar si hay Infs

print(torch.isinf(tensor))  # Salida: tensor(\[ True,  True, False, False])

### 6. **Trazado con autograd para identificar errores en el cálculo de gradientes**

Si estás utilizando autograd y los gradientes no se calculan como esperas, puedes revisar el flujo de cálculo del gradiente mediante torch.autograd.


x = torch.tensor(\[2.0], requires\_grad=True)

y = x\*\*2

y.backward()



print(x.grad)  # Imprime el gradiente de `x`

Si en algún momento pierdes el gradiente o se genera un error en el flujo de cálculo, puedes depurar revisando el historial de operaciones.

### 7. **Uso de torch.set\_printoptions para mejorar la visualización**

A veces los tensores grandes no se muestran completamente, lo cual puede dificultar la depuración. Puedes ajustar las opciones de impresión para mostrar más detalles del tensor:


torch.set\_printoptions(precision=3, edgeitems=2, linewidth=75)



tensor = torch.rand(100, 4)

print(tensor)

### 8. **Depurar operaciones en GPU**

Depurar tensores en GPU puede ser un desafío, ya que los errores son menos descriptivos. Para aislar el problema, puedes copiar el tensor de vuelta a la CPU y revisar su valor:


tensor\_gpu = torch.rand(3, 4).to('cuda')

tensor\_cpu = tensor\_gpu.cpu()

print(tensor\_cpu)  # Inspecciona el tensor en CPU

### 9. **Comparación con NumPy**

A veces, puedes comparar resultados de operaciones en PyTorch con NumPy para asegurarte de que todo funcione como esperas.


import numpy as np



tensor = torch.rand(3, 4)

array = tensor.numpy()



\# Comparar una operación

assert np.allclose(tensor.sum().item(), array.sum()), "Los resultados no coinciden"

### 10. **Uso de herramientas de depuración como PDB**

Si necesitas una depuración más profunda, puedes usar el depurador interactivo de Python, pdb. Por ejemplo, puedes pausar el programa y examinar el estado de las variables en ese punto:


import pdb



tensor = torch.rand(3, 4)

pdb.set\_trace()  # Inicia el depurador interactivo aquí

Esto te permitirá ejecutar comandos para inspeccionar variables y entender el flujo del programa.

Estas técnicas te ayudarán a depurar operaciones con tensores y detectar problemas en tus redes neuronales o cualquier cálculo que estés haciendo en PyTorch.

Sebastian Sansoni

student•

cuando dice int64 (signed) quiere decir que la representación es con signo. No "firmado" como dice el profe.

Por ejemplo, en el caso de int8 (signed) quiere decir que puede representar desde -128 hasta 127.

Si es int8 (unsigned) va de 0 a 255.

Por fuera de eso, muy buena clase y en particular interesante curso!.

IVAN CARAPIA BARAJAS

student••

import torch
print(torch.__version__)
scalar = torch.tensor(3.0)

vector = torch.tensor([1.0, 2.0, 3.0])

matrix = torch.tensor([[1, 2, 3], [4, 5, 6]])

tensor_3d = torch.randn(5, 2, 3)
print(tensor_3d)

# Obtener la forma de una matriz
print(f"Forma de la matriz: {matrix.shape}")

# Obtener la forma de un tensor T5
print(f"Forma del tensor_3d: {tensor_3d.shape}")

# Obtener dimensiones de la matriz
print(f"Dimensiones de la matriz: {matrix.ndim}")

# Obtener dimensiones de T5
print(f"Dimensiones del tensor_3d: {tensor_3d.ndim}")

# Obtener el tipo de datos de una matriz
print(f"Tipo de datos de la matriz: {matrix.dtype}")

# Verificar en qué dispositivo está corriendo nuestra matriz
print(f"Dispositivo de la matriz: {matrix.device}")

# Verificar si CUDA está disponible
print(f"CUDA disponible: {torch.cuda.is_available()}")

def get_device():
    return torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

# Obtener el dispositivo a usar (CPU si no hay CUDA)
device = get_device()
print(f"Dispositivo seleccionado para operaciones: {device}")

# Definir un tensor
tensor = torch.tensor([1.0, 2.0, 3.0])
print(f"Tensor inicial en: {tensor.device}")

# Mover el tensor al dispositivo determinado (CPU en este caso)
tensor = tensor.to(device)
print(f"Tensor movido a: {tensor.device}")

# Mover el tensor a CPU explícitamente
tensor = tensor.to(torch.device('cpu'))
print(f"Tensor movido a CPU: {tensor.device}")

# Cambiar tipo y dispositivo (usando el dispositivo determinado)
tensor = tensor.to(device=device, dtype=torch.float32)
print(f"Tensor cambiado a tipo {tensor.dtype} y dispositivo {tensor.device}")

Juan Acevedo

student•

Pytorch utiliza numpy para esto , por eso es casi igual a como se operan muchas cosas con numpy

Juan José Zapata

student•

¿En caso de tener una GPU de AMD qué alternativa podría usar?

Nydia Mejía Zavala

student•

El tipo float32 es común en PyTorch porque representa un buen equilibrio entre precisión y uso de memoria. Consume menos espacio que float64, lo cual es importante para trabajar con grandes volúmenes de datos y modelos complejos, especialmente en GPU, donde la eficiencia de memoria es crucial. Además, muchas operaciones matemáticas y funciones de activación están optimizadas para float32, lo que mejora la velocidad de entrenamiento y la inferencia en modelos de aprendizaje automático.

Federico Arias

student•

Mis apuntes:

import torch tensor = torch.tensor([[1, 2], [3, 4], [5, 6]])print('tensor: \n',tensor)print("Shape del tensor:", tensor.shape) # Output: (3, 2)print("Número de dimensiones:", tensor.dim()) # Output: 2 #tensor = torch.tensor([[[1, 2], [3, 4], [5, 6]],[[1992,1992],[1993,1992],[1994,1994]]]) -> shape = [2,3,2] tensor_float = torch.tensor([[1.0, 2.0], [3.0, 4.0]])tensor_int = torch.tensor([[1, 2], [3, 4]]) print("Tipo de datos del tensor float:", tensor_float.dtype) # Output: torch.float32print("Tipo de datos del tensor int:", tensor_int.dtype) # Output: torch.int64 #sumamos los dos para ver como hace el broadcasting del tipo -> int a float:tensor_sumado = tensor_float + tensor_intprint('El tensor sumado tiene tipo', tensor_sumado.dtype) #Para cambiar manualmente los dtypes:tensor_float = torch.tensor([[1.0, 2.0], [3.0, 4.0]])tensor_int = tensor_float.to(torch.int64) print("Tensor original (float):", tensor_float.dtype) # Output: torch.float32print("Tensor convertido (int):", tensor_int.dtype) # Output: torch.int64 #Operaciones dentro de distintos devices:#Verificamos donde esta el tensor:print('Tensor_float esta en el device: ',tensor_float.device)#Reasignamos al GPU:tensor_float = tensor_float.to(torch.device('cuda'))#Verificamos:print('Tensor_float esta en el device: ',tensor_float.device) #-> cuda:0 #Hagamos una operacion entre distintos devices:tensor_sumado = tensor_float + tensor_int#Da Error: RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!#Debemos tener los tensores en el mismo device si queremos operarlos entre ellos: device = torch.device("cuda" if torch.cuda.is_available() else "cpu") tensor_int = tensor_int.to(device) # Operación entre tensores en el mismo dispositivotensor_sumado = tensor_float + tensor_intprint('Suma exitosa entre tensores del mismo device', tensor_sumado)

Diego Ferrua Huivin

student•

Runtime> Change RunTime type > T4 GPU

De esta forma se habilita el CUDA

Dario Saavedra Contreras

student•

Hola*# Función para operar con cuda si hay en el hardware*if torch.cuda.is_available(): matriz_uinit64_cuda = matriz_uinit64.to(torch.device("cuda")) print(matriz_uinit64_cuda, matriz_uinit64_cuda.type()) print(matriz_uinit64_cuda.to("cpu", torch.float32)) para el caso que este realizando en local, sino tengo GPU y tengo solo CPU el codigo no deberia mostrarme nada?

# Función para operar con cuda si hay en el hardware
if torch.cuda.is_available(): 
    matriz_uinit64_cuda = matriz_uinit64.to(torch.device("cuda"))

    print(matriz_uinit64_cuda, matriz_uinit64_cuda.type())
    print(matriz_uinit64_cuda.to("cpu", torch.float32))

Diego Alejandro Lesmes

student•

en tal caso te diria que cuda no esta disponible y ya 🤔

tensor = torch.tensor(\[float('inf'), -float('inf'), float('nan'), 1.0])

\# Comprobar si hay NaNs

print(torch.isnan(tensor))  # Salida: tensor(\[False, False,  True, False])

\# Comprobar si hay Infs

print(torch.isinf(tensor))  # Salida: tensor(\[ True,  True, False, False])

import torch
print(torch.__version__)
scalar = torch.tensor(3.0)

vector = torch.tensor([1.0, 2.0, 3.0])

matrix = torch.tensor([[1, 2, 3], [4, 5, 6]])

tensor_3d = torch.randn(5, 2, 3)
print(tensor_3d)

# Obtener la forma de una matriz
print(f"Forma de la matriz: {matrix.shape}")

# Obtener la forma de un tensor T5
print(f"Forma del tensor_3d: {tensor_3d.shape}")

# Obtener dimensiones de la matriz
print(f"Dimensiones de la matriz: {matrix.ndim}")

# Obtener dimensiones de T5
print(f"Dimensiones del tensor_3d: {tensor_3d.ndim}")

# Obtener el tipo de datos de una matriz
print(f"Tipo de datos de la matriz: {matrix.dtype}")

# Verificar en qué dispositivo está corriendo nuestra matriz
print(f"Dispositivo de la matriz: {matrix.device}")

# Verificar si CUDA está disponible
print(f"CUDA disponible: {torch.cuda.is_available()}")

def get_device():
    return torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

# Obtener el dispositivo a usar (CPU si no hay CUDA)
device = get_device()
print(f"Dispositivo seleccionado para operaciones: {device}")

# Definir un tensor
tensor = torch.tensor([1.0, 2.0, 3.0])
print(f"Tensor inicial en: {tensor.device}")

# Mover el tensor al dispositivo determinado (CPU en este caso)
tensor = tensor.to(device)
print(f"Tensor movido a: {tensor.device}")

# Mover el tensor a CPU explícitamente
tensor = tensor.to(torch.device('cpu'))
print(f"Tensor movido a CPU: {tensor.device}")

# Cambiar tipo y dispositivo (usando el dispositivo determinado)
tensor = tensor.to(device=device, dtype=torch.float32)
print(f"Tensor cambiado a tipo {tensor.dtype} y dispositivo {tensor.device}")

# Función para operar con cuda si hay en el hardware
if torch.cuda.is_available(): 
    matriz_uinit64_cuda = matriz_uinit64.to(torch.device("cuda"))

    print(matriz_uinit64_cuda, matriz_uinit64_cuda.type())
    print(matriz_uinit64_cuda.to("cpu", torch.float32))

Depuración y operación con tensores en PyTorch

Fundamentos de PyTorch

Clasificación de Texto con PyTorch y TorchText en Google Colab

Introducción a PyTorch: Ventajas y Comparación con Otros Frameworks

Creación de Modelos de Texto con PyTorch: Clase TextClassifier

Creación y manipulación de tensores en PyTorch