Depuración y operación con tensores en PyTorch

Clase 5 de 24 • Curso de Redes Neuronales con PyTorch

Resumen

¿Cómo lidiar con formas y dimensiones de tensores?

Al trabajar con tensores en PyTorch, uno de los principales problemas que podemos enfrentar es relacionado con las formas y dimensiones de los tensores. Conocer la forma de un tensor es clave para operar exitosamente entre diferentes tensores. Utilizamos el atributo shape para detectar automáticamente las dimensiones de nuestros tensores.

¿Cómo obtener la forma de un tensor?

La forma de un tensor se determina utilizando su atributo shape. El siguiente ejemplo nos muestra cómo obtener la forma de dos tensores previamente creados:

# Obtener la forma de una matriz
matriz.shape

# Obtener la forma de un tensor T5
T5.shape

Esto devuelve un objeto torch.Size que nos indica el tamaño del tensor en cada una de sus dimensiones.

¿Cómo detectar dimensiones automáticamente?

Aunque el atributo shape puede decirnos mucho sobre un tensor, también podemos utilizar el atributo ndim para obtener un número directo de las dimensiones:

# Obtener dimensiones de la matriz
matriz.ndim

# Obtener dimensiones de T5
T5.ndim

La preferencia por usar shape se basa en la mayor cantidad de información que proporciona.

¿Qué tipos de datos pueden tener los tensores?

Entender qué tipos de datos pueden almacenar los tensores es crucial para evitar errores. Usamos el atributo dtype de un tensor para conocer el tipo de los valores que contiene:

# Obtener el tipo de datos de una matriz
matriz.dtype

¿Cuáles son los tipos más comunes en PyTorch?

PyTorch ofrece diversos tipos de datos que se adaptan a nuestras necesidades:

torch.float32: Frecuentemente usado por ser el valor predeterminado para números decimales.
torch.float64 o torch.double: Para operaciones con mayor precisión.
torch.bool: Para tensores booleanos.
torch.int8, torch.uint8: Para enteros firmados y no firmados.

Es importante revisar la documentación de PyTorch para tener un conocimiento completo de las opciones disponibles.

¿Cómo funciona el device al operar con tensores?

Finalmente, entender el concepto de device es fundamental cuando trabajamos con tensores. Esto se refiere al hardware específico donde corren los tensores, como CPU o GPU.

¿Cómo verificar el device de un tensor?

Empleamos el atributo device para verificar en qué dispositivo opera un tensor:

# Verificar en qué dispositivo está corriendo nuestra matriz
matriz.device

¿Qué es CUDA y cómo influye?

CUDA es una plataforma de computación que permite realizar operaciones de forma más veloz utilizando GPUs. Para verificar si CUDA está disponible, utilizamos la función torch.cuda.is_available():

# Verificar si CUDA está disponible
torch.cuda.is_available()

¿Cómo cambiar los tensores entre dispositivos?

Podemos cambiar los tensores entre CPU y GPU usando la función to, la cual también nos permite cambiar el tipo del tensor:

# Cambiar tensor a GPU
tensor = tensor.to(torch.device('cuda'))

# Cambiar tensor a CPU
tensor = tensor.to(torch.device('cpu'))

# Cambiar tipo y dispositivo
tensor = tensor.to(torch.float32, torch.device('cuda'))

Ejemplo de función para operar dependiendo de la disponibilidad de CUDA

Facilitamos nuestra interacción con diferentes dispositivos definiendo una función que se asegure de usar CUDA si está disponible:

def get_device():
    return torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

tensor = tensor.to(get_device())

Tomar en cuenta estos factores (forma, tipo y device) es esencial para evitar posibles errores y hacer un uso eficiente y efectivo de PyTorch en tus proyectos. ¡Sigue experimentando y mejorando tus habilidades en Machine Learning!