Vectores, matrices y tensores en NumPy

Curso de Álgebra Lineal para Machine Learning

Contenido del curso

No sé dónde empezar

Introducción al Álgebra Lineal para Machine Learning

Operaciones con Vectores y Matrices

Multiplicación de Matrices

Construcción de un Modelo de Regresión Lineal

Tomar examen

Vectores, matrices y tensores en NumPy

Resumen

Para que un modelo de machine learning pueda aprender, primero necesitas traducir el mundo real a un lenguaje que entienda. Ese lenguaje se construye con tres estructuras clave en NumPy: vectores, matrices y tensores, los bloques que describen desde un producto hasta una imagen a color.

Antes de entrar en código, conviene entender de dónde nacen estas estructuras. Todo empieza con el escalar, un único número como el precio de un producto, tu edad o los metros cuadrados de una casa [0:14]. Cuando agrupas varios escalares en una lista ordenada, obtienes un vector capaz de describir un objeto completo.

¿Qué es un vector y cómo lo representas en NumPy?

Un vector es una lista ordenada de escalares que describe un objeto por completo [0:35]. Para describir una casa, por ejemplo, usas un vector con tres componentes: metros cuadrados, número de habitaciones y precio.

En código se ve así, importando NumPy como np:

python import numpy as np

producto_A = np.array([20.0, 4.5]) print(f"Vector producto: {producto_A}")

Este vector representa un producto de un e-commerce con dos características: precio (20 dólares) y calificación (4.5 estrellas) [1:30].

¿Cómo inspeccionas las propiedades de un vector?

NumPy ofrece tres atributos que te ayudan a diagnosticar cualquier array:

ndim: número de ejes o dimensiones de la estructura.
shape: forma del array, expresada como una tupla.
size: número total de elementos.

Al ejecutar estos atributos sobre producto_A, obtienes ndim = 1, shape = (2,) y size = 2 [3:00]. Esto te dice que estás ante un array de una sola dimensión con dos elementos.

¿Cuántas dimensiones tiene un vector en machine learning? Depende de qué dimensión preguntes. Para NumPy, un vector siempre es un array de una dimensión. Pero geométricamente, el número de componentes define el espacio: dos componentes viven en un plano 2D, tres componentes en un espacio 3D [4:10].

Aquí está la idea que evita confusiones: una cosa es la estructura del array en NumPy y otra el espacio geométrico que ese vector representa. En plataformas como Netflix, los vectores de usuarios no tienen dos o tres componentes, sino cientos o millones, viviendo en espacios de altísima dimensión [4:50].

¿Cómo graficas un vector con matplotlib?

Para visualizar producto_A en un plano, usas quiver para dibujar una flecha desde el origen hasta las coordenadas del vector:

python import matplotlib.pyplot as plt

plt.figure(figsize=(6,6)) plt.quiver(0, 0, producto_A[0], producto_A[1], angles='xy', scale_units='xy', scale=1, color='red') plt.title('Producto A') plt.xlabel('Precio') plt.ylabel('Calificación') plt.xlim(0, 25) plt.ylim(0, 10) plt.grid(True, alpha=0.3) plt.show()

El resultado muestra una flecha que llega hasta 20 en el eje de precio y 4.5 en el eje de calificación [6:30].

¿Qué es una matriz y por qué importan las filas y columnas?

Una matriz es una colección de vectores apilados que forman una tabla. En machine learning se sigue una convención fundamental que debes interiorizar:

Las filas son observaciones: cada fila es un ejemplo, como un usuario, una casa o un paciente.
Las columnas son características: cada columna es un atributo como edad, precio o altura.
La forma de una matriz se lee como (número de observaciones, número de características).

Esta estructura es la que esperan la mayoría de modelos en librerías como Scikit-Learn [7:40].

¿Cómo construyes y exploras una matriz tipo Netflix?

Imagina una matriz de calificaciones donde las filas son usuarios y las columnas son películas:

python calificaciones = np.array([ [5, 1, 2, 0], [3, 4, 4, 2], [3, 2, 2, 5], [4, 1, 1, 2] ])

Al inspeccionarla, obtienes ndim = 2, shape = (4, 4) y size = 16 [9:30]. Dos ejes, cuatro filas, cuatro columnas y 16 elementos en total.

Para extraer información puntual usas slicing. Si quieres las calificaciones del primer usuario, accedes con un índice; si quieres todas las calificaciones de una película, usas dos puntos:

python calificaciones_usuario_1 = calificaciones[0] calificaciones_pelicula_3 = calificaciones[:, 2]

Los dos puntos antes de la coma significan todas las filas, y el 2 después de la coma selecciona la tercera columna [11:20].

¿Qué es un tensor y para qué sirve?

Un tensor es la generalización de una matriz a tres o más dimensiones. Si un vector es 1D y una matriz es 2D para NumPy, un tensor empieza en 3D. Son el lenguaje nativo de librerías de deep learning como TensorFlow y PyTorch [12:30].

¿Cómo se representa un píxel con un tensor? Un píxel es la combinación de tres canales RGB (rojo, verde y azul), cada uno con un valor de 0 a 255. Una imagen con varios píxeles se modela como un tensor donde cada matriz interna representa un píxel con sus tres canales [13:00].

¿Cómo creas y graficas un tensor de imagen?

Puedes pensar un tensor como una matriz de matrices. Cada matriz interna agrupa los canales RGB de un píxel:

python imagen_tensor = np.array([ [[255, 0, 0], [0, 255, 0], [0, 0, 255]], [[125, 0, 0], [0, 100, 0], [40, 0, 115]] ])

Al inspeccionar, obtienes ndim = 3, shape = (2, 3, 3) y size = 18 [14:40]. El primer número del shape es la cantidad de matrices dentro del tensor, el segundo son las filas y el tercero las columnas.

Para visualizar la imagen usas imshow:

python plt.imshow(imagen_tensor) plt.title('Imagen tensor') plt.axis('off') plt.show()

Verás dos píxeles renderizados: el primero con los canales RGB puros y el segundo con los valores aleatorios que definiste [15:50].

¿Cuál es la diferencia entre vector, matriz y tensor? El vector es una lista 1D de números que describe un objeto. La matriz es una tabla 2D de filas (observaciones) y columnas (características). El tensor es una estructura 3D o superior, ideal para imágenes, video o datos complejos.

Ahora te toca a ti: comparte en los comentarios una matriz que crearías a partir de un problema real, describiendo qué representan sus filas y sus columnas.

Victor R. M Cárdenas.

Estudiante

Hola buenos cibernautas, espero que te encuentre bien.

Idea: Tabla de puntuación, juego de mesa Warhammer fantasy, se considera 4 integrantes, 3 pts por partida ganada, total de integrantes 4.

Nota: Quizás este gráfico debería haber sido de barra para tener un mejor entendimiento y comprensión de este para su interpretación. Tuve ayuda a de la IA para refinar el código. Como consecuencia el gráfico a mostrar.

Codigo :

import matplotlib.pyplot as plt

import numpy as np

# ====================

# CONFIGURACIÓN SIMPLE

# ====================

# Datos organizados en listas paralelas (más fácil de leer)

jugadores = ["Luis", "Guillermo", "Armando", "Alberto"]

partidas = [3, 5, 5, 5] # Partidas jugadas

victorias = [2, 1, 1, 2] # Partidas ganadas (Guillermo: 1 en lugar de 2)

puntos = [v * 3 for v in victorias] # 3 puntos por victoria

# Colores amigables

colores = ['#3498db', '#2ecc71', '#e74c3c', '#f39c12'] # Azul, Verde, Rojo, Naranja

# ====================

# CREAR GRÁFICO LIMPIO

# ====================

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# ====================

# GRÁFICO 1: DIAGRAMA DE FLECHAS

# ====================

ax1.set_title(" Puntuación por Jugador", fontsize=16, pad=15, fontweight='bold')

ax1.set_xlabel("Partidas Jugadas", fontsize=12)

ax1.set_ylabel("Puntos Totales", fontsize=12)

# Dibujar flechas simples

for i in range(len(jugadores)):

ax1.arrow(0, 0, partidas[i], puntos[i],

head_width=0.3, head_length=0.5,

color=colores[i], alpha=0.8,

length_includes_head=True, width=0.05)

# Punto final con etiqueta clara

ax1.scatter(partidas[i], puntos[i], s=150,

color=colores[i], edgecolor='black', zorder=5)

# Etiqueta simple y clara

ax1.text(partidas[i], puntos[i],

f' {jugadores[i]}\n {victorias[i]}G / {partidas[i]}J\n {puntos[i]} pts',

fontsize=10, va='bottom')

# Línea de referencia: 3 puntos por partida (máximo)

x_line = np.array([0, max(partidas)])

y_line = 3 * x_line

ax1.plot(x_line, y_line, 'r--', alpha=0.3, label='Máximo posible')

# Configurar ejes

ax1.set_xlim(0, max(partidas) + 1)

ax1.set_ylim(0, max(puntos) + 2)

ax1.grid(True, alpha=0.2)

ax1.legend()

# ====================

# GRÁFICO 2: TABLA DE PUNTUACIONES

# ====================

ax2.axis('off')

ax2.set_title(" Resumen del Torneo", fontsize=16, pad=15, fontweight='bold')

# Crear tabla

tabla_datos = [

["Jugador", "Partidas", "Victorias", "Derrotas", "Puntos", "Pts/Partida"]

]

for i in range(len(jugadores)):

derrotas = partidas[i] - victorias[i]

eficiencia = puntos[i] / partidas[i]

tabla_datos.append([

jugadores[i],

str(partidas[i]),

str(victorias[i]),

str(derrotas),

str(puntos[i]),

f"{eficiencia:.2f}"

])

# Añadir totales

tabla_datos.append([

"TOTAL",

str(sum(partidas)),

str(sum(victorias)),

str(sum(partidas) - sum(victorias)),

str(sum(puntos)),

f"{sum(puntos)/sum(partidas):.2f}"

])

# Mostrar tabla

tabla = ax2.table(cellText=tabla_datos[1:],

colLabels=tabla_datos[0],

cellLoc='center',

loc='center',

colWidths=[0.15, 0.12, 0.12, 0.12, 0.12, 0.15])

# Formato de tabla

tabla.auto_set_font_size(False)

tabla.set_fontsize(11)

tabla.scale(1.2, 1.5)

# Colorear encabezado

for j in range(len(tabla_datos[0])):

tabla[(0, j)].set_facecolor('#2c3e50')

tabla[(0, j)].set_text_props(color='white', weight='bold')

# Colorear filas de jugadores

for i in range(1, len(tabla_datos)-1):

for j in range(len(tabla_datos[0])):

tabla[(i, j)].set_facecolor(colores[i-1] + '40') # Color con transparencia

# Colorear fila de totales

for j in range(len(tabla_datos[0])):

tabla[(len(tabla_datos)-1, j)].set_facecolor('#95a5a6')

tabla[(len(tabla_datos)-1, j)].set_text_props(weight='bold')

plt.tight_layout()

plt.show()

----------Imagen del grafico-----------------------------------------------------------

Gracias por su atención. Ten un excelente día u noche. No pares de aprender

Jhon Alexander García Sierra

Daniel Erazo

Profesor

Juan Pablo Marin Jimenez

Gabriel Obregón

José Eder Guzmán Mendoza

Franco Alvarado

Victor Alfonso Anaya Pineda

Chaparro Rojas Jeferson Arley

Gabriel Londoño

William Alexander Bejarano Pinilla

Alex Xiomar Rubio Lopez

Carlos Alvarado Riaño

Daniela Estupiñan

NESTOR IVAN RONCANCIO CABALLERO

Orlando mendez

Manuel De los Reyes

Teth Azrael Cortes Aguilar

Darlinson Felipe Polania Camacho

Luis Felipe Rodríguez Zamora

Andres Felipe Vargas Gonzalez

Braejan Arias

Vectores, matrices y tensores en NumPy

Introducción al Álgebra Lineal para Machine Learning

Álgebra lineal detrás de Spotify y Netflix

Configura Google Colab para álgebra lineal

NumPy y Matplotlib para datos en Python