Norma L2 vs L1 en vectores con NumPy

Clase 6 de 16 • Curso de Álgebra Lineal para Machine Learning

Resumen

Las normas de vectores son la forma más clara y práctica de medir la intensidad, longitud y distancia en datos. En machine learning ayudan a comparar perfiles, controlar modelos con regularización y estandarizar vectores para analizar solo su dirección. Aquí verás la norma L2, su interpretación con el teorema de Pitágoras, y cómo calcular L1, L0 y L∞ con NumPy.

¿Qué es la norma y para qué sirve en machine learning?

La norma es la magnitud de un vector: un solo número que resume qué tan intenso es un conjunto de preferencias o características. En práctica, se usa para medir distancias, penalizar pesos demasiado grandes y normalizar vectores a longitud uno.

¿Cómo mide distancia en perfiles y contenidos?

Compara tu vector de gustos con el de una película.
Calcula la cercanía en el espacio vectorial.
Base para recomendaciones personalizadas.

¿Cómo estabiliza modelos con regularización?

Detecta pesos con magnitudes grandes.
Penaliza para evitar errores típicos del overfitting.
Mantiene el modelo estable.

¿Cómo estandariza para comparar direcciones?

Ajusta vectores a longitud uno.
Permite comparar solo la dirección.
Útil en texto y similitud de perfiles.

¿Cómo se calcula la norma L2 y cómo se interpreta?

La norma L2 o euclidiana es la distancia en línea recta desde el origen hasta la punta del vector. Se entiende con el teorema de Pitágoras: la hipotenusa del triángulo formado por los componentes del vector es su longitud.

¿Cómo se implementa en código con NumPy?

Ejemplo en Google Colab con NumPy y linalg:

import numpy as np

perfil_ana = np.array([5, 1])  # ciencia ficción = 5, comedia = 1
perfil_juan = np.array([1, 5])  # ciencia ficción = 1, comedia = 5

norma_ana = np.linalg.norm(perfil_ana)
norma_juan = np.linalg.norm(perfil_juan)

print(f"norma de ana: {norma_ana:.2f}")
print(f"norma de juan: {norma_juan:.2f}")
# salida ejemplo: 5.10 y 5.10

Interpretación: aunque Ana prefiere mucho la ciencia ficción y Juan la comedia, la intensidad total de sus gustos es igual. La norma L2 devuelve 5.10 para ambos, indicando misma magnitud aunque diferente dirección.

¿Qué diferencias hay entre L1, L0 y L infinito y cómo calcularlas?

Además de L2, es clave conocer otras normas para distintos objetivos: robustez, dispersión y máximo impacto. Todas se calculan con NumPy de forma simple.

¿Cómo calcular la norma L1 y para qué sirve?

Suma de valores absolutos.
Mide distancia en “ángulos rectos”.
Útil cuando se busca robustez frente a outliers.

import numpy as np

vector = np.array([3, -4, 0])

norma_L1 = np.linalg.norm(vector, ord=1)
print(f"norma L1 del vector: {norma_L1}")
# salida: 7

¿Cómo medir dispersión con L0 en la práctica?

Cuenta cuántos componentes son distintos de cero.
Útil para evaluar escasez o dispersión de características.

norma_L0 = np.count_nonzero(vector)
print(f"norma L0 del vector: {norma_L0}")
# salida: 2

¿Cómo obtener el peor caso con L infinito?

Devuelve el valor absoluto más grande.
Informa el impacto máximo de una característica.

norma_Linf = np.linalg.norm(vector, ord=np.inf)
print(f"norma L infinito del vector: {norma_Linf}")
# salida: 4.0

¿Te animas a practicar? imagina dos vectores de características para casas: casa 1 = [120, 3] y casa 2 = [100, 4], donde los componentes son metros cuadrados y número de habitaciones. Calcula la norma L2 de ambos y responde: ¿qué podría significar una norma mayor en este contexto?

Comparte tus resultados y tu interpretación en los comentarios.

Alberto Ezequiel Marin Chacon

student•

A lo mejor no es la intensión de la pregunta pero no puedo evitar pensarlo ahora que estoy tomando cursos de ML 😅. En un primer pensamiento diría que es una forma de dar puntaje a las casas para definir precios o categorías. Sin embargo, hay un problema de escala entre el número de habitaciones y los metros cuadrados ya que la escala de estos últimos siempre será mucho mayor, por lo que poco impacto tiene el número de habitaciones en el cálculo. Dos casas con el mismo número de m2 pero diferente número de habitaciones varía poco en el resultado. Al realizar un proceso de normalización las habitaciones suben su impacto y se podría valuar o clasificar las casas de mejor forma.

Daniel Erazo

teacher•

¡Excelente intuición! Has dado justo en el clavo de uno de los conceptos fundamentales en ML: la necesidad del Escalado de Características (Feature Scaling).

Matemáticamente, tienes toda la razón. Si modelamos esto como una combinación lineal (un producto punto wx), la variable con mayor magnitud (m^2) dominará el resultado numérico simplemente por su escala, "eclipsando" la información que aportan las habitaciones.

Al normalizar, colocamos todas las dimensiones del vector en un "lugar más parejo". Esto permite que el algoritmo aprenda basándose en la correlación real de los datos y no en sus unidades de medida. ¡Vas por muy buen camino conectando el álgebra con la práctica! 😊

Gabriel Obregón

student•

📊 Normas de vectores en Machine Learning

📖 ¿QUÉ ES UNA NORMA?

🔹 Un solo número que resume la magnitud de un vector.

🔹 Indica qué tan fuerte o intenso es un conjunto de características.

🧰 ¿PARA QUÉ SIRVE?

✔️ Medir distancias

✔️ Penalizar pesos grandes

✔️ Normalizar vectores (longitud = 1)

📐 NORMA L2 (EUCLIDIANA)

📏 ¿QUÉ MIDE?

➡️ Distancia directa del origen al vector

➡️ Longitud “real” del vector

🔺 INTERPRETACIÓN GEOMÉTRICA

➤ Basada en el teorema de Pitágoras

➤ El vector es la hipotenusa formada por sus componentes

💻 EJEMPLO EN PYTHON (NumPy)

import numpy as np

perfil_ana = np.array([5, 1])

perfil_juan = np.array([1, 5])

norma_ana = np.linalg.norm(perfil_ana)

norma_juan = np.linalg.norm(perfil_juan)

📤 Resultado:

· Norma Ana: 5.10

· Norma Juan: 5.10

🧠 Interpretación

➡️ Gustos distintos

➡️ Misma intensidad total

➡️ Igual magnitud, distinta dirección

➕ OTRAS NORMAS IMPORTANTES

🔶 NORMA L1

📌 Cómo se calcula ➤ Suma de valores absolutos

📌 Qué representa ➤ Distancia en ángulos rectos

📌 Para qué sirve

✔️ Más robusta ante outliers

vector = np.array([3, -4, 0])

norma_L1 = np.linalg.norm(vector, ord=1)

📤 Resultado: 7

🔶 NORMA L0

📌 Qué mide ➤ Número de componentes distintos de cero

📌 Para qué sirve

✔️ Mide dispersión

✔️ Evalúa escasez de características

norma_L0 = np.count_nonzero(vector)

📤 Resultado: 2

🔶 NORMA L INFINITO

📌 Qué devuelve ➤ El valor absoluto más grande

📌 Para qué sirve

✔️ Identifica el peor caso

✔️ Impacto máximo de una característica

norma_Linf = np.linalg.norm(vector, ord=np.inf)

📤 Resultado: 4.0

Christopher Flores

student•

¿Qué podría significar una norma mayor en este contexto? En el caso de los metros cuadrados la computadora le dara más peso que los cuartos. Es necesario normalizar para evitar estar miopes y solo centrarse en un solo valor.

Daniel Erazo

teacher•

Gran aporte!

Beicker Andres Yomayusa Diaz

student•

Bueno me da la sensación que me puede indicar que casa es mejor respecto a la otra, sin embargo hay un tema y es que veo que uno de los valores de cada vector (casa) es casi igual a su norma, luego infiero que ese parámetro domina, pero parece artificial porque si la idea en puntuar las casas de forma relativa quizá no sea la mejor manera pro que para algunas personas sea mucho mas valioso tener mas habitación que metros cuadrados. Lo cual me lleva a pensar que la escala de cada variable es importante y entiendo que si hubiéramos normalizados los valores podríamos quitar el ruido de la escala numérica y quizá obtendríamos un puntaje mas adecuado. No digo que la conclusión sea errónea solo digo que parte de una hipótesis forzada por la escala numérica porque estamos ponderando mas los metros cuadrados respecto al numero de habitaciones sin una aparente razón!

Daniela Estupiñan

student•

La norma toma en cuenta tanto los metros cuadrados como el número de habitaciones.

Daniel Erazo

teacher•

Gran respuesta, sigue así! 😄

NESTOR IVAN RONCANCIO CABALLERO

student•

si bien antes de revisar la norma pensaríamos que entre mas metros cuadrados deberían haber mas habitaciones; Sin embargo, en este espacio de dos casas vemos que la relacion no es directamente proporcional por lo que podriamos concluir que no siempre mayor metros cuadrados son mas habitaciones. Partiendo de esto podriamos decir que en este espacio habria que analizar otras variables para describir ¿de que depende el numero de habitaciones de las casas de este espacio en estudio?

Alvaro Lozano Rodríguez

student•

Sentí que había algo raro. Como no supe qué era, usé la IA y dice que ese ejercicio se debe normalizar. Después de varios ejercicios donde no se deben usar escalas diferentes. Se toman los valores de las habitaciones por separado y el área en metros cuadrados por separado. 👉 Significa que:

Ninguna es “mejor” o “más grande” en conjunto una vez equilibras área y habitaciones.

Lo que tienes ahora es:

Casa 1 = máxima en tamaño, mínima en habitaciones
Casa 2 = mínima en tamaño, máxima en habitaciones

Matemáticamente, quedan equidistantes del origen y por eso su magnitud es la misma. 💡 Intuición gráfica

En el plano normalizado:

Casa 1 está en el punto (1,0) → puro tamaño.
Casa 2 está en (0,1) → puras habitaciones.

Ambas están a la misma distancia del origen. "Vale usar la IA".

Juan Carlos Ramírez Constantino

student•

A mi me genera esta decisión:

¿Quieres una casa grande con 3 recámaras?, o
¿Quieres una pequeña con 4 recámaras?

Como perfilar tu gusto (Norma L2)

Daniel Erazo

teacher•

Es una buena interpretación!

Germán Illanes Salas

student•

Una norma mayor, reflejaría que tamaño de casa es mayor en términos de sus m2 y cantidad de habitaciones. Sin embargo, al haber una diferencia en las escalas de estas dimensiones, los m2 siempre tendrán un peso mayor que la cantidad de habitaciones.

Daniel Erazo

teacher•

Gracias por el aporte!

Darlinson Felipe Polania Camacho

student••

resultado:

la norma de la casa 1 es : 120.03749414245534

la norma de la casa 2 es : 100.07996802557443

Aunque la casa 1 tiene más metros cuadrados, la norma también tiene en cuenta el número de habitaciones, por lo que ambas características influyen en el resultado, aunque los metros cuadrados tengan un peso mayor por su escala. En la vida real tener mas habitacions no significa mas grande la casa

Jhon Alexander García Sierra

student•

Si bien las habitaciones y el espacio (m2) es algo que llegásemos a pensar que están muy relacionados, realmente no lo están, desde mi punto de vista hay otras variables que pueden influir y tener mejor correlación porque el espacio utilizado puede ser mayor en la casa 1 que en la casa 2, pero el espacio por habitación puede ser realmente menor. Por lo que puedo llegar a concluir que realmente no tienen nada que ver.

Daniel Erazo

teacher•

Es una buena conclusión a la que llegaste, tiene sentido :D

Johan L

student•

casa_1 = np.array([120,3])
casa_2 = np.array([100,4])

norma_casa_1 = np.linalg.norm(casa_1)
norma_casa_2 = np.linalg.norm(casa_2)

print(norma_casa_1)
print(norma_casa_2)

el resultado fue: Norma casa 1 120.04 Norma casa 1 100.08. yo lo interpreto como el espacio de la casa con respecto a sus habitaciones, ósea cual de las 2 casas me da mas area con respecto a su numero de habitaciones

Daniel Erazo

teacher•

Muy buena forma de interpretarlo!

Alejandro Molina

student••

house_1=np.array([120,3])

house_2=np.array([100,4])

norm_l2_h1=np.linalg.norm(house_1)

norm_l2_h2=np.linalg.norm(house_2)

print('Norma L2 para casa 1: {}'.format(norm_l2_h1))

print('Norma L2 para casa 2: {}'.format(norm_l2_h2))

Norma L2 para casa 1: 120.04 Norma L2 para casa 2: 100.08

Se puede asumir que las dimensiones de la casa 1 son mayores que la casa 2. Mayor area probablemente.

Daniel Erazo

teacher•

Excelente forma de interpretarlo!

Norma L2 vs L1 en vectores con NumPy

Introducción al Álgebra Lineal para Machine Learning

Cómo Netflix sabe qué quieres ver

Configurar Google Colab para álgebra lineal

NumPy y Matplotlib: de números a gráficos

Escalares, vectores y tensores en Machine Learning

Operaciones con Vectores y Matrices

Resta y multiplicación escalar en machine learning

Norma L2 vs L1 en vectores con NumPy

Producto punto: cómo mide similitud la IA

Ortogonalidad en machine learning con Python

Multiplicación de Matrices

Producto matriz-vector en NumPy para inferencia

Producto matriz matriz en NumPy

Matriz identidad e inversa en NumPy

Construcción de un Modelo de Regresión Lineal

Cómo predecir precios con álgebra lineal

Cómo resolver theta con np.linalg.solve

Determinante y rango en regresión lineal

Por qué la multicolinealidad rompe el entrenamiento

Pseudoinversa para multicolinealidad en NumPy