Cálculo de Desviación Estándar en Series de Tiempo con NumPy

Clase 22 de 28 • Curso de Introducción al Álgebra Lineal: Vectores

Resumen

¿Qué son los vectores en series de tiempo?

¡Claro! Los vectores pueden representar más que simples objetos geométricos. Un vector también puede considerarse como una serie de tiempo, donde cada componente del vector representa una medición a intervalos sucesivos en el tiempo. Por ejemplo, si x es un vector con valores [x0, x1, x2, ..., xn], cada xi se refiere a una medida en el tiempo i. Este enfoque es útil para analizar datos como medidas financieras, métricas de rendimiento, etc.

¿Cómo calcular la desviación estándar de un vector?

Calcular la desviación estándar de un vector es crucial cuando los vectores se utilizan como series de tiempo o datos medidos. La idea es medir la dispersión de las entradas de un vector con respecto a su media.

Vector medio: Primero, definimos un nuevo vector x_tilde = x - average(x) * 1, donde 1 es un vector con todas las entradas iguales a la media del vector original. Esto asegura que el promedio de x_tilde sea cero.
Fórmula de la desviación estándar: La desviación estándar de un vector x se calcula como la raíz cuadrada de la media del cuadrado de x_tilde, lo cual coincide con el RMS (Root Mean Square) de x_tilde.
Interpretación: Nos dice cuánto se desvían, en promedio, las entradas del vector con respecto a la media del vector. Un ejemplo claro sería el salario promedio donde la mayoría se agrupa alrededor de un valor central.

Ejercicio de ejemplo con Python

Veamos cómo se hace en Python usando NumPy:

import numpy as np

# Vector de ejemplo
x = np.array([1, -2, 3, 2])

# Calcular el promedio
promedio = np.mean(x)

# Se calcula x_tilde
x_tilde = x - promedio * np.array([1, 1, 1, 1])

# Comprobación del promedio de x_tilde
promedio_x_tilde = np.mean(x_tilde)

# Desviación estándar manual
desviacion_estandar_manual = np.linalg.norm(x_tilde) / np.sqrt(len(x_tilde))

# Usando NumPy
desviacion_estandar_numpy = np.std(x)

print(f"Desviación estándar manual: {desviacion_estandar_manual}")
print(f"Desviación estándar con NumPy: {desviacion_estandar_numpy}")

En este código, ambas formas dan la misma desviación estándar, confirmando la utilidad de NumPy para simplificar los cálculos.

¿Cuál es la relación entre promedio, RMS y desviación estándar?

Existe una relación fundamental entre estas tres medidas en un vector:

Promedio (mu): Se refiere al valor central o promedio del vector.
Desviación estándar (sigma): Mide cuánto varían los datos del promedio.
RMS: Una medida de la magnitud del vector que se relaciona con el promedio y la desviación estándar.

La relación específica es:

[ \text{RMS}^2(x) = \text{promedio}(x)^2 + \sigma^2(x) ]

Esto significa que el cuadrado del RMS es la suma del cuadrado del promedio más el cuadrado de la desviación estándar. Esta fórmula es integral en muchas aplicaciones estadísticas y financieras.

¿Por qué es fundamental entender estas medidas?

Comprender el promedio, la desviación estándar y el RMS no solo es clave para el análisis de datos sofisticado, sino que también ayuda a prever la variabilidad y los rangos de expectación de los datos. En el contexto de inversión en mercados financieros, estas medidas se usan para calcular riesgos y rendimientos potenciales, ayudándonos a tomar decisiones más informadas y estratégicas. ¡Continúa explorando y aplicando estos conceptos en tus proyectos y herramientas analíticas!

Roberto Jassiel Montes Gutierrez

student•

La desviación estandar es cero cuando todos los datos estan en la mitad de la campana de gauss es decir en la media. sdt=0 siempre y cuando los componentes del vector sean iguales. Aquí mi comprobación: espero se me entienda xd ![](

Andrés David Lizarazo Becerra

student•

muy buena comprobación

David Mejía Estrada

student•

Buena apreciación, pero creo que es más preciso decir que cuando std = 0, no existe una campana de Gauss.

Sergio Alejandro Martínez

student•

En el minuto 14 :00 el -2 queda afuera del 68.2% de la data, porque al restar (1.87= desviación estándar)del promedio que es 1 esto da como resultado -0.87. -2 < -0.87

Bryan

student•

Yo también me percate de ese fallo

Hermes A. J. Cabrera F.

student•

Ciertamente. El profesor tuvo un lapsus ahí. para el lado izquierdo 1-1.87 = -0.87 por lo tanto, salen el -2 y el 3, los que no se saldrías serían en 1 y el 2 ya que estarían en el rango -,87 <= x <=2.87, por lo que queda dentro del rango el 50% de la data. Saludos

JAVIER SANTIAGO SALGADO

student•

Mi demostraciones: Primera Parte

Segunda Parte

Juan Sebastian Olarte Uribe

student•

Buenas noches, me ha sido de gran ayuda esta demostración, pero tengo una pequeña duda.

Cuando suma todas las fracciones que tienen denominador n, que principio usa para distribuir el u^2 de esa manera, ya que este es un escalar y no un vector, igualmente el u^2 va acompañado de n el numerador y no sé muy bien que hace con esa n.

Muchas gracias.

JAVIER SANTIAGO SALGADO

student•

No te logro entender lo que me estas diciendo, sin embargo el procedimiento fue mas o menos el siguiente. Comencé con la segunda parte para saber que cero tenia que sumar. el promedio. Fíjate que por ambos lados son escalares los resultados finales, por temas de facilidad al avg(x) le llame mu, y la desviación estándar lo exprese como su definición. Luego rompí los términos al cuadrado, reagrupe términos y factorice. En la penúltima parte de la segunda parte, que quedan las x^2/n + 2mu^2-2mu*(la suma de las x dividido n) este ultimo por definición es el promedio por ende quedan dos veces 2mu^2 La primera parte es devolver la segunda parte sumando 2mu^2-2*mu^2

Espero ser mas claro así, sin embargo no dudes en escribirme y compartimos el análisis ;)

Bryan

student•

La razón por la cual se usa n-1 en la desviación estándar es cuando la muestra es menor a 30 (n<30) para compensar que tenemos pocos datos y puede haber mucha dispersión

Mateo Echavarria

student•

Es interesante como el profe prefiere poner toda la expresión en vez de reducirla con el operador matemático de sumatoria.

Santiago Ahumada Lozano

student•

Hola Mateo! Esto se realiza supongo que es porque las expresiones expandidas son mucho más sencillas de comprender que las compactas como las sumatorias o productorias. Saludos!

Hermes A. J. Cabrera F.

student•

Hola compañeros, La desviación estándar es la variación de las entradas respecto al valor de la media. Solo valdrá cero, como se solicita en la operación a demostrar, cuando todas las entradas son iguales, es decir las entradas serán iguales al promedio, por lo tanto no hay desviación. std(x)=0 si y solamente si x = α*1 Un escalar multiplicado por el vector unidad, dará un vector cuyas componentes son todas iguales al valor del escalar; por lo tanto, el promedio será el valor del escalar y por ende no habrá valor desviado.

Christian Molina Vázquez

student•

rms(x)^2 = avg(x)^2 + std(x)^2

rms2 = np.sum(x**2)/x.size
avg2 = np.mean(x)**2
std2 = np.std(x)**2
rms2 == avg2 + std2
#True

Daniel Valenzuela

student•

Para usar la desviacion estandar de la muestra, o en fácil dividir por n-1 (Grados de libertad), debemos usar "np.std(X, ddof=1)".

ddof = Delta Degrees of Fredom, por defecto la libreria toma ddof igual a cero, ojo con esto.

Samuel José Moreno

student•

De donde sale la norma en la ecuacion que hace el profesor?

Mariano Gobea Alcoba

student•

1 - 1,87 es -0,87 x lo que el -2 no entraría dentro de la desv std. ¿O estoy equivocado?

Jhon Freddy Tavera Blandon

student•

Por Demostrar:  std(x)=0  si y solamente si  x=α1

Para demostrar que la desviación estándar de un vector xes igual a 0 si y solo si xes un vector constante, es decir, x = α1donde αes una constante, podemos seguir los siguientes pasos:

Supongamos que xes un vector constante x = α1. Entonces, la media del vector xserá el promedio de todos los elementos, que en este caso es α. La desviación estándar se calcula como la raíz cuadrada de la varianza, donde la varianza es la media de las diferencias al cuadrado entre cada elemento y la media. En este caso, como todos los elementos son iguales a α, la diferencia entre cada elemento y la media será 0. Por lo tanto, la varianza será 0 y, en consecuencia, la desviación estándar también será 0.

Promedio, RMS y desviación estándar. Hay una relación que estas tres cumplen cantidad rms(x)2=avg(x)2+std(x)2

avg(x)), el valor cuadrático medio (RMS) ( rms(x)) y la desviación estánstd(x)). La relacion es la siguiente:

rms(x)^2 = avg(x)^2 + std(x)^2

Esta relación establece que el cuadrado del valor cuadrático medio de un conjunto de datos xes igual a la suma del cuadrado del promedio de xy el cuadrado de la desviación estándar de x.

Jonathan Vásquez Alvarado

student•

Esas son las diferencias de ver con escalar los datos. NOTA IMPORTANTE: En los datos de la inversión a debes notar que el promedio es cero, y python no entiende ese cero absoluto, por lo que puedes hacer el vector en a2 = np.zeros(50)

Rafael Arteaga

student•

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos

Thomas Gonzalez Rodrigues

student•

una forma de realizar la 1 demonstration es que la std o desviación estándar es una medida de que tan **dispersos **están los datos por lo que si todos son lo mismo lo que significa que no se alejan uno de otro en nada el calculo de que tan alejado están los datos es 0

la segunda demostración de

rms(X)**2 = abg(x)**2 + srd(x)**2

se resolver pensando en

en el rms y std el cuadrado les esta quitando la raiz
el cuadrado del avg los esta igualando a los cuadrados de los avg dentro del calculo de la std
al sumar el avg2 con el std2 (sin raiz) estoy cancelando cada avg negativo (Xn - avg(X))**2 en el calculo del std
al quedar el calculo del std (después de la cancelación) solo con Xn**2 es exactamente el mismo que el de el rms()

aquí las ecuaciones para visualizarlo mejor

Edson Luis Pérez Castillo

student•

La comprobación de por qué std(x)=0 cuando todos sus elementos son iguales.

Osvaldo Olguín

student•

En el minuto 11:00 se ingresa un vector de unos para restar el promedio a cada entrada del vector x, pero como se ve en el curos de Introducción al Álgebra Lineal con Python (recomendado si no lo han hecho), el vector de unos no es necesario, porque al operar entre un vector y un escalar (en este caso el promedio es un escalar), ocurre broadcasting, es decir, la dimensión del escalar se amplía para ajustarse al vector.

Oscar Trujillo

student•

sigma es la desviación estándar poblacional, cuando es muestral se escribe S, y mu es la media poblacional, la muestral se escribe como X barra.

Ciro Villafraz

student•

Alejandro Cuello Maure

student•

¿Como se hace para diferenciar cuando se hace producto punto y cuando multiplicacion?

Interpretaba que hay que realizar el producto punto.

Alejandro Cuello Maure

student•

Repasando un poco las clases me di cuenta que cuando se refiere a realizar un producto punto se escribe asi

Es decir el vector transpuesto por el vector sin transponer significan que ahi se realiza el producto punto.

Cuando es sin transponer se refiere a multiplicacion del vector, es decir tenemos como resultado otro vector que resulta de multiplicar cada componete de los dos.

Carlos Alberto Cortés Ramírez

student•

Correción de Bessel : https://es.wikipedia.org/wiki/Correcci%C3%B3n_de_Bessel#:~:text=Las%20desviaciones%20est%C3%A1ndar%20se%20obtienen,estimadores%20de%20la%20varianza%20poblacional.