No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Medidas de dispersión

10/25
Recursos

Aportes 14

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Medidas de dispersión

Ejemplo: Imagina que tienes una compañía de sombreros y comienzas a medir al usuario numero 1, ese sombrero medirá 16, el usuario numero 2 va a medir 18 y al usuario 3 medirá 20. Entonces, ya tenemos un rango de 16 a 20 para producción de sombreros, ahora hay que imaginar que este problema se lleva a millones de usuarios, no podemos medirlos todos, pero si se pueden usar medidas para saber que tan dispersos están los datos, por ejemplo si tu mides en 1 millón de sombreros y miras que solo hay una persona que tiene una medida de 21 no te conviene hacer sombreros con esa medida. Este conocimiento nos lo dará las medidas de dispersión.


  • Desviación estándar: es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución.

Pero, ¿qué nos indica esa desviación estándar?

  • Varianza: es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media.

  • Asimetría estadística

  • Curtosis:

La curtosis de una variable estadística/aleatoria es una característica de forma de su distribución de frecuencias/probabilidad.

Es verdad lo que dice del juego de dados:

import random 
dado1 = [1,2,3,4,5,6]
dado2 = [1,2,3,4,5,6]
n=range(1000000)
lista=[]
for _ in n:
  rand1 = random.randint(0, 5)
  rand2 = random.randint(0, 5)
  suma=dado1[rand1]+dado2[rand2]
  lista.append(suma)
plt.hist(lista)

En el minuto 1:50 hay un pequeño error. Usa el símbolo de σ que se usa para representar la desviación estándar de una población, pero la formula en el denominador tiene n - 1 que se utiliza para la formula de la desviación estándar de la muestra.

Ejemplos prácticos en la web sobre estos temas
https://seeing-theory.brown.edu/basic-probability/es.html#section1

Las medidas de tendencia central nos indican en qué parte se ubican los datos. Por otra parte, las medidas de dispersión nos dicen cuán dispersos están los datos de esa medida de tendencia central.

Había escuchado los terminos de skewness y curtosis durante todo el camino de esta escuela y hasta esta clase me quedo claro jajaja gracias profesora

Sobre la curtosis, en algunas librerías el valor “0” de curtosis, cuando es mesocúrtica, es de 3. Es importante tenerlo en cuenta cuando hagamos el analisis de las distribuciones.

https://www.youtube.com/watch?v=cg4kUsbjQms

Con esto se aclara un poco lo que es varianza y desviación estándar.

Medidas de dispersión

  • Desviación estándar: esta medida de dispersión de una población repasa la cantidad de dispersión de una población estandar.

  • Varianza: representa la variabilidad de una serie de datos respecto a la media de los mismos.

  • Asimetría estadística: son indicadores que permiten establecer el grado de simetría o asimetría que presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer su representación gráfica.

  • Curtosis: esta medida de dispersión de una variable estadística/aleatoria es una característica de forma de su distribución de frecuencia/probabilidad.

Aprecio bastante las explicaciones de los momentos centrales: asimetría y curtosis. En particular, estoy realizando una tesis que conlleva entender estos dos conceptos y gracias a la maestra los logro comprender un poco más ahora. De verdad gracias.

Me parece que esta fórmula de la varianza es lo suficientemente clara:

No necesariamente, es un valor atípico lo que se encuentra por fuera del rango del -3 a 3.

Para los que no tienen una idea exacta del juego que se menciona es este: