Las medidas de dispersión son herramientas estadísticas que nos permiten entender cuán juntos o separados están nuestros valores dentro de un conjunto de datos. En otras palabras, mientras que las medidas de tendencia central nos decían dónde estaba el punto de equilibrio, las dispersión nos indica cuál es el grado de variabilidad. En esta clase, abordaremos el rango y el índice intercuartílico, y más adelante veremos la desviación estándar, otra medida crucial de dispersión.
¿Cómo se calcula el rango?
El rango es quizá la medida de dispersión más sencilla de calcular. Se obtiene al restar el valor mínimo del conjunto de datos al valor máximo, proporcionando así una idea general de la amplitud o extensión de los valores.
Paso para calcular:
Identificar el valor más bajo (mínimo).
Identificar el valor más alto (máximo).
Resta el mínimo del máximo.
Por ejemplo, si en un conjunto de puntuaciones los valores extremos son 60 y 76, el rango sería:
Rango = Valor máximo - Valor mínimo
Rango = 76 - 60 = 16
Este resultado indica que los valores están distribuidos dentro de un margen de 16 unidades.
¿Qué es el índice intercuartílico?
El índice intercuartílico, a pesar de parecer complicado por su nombre, es simplemente la medida de variabilidad de los datos basada en cuartiles. Los cuartiles dividen un conjunto de datos en cuatro partes iguales, siendo el segundo cuartil equivalente a la mediana. El índice intercuartílico es la diferencia entre el tercer y el primer cuartil.
¿Cómo se determina el índice intercuartílico?
Para calcular el índice intercuartílico, sigue estos pasos:
Ordenar los datos: Asegurarse de que los datos estén en orden ascendente.
Identificar la mediana (Q2): Es el segundo cuartil. Para 21 valores, por ejemplo, estará en la posición (n+1)/2, donde n es el número total de datos.
Encontrar el primer cuartil (Q1): Esta es la mediana de la mitad inferior del conjunto de datos.
Determinar el tercer cuartil (Q3): Es la mediana de la mitad superior del conjunto de datos.
Calcular la diferencia: Restar el primer cuartil del tercer cuartil para obtener el índice intercuartílico.
En un ejemplo práctico, supongamos que después de ordenar los valores, obtenemos Q1 = 66 y Q3 = 73. Entonces, el índice intercuartílico sería:
Índice intercuartílico = Tercer cuartil - Primer cuartil
Índice intercuartílico = 73 - 66 = 7
Aplicando medidas de dispersión en Excel y Sheets
Cuando trabajamos con grandes conjuntos de datos, las herramientas como Excel y Google Sheets son esenciales para simplificar los cálculos de dispersión.
Usando Excel y Sheets para calcular el rango
En Excel y Sheets, se pueden utilizar las funciones MAX() y MIN() para encontrar rápidamente el rango:
Rango = MAX(datos) - MIN(datos)
Calcular el índice intercuartílico con funciones directas
Para calcular el índice intercuartílico usando las funciones de estas herramientas:
Función QUARTILE: Nos permite calcular cuartiles sin contar manualmente posiciones.
Estas funciones no solo son más eficientes, sino que también nos evitan errores al contar manualmente posiciones, especialmente en grandes conjuntos de datos.
Invitamos a los estudiantes a continuar practicando y aplicando estos conceptos, usando las herramientas tecnológicas disponibles para afianzar su comprensión y desarrollo estadístico. Cada esfuerzo cuenta y los desafíos en el aprendizaje son oportunidades para crecer. ¡Adelante!
Medidas de dispersión describen Que tan juntos o separados entre sí se encuentran los valores. Esta vez estudiaremos el Rango e Índice intercuartílico (IQR)
RANGO → Medida que nos indica la distancia de nuestros valores y se calcula restando: Valor máximo - valor mínimo
EJEMPLO:
En Excel o GS se puede usar la fórmula =max(datos) - min(datos)
ÍNDICE INTERCUARTÍLICO (RIQ o IQR) → Diferencia entre el tercer y primer cuartil de una distribución.
CUARTIL → Distribución en cuartiles o en cuartos de los datos.
Para encontrar el índice intercuartil (RIQ):
Primero se encuentra la mediana del conjunto de datos, que será nuestro segundo cuartil:
Tenemos 21 valores , en caso de tener el número de datos impar aplicamos la fórmula de la mediana:
En este caso la mediana ocupará la posición 11.
Luego encontraremos el primer y tercer cuartil, es decir, la mediana de la mitad inferior y de la mitad superior de los datos
Para buscar el primer cuartil Q1 , tomamos el valor mínimo hasta la mediana (desde 60 hasta 67) y hacemos el mismo proceso, ya que tenemos el número de datos impar:
Lo mismo para encontrar el tercer cuartil Q3, tomamos los datos desde la mediana hasta el valor máximo (desde 67 hasta 77) y hacemos el mismo proceso.
Después de tener identificados los cuartiles, aplicamos la fórmula del índice intercuartil (IQR) restando el tercer cuartil menos el primer cuartil (IQR = Q3 - Q1).
Buenas tardes, entiendo que estas medidas nos ayudan a entender la dispersión de los valores, pero no entiendo cómo se interpretarían estos resultados, es decir, ¿qué aportarían al análisis o a la interpretación de una situación?
Justo me preguntaba esto.
Le pregunte a CHAT GPT, en especial e IQR
Salarios de una empresa: Puede analizar la distribución de los salarios en los empleados.
Supongamos que el IQR des pequeño, esto indica que los salarios del 50% central de los empleados están bastante cerca entre si, sugiriendo una menor disparidad salarian en ese grupo.
Si el IQR es grande, puede indicar que hay una mayor disparidad entre los salarios de los empleados de nivel medio, lo que puede ser una señal de desigualdad.
Precios de Vivienda.
El IQR puede ayudar a entender la variación de los precios en los diferentes barrios.
Un IQR pequeño indicaría que los precios de las casas en la mayoria de los barrios estan bastante cerca del precio mediano, mientras que un IQR grande sugeriría una gran variabilidad, con algunos barrios muchos caros o baratos que otros.
Algo así, continuo tratando de entender como aplicaria este concepto en la vida real.
Muchas Gracias :)
El rango intercuartílico (IQR) es una medida de variabilidad. Los cuartiles dividen un conjunto de datos clasificados en cuatro partes iguales
Como feedback, no se si solo me paso a mi pero al momento de realizar el ejercicio del workbook intente resolverlo de la manera en la que nos explico en este video (sacando primero mediana, luego sacando las medianas de los subgrupos intente sacar los cuartiles) sin embargo se me complico con este metodo y me enrede. Intente buscar en los comentarios y me doy cuenta que algunas personas indicaban que mejor usar las formulas que aparecen al final del workbook. Me parece que estas formulas debieron ser explicadas en el video del curso, al menos socializadas porque en mi caso ni sabia que estaban presentes al final en las soluciones de estos ejercicios
Totalmente de acuerdo, porque el resultado de la tarea no salio igual a la resolucion, cuando analizo las repuestas, muestran otras formulas, que no se explicaron en el video.
Puede ser obvio para algunos, pero no para todos.
Tal cual, según lo hacen para que "investiguemos por nuestra cuenta", pero empiezo a creer que no es así y les falta muuuucha calidad a los cursitos :/
Sé que el rango y el IQR indican la dispersión que existe entre nuestros datos, pero ¿para qué me sirve saber esto?, ¿cuál es el propósito práctico y ejemplificado de en qué me ayuda o qué representa?
¡Hola Samuel!
El rango tiene como propósito proporcionar una medida rápida y sencilla de la amplitud de los datos.
Ejemplo:
Supongamos que eres el gerente de una tienda y estás interesado en el rango de los precios de los productos en tu tienda. Si el precio mínimo de un producto es $10 y el precio máximo es $100, el rango de precios es $100 - $10 = $90. Esto te indica que tus productos tienen un rango de precios bastante amplio, lo que puede ser útil para tomar decisiones sobre estrategias de precios, promociones, o qué productos enfocar en tu marketing.
El propósito del IQR al estar basado en cuartiles, es proporcionar una medida de la dispersión que no se ve afectada por valores extremos o atípicos.
Ejemplo:
Imagina que eres un científico de datos que analiza los tiempos de entrega de paquetes en una empresa de mensajería. Tienes un conjunto de datos que muestra los tiempos de entrega para 1000 paquetes. Si calculas el IQR de estos tiempos de entrega y obtienes un valor de 2 días, esto significa que el 50% de los paquetes se entregaron en un rango de tiempo de 2 días. Esta medida es útil para evaluar la consistencia en los tiempos de entrega, identificar posibles problemas operativos o evaluar el rendimiento de diferentes rutas de entrega.
Muchísimas gracias! @werlix
El resultado de calcular en excel el IQR en el ejercicio del workbook es diferente al de las respuestas del final. En el workbook la respuesta es 10.5 y el resultado que me da excel es 7.5 ¿Excel calcula los cuartiles de forma diferente a lo estudiado? Esto me dejo un poco confuso. ¿Alguien me pudiera aclarar esa duda? Gracias de antemano
Hola Ricardo, disculpa la demora, ¿pudiste solucionar el problema?
A mi tambien me sucedio eso mismo,en mi caso excel me aroja 7.25
Medida de dispersión
Una medida de dispersión, también conocida como medida de variabilidad o medida de dispersión de datos, es una medida estadística que indica cómo se distribuyen los valores alrededor de una medida central, como la media o la mediana. Estas medidas proporcionan información sobre la amplitud, la variabilidad o la dispersión de los datos en una variable.
Las medidas de dispersión son utilizadas para comprender cómo se extienden los datos y cuánto varían con respecto a una medida central. Son especialmente útiles para describir la heterogeneidad o la uniformidad de los datos, identificar valores extremos y comparar la variabilidad entre diferentes conjuntos de datos.
.
El rango y el IQR (rango intercuartílico)
El rango y el IQR (rango intercuartílico) son dos medidas de dispersión utilizadas en estadística para describir la variabilidad o dispersión de datos en una variable. A continuación, te explico en qué consisten cada una de ellas:
Rango: El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos. Es una medida muy simple de dispersión que proporciona una idea de la amplitud total de los datos. Para calcular el rango, se resta el valor mínimo del valor máximo.
IQR (rango intercuartílico): El IQR es una medida de dispersión más robusta que se basa en los cuartiles de un conjunto de datos.
Los cuartiles dividen los datos ordenados en cuatro partes iguales, lo que nos permite obtener una idea de cómo se distribuyen los datos en el conjunto. El IQR es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1).
Q1 representa el punto que divide el 25% inferior de los datos del 75% superior, mientras que Q3 representa el punto que divide el 75% inferior del 25% superior.
Por lo tanto, el IQR incluye el rango intermedio donde se encuentra el 50% central de los datos. Es menos sensible a valores extremos y proporciona información sobre la dispersión de los datos en torno a la mediana.
import numpy as np
# MEDIDASDEDISPERSION:RANDOEINDICEINTERCUARTILICOdatos = np.random.randint(20,50, size=6) # con un numero par
print("Arreglo:",datos,", Numero de datos:",len(datos))datosOrdenados = np.sort(datos)print(datosOrdenados)def par(lista):iflen(lista)%2>0:returnFalseelse:returnTrue# Encientro la mediana de los valores
def quarter(lista, funct):iffunct(lista):Qx=(len(lista)+1)/2else:Qx=0.5*((len(lista)/2)+((len(lista)/2)+1))returnQxIQ2=quarter(datosOrdenados, par)print("Posicion de Q2:",IQ2)if(IQ2%1)>0:Q2=(datosOrdenados[int(IQ2//1)-1] + datosOrdenados[int(IQ2//1)]) / 2else:Q2= datosOrdenados[IQ2-1]print("Valor de Q2:",Q2)# Calculo de cuartiles Q1 y Q3def mitadLista(lista, funct): rango1=[] rango2=[]if not funct(lista):print("Lista de datos es impar") rango1 = lista[:(len(lista)//2+1)]print(f"Rango 1: {rango1}") rango2 = lista[(len(lista)//2):]print(f"Rango 2: {rango2}")else:print("Lista de datos es par") rango1 = lista[:len(lista)//2]print(f"Rango 1: {rango1}") rango2 = lista[len(lista)//2:]print(f"Rango 2: {rango2}")return rango1, rango2
R1,R2=mitadLista(datosOrdenados, par)print("Valor de Q1:",R1[int(quarter(R1, par))-1])print("Valor de Q3:",R2[int(quarter(R2, par))-1])```import numpy as np
\# MEDIDASDEDISPERSION:RANDOEINDICEINTERCUARTILICOdatos = np.random.randint(20,50, size=6) # con un numero par
print("Arreglo:",datos,", Numero de datos:",len(datos))datosOrdenados = np.sort(datos)print(datosOrdenados)def par(lista):iflen(lista)%2>0:returnFalse else:returnTrue\# Encientro la mediana de los valores
def quarter(lista, funct):iffunct(lista):Qx=(len(lista)+1)/2else:Qx=0.5\*((len(lista)/2)+((len(lista)/2)+1))returnQxIQ2=quarter(datosOrdenados, par)print("Posicion de Q2:",IQ2)if(IQ2%1)>0:Q2=(datosOrdenados\[int(IQ2//1)-1] + datosOrdenados\[int(IQ2//1)]) / 2else: Q2 = datosOrdenados\[IQ2 - 1]print("Valor de Q2:",Q2)\# Calculo de cuartiles Q1 y Q3def mitadLista(lista, funct): rango1=\[] rango2=\[]if not funct(lista):print("Lista de datos es impar") rango1 = lista\[:(len(lista)//2+1)] print(f"Rango 1: {rango1}") rango2 = lista\[(len(lista)//2):] print(f"Rango 2: {rango2}")else:print("Lista de datos es par") rango1 = lista\[:len(lista)//2] print(f"Rango 1: {rango1}") rango2 = lista\[len(lista)//2:] print(f"Rango 2: {rango2}")return rango1, rango2
R1,R2=mitadLista(datosOrdenados, par)print("Valor de Q1:",R1\[int(quarter(R1, par))-1])print("Valor de Q3:",R2\[int(quarter(R2, par))-1])
Buenas, ¿porqué a veces el cuartil calculado por Excel es distinto al calculado con fórmula? ¿Excel discrimina cierto tipo de datos? Ojalá puedan responder.
deberían ser iguales, lo que sí puede pasar es que te de unos decimales diferentes,
te respondí tu otro comentario. espero que te ayude
@lucianabenitezcfh ya lo vi gracias.
un pequeño aporte
Llevaba años usando el diagrama de caja o moño, y hasta ahorita estoy viendo el detalle de dónde sale jajaja
Quiero informar que en la sección de recursos se encuentra la presentación en pdf, no se encuentra el proyecto. si lo pudieran subir a esta clase por favor. Muchas gracias.
MEDIDAS DE DISPERSION RANGO E IQR (ESTADISTICA DESCRIPTIVA)
Aquellas que nos dicen que tan juntos o tan separados entre si se encuentran nuestros valores.
Rango: indica la distancia entre los valores.
Se identifica el valor minimo y el valor maximo.
Rango Intercuartilico (RIQ o IQR):
La mediana es el Segundo cuartil.
Indice intercuartilico= tercer cuartil – primer cuartil.