Puntaje Z: estandarizando datos
Clase 23 de 27 • Curso de Estadística Descriptiva
Resumen
La distribución normal o campana de Gauss es una herramienta fundamental en estadística que nos permite comprender los patrones de distribución de datos en diversos contextos. Cuando necesitamos comparar datos de diferentes experimentos, la estandarización se vuelve esencial. La puntuación Z nos brinda esta capacidad, transformando cualquier distribución normal en una escala comparable, lo que facilita el análisis e interpretación de datos en campos tan diversos como la psicología, la tecnología o la medicina.
¿Qué es la puntuación Z y por qué es tan importante en estadística?
La puntuación Z (también llamada Z-score) es un valor estadístico que nos permite estandarizar datos de diferentes distribuciones normales para poder compararlos entre sí. Esta herramienta convierte cualquier valor de una distribución normal en un número que indica cuántas desviaciones estándar se encuentra por encima o por debajo de la media.
Para entender esto con un ejemplo sencillo, consideremos las puntuaciones de IQ:
- Las puntuaciones de IQ se distribuyen normalmente con una media de 100
- La desviación estándar es de 15
- Entre 85 y 115 (media ± una desviación estándar) encontramos al 68% de la población
La puntuación Z nos ayuda a determinar qué porcentaje de la distribución se encuentra por debajo o por encima de un valor específico. Esto es particularmente útil cuando queremos comparar valores de diferentes distribuciones normales.
¿Cómo se calcula la puntuación Z?
La fórmula para calcular la puntuación Z es sencilla:
Z = (X - μ) / σ
Donde:
- X = Valor que queremos estandarizar
- μ = Media de la distribución
- σ = Desviación estándar de la distribución
Veamos algunos ejemplos prácticos con las puntuaciones de IQ:
Para una persona con IQ de 115:
Z = (115 - 100) / 15 = 1
Para una persona con IQ de 85:
Z = (85 - 100) / 15 = -1
Para una persona con IQ de 130:
Z = (130 - 100) / 15 = 2
Estos valores Z son muy importantes porque nos indican exactamente dónde se ubica un valor específico dentro de la distribución normal estandarizada. Por ejemplo:
- Z = 1 significa que el valor está una desviación estándar por encima de la media
- Z = -1 significa que está una desviación estándar por debajo de la media
- Z = 2 significa que está dos desviaciones estándar por encima de la media
¿Cómo interpretar la puntuación Z con tablas de distribución normal?
Una vez que tenemos la puntuación Z, podemos determinar qué porcentaje de la población se encuentra por debajo de ese valor utilizando tablas de distribución normal estándar o funciones estadísticas en software como Google Sheets o Excel.
Ejemplos de interpretación:
Para Z = 1:
- Utilizando la función de distribución normal estándar, obtenemos 0.8413
- Esto significa que el 84.13% de la población tiene un IQ de 115 o menor
Para Z = -1:
- Obtenemos 0.1587
- Significa que solo el 15.87% de la población tiene un IQ de 85 o menor
Para Z = 2:
- Obtenemos 0.9772
- Esto indica que el 97.72% de la población tiene un IQ de 130 o menor
En herramientas como Google Sheets, podemos utilizar la función de distribución normal estándar para obtener estos valores automáticamente:
=DISTR.NORM.ESTAND(Z)
¿Cómo aplicar la puntuación Z a casos reales?
La belleza de la puntuación Z radica en su versatilidad para aplicarse a cualquier conjunto de datos que siga una distribución normal. Veamos un ejemplo práctico relacionado con el número de aplicaciones que las personas descargan:
Supongamos que tenemos los siguientes datos:
- Media de aplicaciones descargadas: 77 apps
- Desviación estándar: 28 apps
Si queremos saber qué porcentaje de personas descarga 60 apps o menos:
-
Calculamos la puntuación Z:
Z = (60 - 77) / 28 = -0.61
-
Usamos la función de distribución normal estándar:
=DISTR.NORM.ESTAND(-0.61) = 0.26
-
Interpretamos: El 26% de las personas descarga 60 apps o menos
De manera similar, podemos calcular:
- Para 80 apps: Z = (80 - 77) / 28 = 0.11
- Resultado: El 53% de las personas descarga 80 apps o menos
- Para 100 apps: Z = (100 - 77) / 28 = 0.82
- Resultado: El 78% de las personas descarga 100 apps o menos
Esta metodología puede aplicarse a numerosas situaciones: horas de uso del teléfono, rendimiento académico, métricas de salud, entre otros ámbitos.
La puntuación Z es una herramienta poderosa que nos permite estandarizar y comparar datos de diferentes distribuciones normales. Con su ayuda, podemos determinar con precisión dónde se ubica un valor específico dentro de una distribución y qué porcentaje de la población se encuentra por debajo o por encima de ese valor. En próximas sesiones, exploraremos cómo calcular porcentajes para rangos específicos dentro de una distribución.
¿Has utilizado alguna vez la puntuación Z en tus análisis de datos? ¿Qué otros conceptos estadísticos te gustaría profundizar? Comparte tus experiencias en los comentarios.