Contenido del curso
Una imagen vale más que mil datos
Estadística descriptiva
- 8

Distribuciones conjuntas en tablas dinámicas
08:26 min - 9

Medidas de Tendencia Central: Media, Mediana y Moda
13:49 min - 10

Media, mediana y moda en Excel con videojuegos
05:20 min - 11

Rango e índice intercuartílico en Excel
12:07 min - 12

Desplazamiento y escala en tus datos
08:31 min - 13

Cómo construir un boxplot paso a paso
06:47 min
Representación de datos
Muestra y error
¿Y la probabilidad?
- 19

Probabilidad simple vs experimental con dados y cartas
07:27 min - 20

Regla de la Suma en Probabilidad: Unión e Intersección de Eventos
10:45 min - 21

Eventos dependientes e independientes en probabilidad
06:29 min - 22

Teorema de Bayes con dados y fórmula
13:28 min - 23

Permutación vs combinación con cartas
03:19 min
Correlación y causalidad
Conclusiones
Media, varianza y desviación estándar en Excel
Resumen
La media, la varianza y la desviación estándar son tres medidas estadísticas que te permiten describir un conjunto de datos con pocos valores y, a partir de una muestra, hacer inferencias sobre toda una población. Si trabajas con datos en Excel o Google Sheets, dominarlas te ahorra horas de cálculo y te ayuda a tomar decisiones más informadas.
Antes de entrar en fórmulas, conviene aclarar una distinción que aparece todo el tiempo en estadística: la diferencia entre población y muestra.
¿Qué diferencia hay entre población y muestra?
Una población es el conjunto completo que quieres analizar. Una muestra es una parte representativa de esa población.
Piensa en la Ciudad de México: su población son 22 millones de personas. Analizar a cada una sería imposible, así que tomas una muestra representativa y, con ella, haces inferencias sobre el resto. Aquí entra una palabra clave: cuando un valor describe a la población completa, se llama parámetro; cuando describe solo a la muestra, se llama estadístico [1:43].
¿Qué es un parámetro en estadística? Es un valor que describe a toda la población, como la media poblacional (μ). Se diferencia del estadístico, que solo describe a la muestra (x̄).
¿Cómo se calcula la media poblacional y la media muestral?
La media es el promedio: el valor central que distribuye los datos de forma equitativa. La fórmula es la misma en ambos casos, suma de los elementos dividida entre el total, pero cambia la notación [2:30].
- Media poblacional (μ): suma de todos los elementos dividida entre N (tamaño total de la población).
- Media muestral (x̄): suma de todos los elementos dividida entre n (tamaño de la muestra).
En Sheets o Excel puedes calcularla a mano con =SUMA(rango)/CONTAR(rango) o usar directamente la función =PROMEDIO(rango). En el ejemplo del catálogo de películas, la duración promedio fue de aproximadamente 99.5 minutos.
¿Qué es la varianza y por qué hay dos fórmulas?
La varianza mide qué tan lejos está cada valor respecto a la media. Es la suma de las diferencias al cuadrado entre cada elemento y el promedio, dividida entre el total de datos [3:35].
- Varianza poblacional (σ²): suma de (xᵢ − μ)² dividida entre N.
- Varianza muestral (s²): suma de (xᵢ − x̄)² dividida entre n − 1.
¿Por qué n − 1 y no n? Porque cuando calculas un estadístico desde una muestra, introduces un sesgo. Si dividieras solo entre n, la varianza quedaría subestimada. Dividir entre n − 1 corrige ese sesgo y te entrega una varianza no sesgada [4:35].
¿Por qué se divide entre n menos 1 en la varianza muestral? Porque al estimar la varianza desde una muestra se introduce un sesgo a la baja. Restar uno al denominador compensa ese sesgo y entrega un valor más fiel al de la población.
¿Cómo calcular la varianza paso a paso en Sheets?
Para hacerlo a mano necesitas una columna auxiliar con las diferencias al cuadrado:
- Filtra la columna para eliminar valores vacíos y evitar errores de cálculo.
- Crea una nueva columna con la fórmula
=(valor − media)^2, fijando la celda de la media con F4. - Arrastra la fórmula a todas las filas.
- Suma esa columna y divide entre N (población) o entre n − 1 (muestra).
Si prefieres la vía rápida, usa las funciones precargadas: =VAR.P(rango) para varianza poblacional y =VAR.S(rango) para varianza muestral. El resultado es idéntico al cálculo manual.
¿Qué te dice la desviación estándar sobre tus datos?
La desviación estándar mide qué tan alejado está cada valor del promedio, pero en las mismas unidades que tus datos originales (no al cuadrado, como la varianza) [6:50].
- Si la desviación estándar es grande, los datos están dispersos: lejos de la media.
- Si es pequeña, los datos se concentran cerca del promedio.
- Si es cero, todos los valores son idénticos.
La fórmula es simple: la raíz cuadrada de la varianza. Por eso, en notación, el parámetro es σ (sigma) y el estadístico es s.
En Sheets basta con =RAIZ(varianza) o usar directamente =DESVEST.P(rango) para población y =DESVEST.M(rango) para muestra.
¿Cómo aplicar todo esto a un caso real?
En el ejercicio del catálogo de películas, la población fue toda la columna de duración en minutos y la muestra fue una selección aleatoria. Tanto la media como la varianza y la desviación estándar mostraron pequeñas diferencias entre población y muestra, lo que es esperable: una muestra rara vez replica con exactitud los valores poblacionales, pero si está bien tomada, se acerca lo suficiente para hacer inferencias válidas.
Un detalle práctico: cuando tu columna mezcla tipos de datos (por ejemplo, duración de películas y número de temporadas de series), filtra los vacíos antes de calcular. Si no lo haces, tu varianza arrastrará errores.
El reto que te dejo es replicar estos cálculos con el año de estreno del mismo catálogo. Aplica las tres fórmulas, compara parámetro contra estadístico y comparte tus resultados en los comentarios si necesitas una mano.