Curso de Estadística Descriptiva

Media y mediana con tabla de frecuencias

Curso de Estadística Descriptiva

Contenido del curso

Media y mediana con tabla de frecuencias

Resumen

Cuando solo tienes una tabla de frecuencias y no los datos originales, todavía puedes estimar la media y la mediana en datos agrupados con muy buena precisión. Esta guía te muestra el método paso a paso para que cualquier estudiante de estadística descriptiva pueda aplicarlo en Google Sheets o Excel.

¿Por qué calcular media y mediana en datos agrupados?

Una tabla de frecuencias resume la información en clases con su límite inferior, límite superior, marca de clase y frecuencias. El detalle es que pierdes el grueso de los datos originales, así que no obtienes valores exactos, sino aproximaciones muy cercanas que en estadística se conocen como iteraciones.

¿Qué es una iteración en estadística? Es una aproximación numérica que se calcula a partir de datos resumidos cuando no tienes acceso a los valores individuales. El nombre suena complejo, pero el procedimiento es sencillo.

¿Cómo se calcula la media en datos agrupados?

La fórmula multiplica la marca de clase (Xi) por la frecuencia absoluta (Fi) de cada intervalo, suma todos los productos y divide entre el total de datos. Es básicamente un promedio ponderado por clase.

En la práctica, los pasos son:

  1. Crear una columna nueva con la multiplicación Xi por Fi para cada clase.
  2. Sumar todos esos productos para obtener la sumatoria.
  3. Dividir esa sumatoria entre el número total de datos (en el ejemplo, 50).

Con la tabla resumida la sumatoria fue 263 y al dividir entre 50 la media estimada quedó en 5.27. Cuando se calculó con los 50 datos sueltos en la clase pasada, el resultado fue 5.23. La diferencia es mínima, lo que confirma que la aproximación es lo que le sigue de buena.

¿Qué es la marca de clase? Es el punto medio entre el límite inferior y el límite superior de cada intervalo. Se representa como Xi y es la pieza clave para estimar la media.

¿Cómo se calcula la mediana en datos agrupados?

La mediana es el valor que ocupa la posición central cuando los datos están ordenados de menor a mayor. Para estimarla en una tabla agrupada necesitas identificar primero el intervalo mediano, que es la clase donde cae el dato del medio.

¿Cómo identificar el intervalo mediano?

Divide el total de datos entre dos. Con 50 datos, el dato mediano está en la posición 25. Después revisa la columna de frecuencia acumulada y busca la primera clase cuya frecuencia acumulada iguale o supere ese 25.

En el ejemplo, la frecuencia acumulada va así:

  • Intervalo 1: acumula 10 datos.
  • Intervalo 2: acumula 18 datos.
  • Intervalo 3: acumula 30 datos.

El dato 25 cae en el tercer intervalo, entre 4.7 y 5.8. Ese es el intervalo mediano.

¿Cuál es la fórmula de la mediana en datos agrupados?

La mediana se aproxima con esta estructura:

Mediana ≈ Límite inferior del intervalo mediano + ((N/2 menos frecuencia acumulada anterior) dividido entre la frecuencia absoluta del intervalo mediano) multiplicado por la amplitud de clase.

El símbolo de aproximación se ve como un igual ondulado y significa que el resultado no es exacto, pero sí muy cercano al real.

Aplicando los valores del ejercicio:

  • Límite inferior del intervalo mediano: 4.7.
  • N/2: 50 entre 2 igual a 25.
  • Frecuencia acumulada anterior: 18.
  • Frecuencia absoluta del intervalo mediano: 12.
  • Amplitud de clase: 1.1.

El resultado da una mediana estimada de 5.34, mientras que con los datos completos la mediana real fue 5.15. Otra vez, la aproximación es bastante sólida.

¿Cuál es la diferencia entre frecuencia absoluta y frecuencia acumulada? La frecuencia absoluta es cuántos datos caen en una clase específica. La acumulada suma esa clase con todas las anteriores. En la fórmula de la mediana necesitas distinguirlas bien.

¿Qué tan confiables son estas aproximaciones?

Cuando la media estimada y la mediana estimada quedan cerca entre sí, es buena señal: indica que tu tabla resume datos sanos y poco dispersos. En el ejemplo, 5.27 y 5.34 están muy próximos, lo que sugiere una distribución equilibrada.

Una recomendación práctica: aplica este mismo método a tu proyecto paralelo de apps descargadas. Construye la tabla resumida con límites, marcas de clase y frecuencias, y estima la media y la mediana. Ese ejercicio refuerza el dominio de la estadística descriptiva con datos agrupados.

El siguiente paso natural es medir qué tan dispersos están los datos con el rango y la desviación estándar, dos herramientas que complementan cualquier análisis de tendencia central. ¿Ya intentaste calcularlo con tus propios datos? Cuéntame en los comentarios cómo te fue con la aproximación.