Contenido del curso

Média e mediana com tabela de frequências

Resumen

Cuando tienes una tabla de frecuencias con datos agrupados y no los 50 valores originales de tu encuesta, todavía puedes obtener aproximaciones muy confiables de la media y la mediana. Esta guía te muestra el paso a paso usando Google Sheets, pensada para quienes están aprendiendo estadística descriptiva y trabajan con datos resumidos.

La idea central es simple: aunque perdemos precisión al agrupar, la marca de clase y la frecuencia absoluta nos permiten estimar las medidas de tendencia central con un margen de error mínimo. Vamos a ver cómo.

¿Qué necesitas en tu tabla de frecuencias antes de empezar?

Antes de calcular nada, asegúrate de tener tu tabla completa con todas sus columnas. Sin estos elementos, las fórmulas no funcionan.

  • Límite inferior y límite superior de cada clase.
  • Marca de clase o punto medio (Xi), que es el valor central de cada intervalo.
  • Frecuencia absoluta (Fi), es decir, cuántos datos caen en cada clase.
  • Frecuencia acumulada, que suma la absoluta con todas las anteriores.
  • Frecuencia relativa y frecuencia relativa acumulada en porcentaje.

¿Qué es la marca de clase? Es el punto medio de cada intervalo, calculado como el promedio entre el límite inferior y el superior. Funciona como representante de toda la clase para los cálculos.

¿Cómo se calcula la media en datos agrupados? [01:30]

La media para datos agrupados se obtiene multiplicando cada marca de clase por su frecuencia absoluta, sumando esos productos y dividiendo entre el total de datos. En fórmula: media ≈ Σ(Xi · Fi) / N.

En la práctica con Google Sheets, creas una columna nueva llamada Xi · Fi y multiplicas fila por fila. Si el resultado aparece como porcentaje, simplemente cambia el formato a texto sin formato o número plano. Es un detalle común en hojas de cálculo y no afecta el cálculo.

Después sumas toda esa columna y divides entre N. En el ejemplo de la clase, la suma fue 263 y N = 50, lo que da una media de 5.27. Comparado con la media real de los 50 datos sin agrupar (5.23), la aproximación es bastante buena.

¿Por qué es solo una aproximación? Porque al agrupar perdemos los valores exactos y trabajamos con la marca de clase como representante. El símbolo ≈ (ondulado) en la fórmula te recuerda que el resultado es cercano, no idéntico.

¿Cómo se calcula la mediana en datos agrupados? [04:30]

La mediana es el dato que queda exactamente en el medio cuando ordenas los valores de menor a mayor. En datos agrupados no tienes esos valores, así que necesitas identificar primero el intervalo mediano.

¿Cómo identificar el intervalo mediano?

Divide N entre 2. Con 50 datos, el dato mediano sería el número 25. Ahora revisa la columna de frecuencia acumulada y busca dónde aparece por primera vez ese valor.

  • Intervalo 1: acumula 10. No es ahí.
  • Intervalo 2: acumula 18. Todavía no llega.
  • Intervalo 3: acumula 30. Aquí cae el dato 25.

Entonces el intervalo mediano va de 4.7 a 5.8 en el ejemplo. Ese es tu punto de partida.

¿Cuál es la fórmula completa de la mediana?

La fórmula es: mediana ≈ Li + ((N/2 − Fa anterior) / Fi mediana) · amplitud.

Donde cada término significa:

  • Li: límite inferior del intervalo mediano (4.7).
  • N/2: total de datos entre dos (50/2 = 25).
  • Fa anterior: frecuencia acumulada del intervalo previo al mediano (18).
  • Fi mediana: frecuencia absoluta, no acumulada, del intervalo mediano (12).
  • Amplitud: diferencia entre límite superior e inferior de la clase (1.1).

Sustituyendo los valores: 4.7 + ((25 − 18) / 12) · 1.1 = 5.34. La mediana real con datos completos era 5.15, así que de nuevo la aproximación es sólida.

¿Por qué importa distinguir frecuencia absoluta de acumulada?

Es el error más común al aplicar la fórmula. La frecuencia absoluta es cuántos datos caen exclusivamente en esa clase. La frecuencia acumulada es la suma de la absoluta con todas las anteriores.

En la fórmula de la mediana necesitas la absoluta del intervalo mediano (no la acumulada) y la acumulada del intervalo anterior. Confundirlas te da resultados muy alejados del valor real.

Una vez que tengas tu tabla resumida, calcular media y mediana se vuelve una rutina rápida. Ahora aplica esto a tu propio proyecto, por ejemplo el de aplicaciones descargadas, y compara las aproximaciones con los datos sin agrupar si los tienes a la mano.

El siguiente paso es medir qué tan dispersos están esos datos con el rango y la desviación estándar. ¿Ya intentaste calcular la media y la mediana de tu propia tabla? Cuéntame en los comentarios qué resultado obtuviste.