Curso de Estadística Descriptiva

Tablas de frecuencia para datos cuantitativos

Curso de Estadística Descriptiva

Contenido del curso

Tablas de frecuencia para datos cuantitativos

Resumen

Cuando trabajas con datos cuantitativos continuos, como horas de uso del celular o mediciones decimales, una tabla simple de frecuencias se queda corta. Ahí entra la tabla de datos agrupados, una herramienta que organiza valores numéricos en intervalos llamados clases para que puedas leer la información de un vistazo.

Los datos cuantitativos se dividen en discretos (números enteros, como apps descargadas) y continuos (con decimales, como 3.8 o 6.5 horas). Como casi nunca se repiten exactamente, agruparlos por intervalos es la única forma de resumirlos sin perder sentido estadístico.

¿Cómo se calcula el rango y la amplitud de clase?

Todo empieza identificando el dato mínimo y el dato máximo del conjunto. En el ejemplo del tiempo en celular, el mínimo es 2.5 horas y el máximo 8.6 horas. La diferencia entre ambos te da el rango.

¿Qué es el rango en estadística? Es la diferencia entre el dato máximo y el mínimo de tu muestra. Para 50 personas con tiempo de celular entre 2.5 y 8.6 horas, el rango es 6.1.

En Google Sheets puedes obtener estos valores rápido con las funciones =MIN() y =MAX() aplicadas a tu columna de datos [02:30].

¿Cuántas clases conviene usar?

El número de clases es arbitrario, pero hay una recomendación práctica: entre 5 y 15 clases. Para una muestra de 50 datos, seis clases funcionan bien. Una vez decidido ese número, calculas la amplitud o ancho de clase dividiendo el rango entre el número de clases [03:45].

  • Rango: 6.1.
  • Número de clases elegido: 6.
  • Amplitud: 6.1 ÷ 6 ≈ 1.02, que se redondea hacia arriba a 1.1.

El redondeo siempre va hacia arriba para que el último intervalo cubra el dato máximo. Empezando en 2.5 y sumando 1.1 cada vez, obtienes los límites: 2.5–3.6, 3.6–4.7, 4.7–5.8, 5.8–6.9, 6.9–8.0 y 8.0–9.1.

¿Cómo se cuenta la frecuencia absoluta sin duplicar datos?

Aquí aparece una decisión clave: cuando un dato cae justo en el límite entre dos clases (por ejemplo, 3.6), debes elegir si lo cuentas en la clase inferior o en la superior. Lo único prohibido es contarlo dos veces [05:30].

La recomendación es enviarlo siempre a la clase siguiente. Para automatizar el conteo en Google Sheets, usas la función =CONTAR.SI.CONJUNTO() con dos condiciones: mayor o igual al límite inferior, y menor estricto al límite superior. Así garantizas que cada valor se cuente una sola vez.

¿Qué es la frecuencia absoluta? Es el número de datos que cae dentro de cada clase. La suma de todas las frecuencias absolutas debe igualar el total de la muestra; si no, hay un error de conteo.

En el ejemplo, la suma de todas las frecuencias da 50, que coincide con los 50 entrevistados. Si te sale 49 o 51, revisa los límites.

¿Qué aportan la frecuencia relativa y la acumulada?

La frecuencia relativa convierte cada frecuencia absoluta en porcentaje del total. Divides la frecuencia de cada clase entre 50 y obtienes valores como 20%, 16%, 24%, etc. La suma cierra en 100% [08:15].

La frecuencia acumulada suma progresivamente las frecuencias absolutas. La primera clase pasa directo, y cada siguiente le agrega la anterior. Por ejemplo: 10, luego 10+8=18, luego 18+12=30, hasta cerrar en 50.

Existe también la frecuencia relativa acumulada, menos común pero útil. Funciona igual que la acumulada, solo que va sumando porcentajes hasta llegar a 100%.

¿Qué te dice realmente la tabla?

Una vez ordenada, la tabla revela patrones que en los datos crudos ni se ven. Antonio lo compara con desempacar una maleta: hasta que no la ordenas, no sabes qué tienes [10:50].

  • El 26% de la muestra usa el celular entre 5.8 y 6.9 horas, el porcentaje más alto.
  • Solo el 20% usa el celular menos de 3.6 horas.
  • Apenas un 4% supera las 8 horas diarias de uso.

¿Por qué se agrupan los datos en clases? Porque los valores continuos casi nunca se repiten idénticos. Sin agrupar, una tabla de frecuencias mostraría 50 filas con frecuencia 1, sin valor analítico.

Este mismo procedimiento aplica para los datos cuantitativos discretos, como el número de apps descargadas. La diferencia es que trabajas con enteros, así que los límites de clase suelen ser más limpios. Si eliges un número distinto de clases (5 o 7 en lugar de 6), los porcentajes cambiarán un poco, pero la lógica es la misma.

¿Cómo armaste tu tabla para las apps descargadas? Cuéntame en los comentarios cuántas clases usaste y qué patrones encontraste.