Comprender cómo se distribuyen los datos es fundamental para cualquier análisis estadístico, y los histogramas son la herramienta visual más directa para lograrlo. A diferencia de una gráfica de barras convencional, el histograma agrupa valores en intervalos y muestra cuántas veces se repiten, lo que permite identificar patrones de distribución con claridad y sin ruido visual.
¿Qué diferencia a un histograma de una gráfica de barras?
Un histograma es una gráfica de barras que trabaja con intervalos en lugar de valores individuales [1:00]. Cada barra representa un rango y la altura indica cuántas observaciones caen dentro de ese rango. Una característica visual clave es que las barras no tienen espacios entre sí, ya que representan un continuo de datos.
Imagina graficar la duración de todas las películas de un catálogo de Netflix con barras individuales para cada duración en minutos. El resultado sería ilegible por la cantidad de valores en el eje horizontal. El histograma resuelve esto agrupando, por ejemplo, películas que duran entre 91 y 100 minutos en una sola barra [1:15].
Por esta razón, al histograma también se le conoce como histograma de frecuencias: cuenta las repeticiones dentro de cada grupo.
¿Cómo funciona el histograma de frecuencia relativa?
En lugar de mostrar el conteo absoluto, el histograma de frecuencia relativa expresa cada barra como un porcentaje del total [2:00]. La forma de la distribución permanece idéntica, pero el eje vertical cambia: en vez de ir de cero a mil quinientos, cada barra indica qué proporción del conjunto representa. Por ejemplo, las películas de entre 91 y 100 minutos representan aproximadamente el 22 por ciento del catálogo.
¿Qué es un polígono de frecuencia?
El polígono de frecuencia se construye colocando un punto en el centro de la parte superior de cada barra del histograma y uniendo esos puntos con líneas [2:35]. Es una representación alternativa que facilita comparar dos distribuciones superpuestas y que sirve como puente hacia las distribuciones de probabilidad.
¿Cómo se obtiene la curva de densidad a partir del histograma?
Si redujéramos el tamaño del intervalo al mínimo —por ejemplo, convirtiendo la duración a segundos o microsegundos— las barras se volverían líneas verticales extremadamente delgadas [3:10]. Al unir sus centros, el polígono resultante se suaviza hasta convertirse en lo que se conoce como curva de densidad.
Sus características principales son:
- El área total debajo de la curva equivale al cien por ciento de los datos.
- La curva siempre se mantiene por encima del eje horizontal.
- Permite estimar porcentajes acumulados coloreando el área bajo la curva hasta un valor específico.
Por ejemplo, si quisiéramos saber qué proporción de películas dura máximo setenta minutos, bastaría con observar el área sombreada bajo la curva hasta ese punto, que representaría aproximadamente el 30 por ciento [4:00].
¿Cómo crear histogramas y polígonos en Excel y Google Sheets?
La práctica se realiza con el data set de Netflix, en la hoja de histogramas y polígonos [4:25].
Método manual con tabla dinámica
- Seleccionar el data set y crear una tabla dinámica en la hoja del ejercicio.
- Agrupar el campo de año de estreno por décadas: desde 1921 hasta 2030 con un tamaño de intervalo de diez años [5:20].
- Agregar los títulos como valores para obtener el conteo.
- Insertar una gráfica de barras. Sin embargo, esta gráfica tendrá espacios entre las barras, por lo que técnicamente no es un histograma.
Método directo con el tipo de gráfico histograma
- Seleccionar la columna de año de estreno directamente desde la tabla del data set [6:05].
- Insertar gráfico y cambiar el tipo a histograma en la sección de "otros".
- Personalizar el eje horizontal con los valores mínimo (1921) y máximo (2030) y definir el tamaño de segmento en diez [7:00].
- Al reducir el tamaño del segmento, la gráfica se suaviza, acercándose al comportamiento de la curva de densidad.
Polígono de frecuencia y curva de densidad
- Para el polígono, seleccionar la tabla con rangos y frecuencias e insertar un gráfico de líneas [7:40].
- Personalizar la serie para agregar puntos visibles en los vértices.
- Para obtener la curva de densidad, basta con aplicar un gráfico de líneas suavizadas sin puntos [8:10].
Con estas tres visualizaciones —histograma, polígono de frecuencia y curva de densidad— tienes las bases para analizar distribuciones y prepararte para trabajar con distribuciones simétricas y asimétricas. Si te surgió alguna duda sobre los intervalos o la configuración en tu hoja de cálculo, compártela en los comentarios.