Contenido del curso

Cómo construir un boxplot paso a paso

Resumen

El boxplot es una herramienta visual que te muestra cómo se distribuye el 50% central de tus datos y hacia qué lado se inclinan. Si ya manejas medidas de tendencia central y dispersión, este gráfico te ayudará a leer la forma de tu distribución de un vistazo, algo clave para cualquier análisis estadístico.

¿Qué es un boxplot y para qué sirve en estadística?

Un boxplot es una caja compuesta por dos rectángulos unidos que representa visualmente cómo se organizan tus datos alrededor de la mediana. Te permite identificar el rango donde vive el 50% central de tus valores y detectar si tu distribución está sesgada hacia un lado.

La caja se construye sobre una línea que une el valor mínimo y el máximo. Dentro de esa línea, los rectángulos marcan el primer cuartil, la mediana y el tercer cuartil. Así puedes ver en qué tramo se concentran más tus datos.

¿Qué representa la caja del boxplot? Representa el 50% central de tus datos, delimitado por el primer cuartil (Q1) y el tercer cuartil (Q3), con la mediana dividiendo la caja por dentro.

¿Cómo se obtiene el resumen de cinco números?

Para construir un boxplot necesitas el resumen de cinco números: mínimo, primer cuartil, mediana, tercer cuartil y máximo. Recuerda que la mediana es el segundo cuartil [1:30].

El proceso es directo si tienes tus datos ordenados de forma ascendente:

  • Identifica el mínimo y el máximo en los extremos.
  • Calcula la mediana usando la fórmula posición n+1 entre 2 cuando n es impar.
  • Encuentra Q1 como la mediana de la mitad inferior.
  • Encuentra Q3 como la mediana de la mitad superior.

¿Cómo aplicar la fórmula con un ejemplo real?

Tomemos las 21 puntuaciones ordenadas que vienen de clases anteriores [2:00]. Como 21 es impar, la mediana se ubica en la posición (21+1)/2 = 11. Al contar hasta esa posición, el valor mediano es 67.

Los extremos son fáciles de localizar: el mínimo es 60 y el máximo es 77. Con estos tres valores ya puedes adelantar cómo se verá tu gráfico: una línea de 60 a 77 con una marca interna en 67.

¿Cómo calcular el primer y el tercer cuartil?

Los cuartiles funcionan como la mediana de la mediana [3:30]. Para Q1, tomas la mitad inferior de tus datos (las primeras 11 posiciones) y aplicas de nuevo la fórmula: (11+1)/2 = 6. La posición 6 te da el valor 66.

Para Q3 haces lo mismo con la mitad superior y obtienes el valor 73 en la posición 6 de ese nuevo rango.

¿Q1 siempre está cerca de la mediana? No necesariamente. En este ejemplo Q1=66 está pegado a la mediana 67, pero Q3=73 queda más alejado, lo que indica que los datos del lado superior están más dispersos.

¿Cómo interpretar la forma final del boxplot?

Con los cinco números listos puedes dibujar la caja desde 66 hasta 73, con una línea interna en 67 que la divide en dos partes desiguales. Esa asimetría te dice mucho sobre tus datos.

En este caso, la parte superior de la caja (de 67 a 73) tiene una amplitud mayor que la parte inferior (de 66 a 67). Eso significa que los valores entre la mediana y Q3 están más esparcidos, mientras que los valores entre Q1 y la mediana están muy apretados.

¿Qué te dice la asimetría de la caja sobre la distribución?

Cuando una mitad de la caja es más amplia que la otra, tu distribución está sesgada hacia ese lado. Aquí, la mayoría de los valores se concentran entre el segundo y el tercer cuartil, lo que sugiere que los datos del rango inferior son más homogéneos.

Leer un boxplot con este detalle te permite anticipar cosas como:

  • Si hay outliers potenciales fuera de los bigotes.
  • Hacia qué dirección se arrastra la distribución.
  • Qué tan compacto está el 50% central comparado con los extremos.

Ahora te toca a ti: construye tu propio boxplot con estos cinco números y déjalo en los comentarios. ¿Qué dudas te surgieron al calcular los cuartiles?