Contenido del curso
Una imagen vale más que mil datos
Estadística descriptiva
- 8

Distribuciones conjuntas en tablas dinámicas
Viendo ahora - 9

Medidas de Tendencia Central: Media, Mediana y Moda
13:49 min - 10

Media, mediana y moda en Excel con videojuegos
05:20 min - 11

Rango e índice intercuartílico en Excel
12:07 min - 12

Desplazamiento y escala en tus datos
08:31 min - 13

Cómo construir un boxplot paso a paso
06:47 min
Representación de datos
Muestra y error
¿Y la probabilidad?
- 19

Probabilidad simple vs experimental con dados y cartas
07:27 min - 20

Regla de la Suma en Probabilidad: Unión e Intersección de Eventos
10:45 min - 21

Eventos dependientes e independientes en probabilidad
06:29 min - 22

Teorema de Bayes con dados y fórmula
13:28 min - 23

Permutación vs combinación con cartas
03:19 min
Correlación y causalidad
Conclusiones
Distribuciones conjuntas en tablas dinámicas
Resumen
Cuando analizas datos, rara vez una sola variable cuenta toda la historia. Las distribuciones conjuntas te permiten ver cómo se relacionan dos variables al mismo tiempo, y junto con las marginales y condicionales forman la base para sacar conclusiones precisas en estadística descriptiva.
¿Qué es una distribución conjunta y cómo se interpreta?
Una distribución conjunta describe el comportamiento de una variable en relación con otra dentro de una misma tabla bidimensional. Sirve para responder preguntas que cruzan dos dimensiones a la vez.
Imagina que entrevistas a 100 personas que se ejercitan con frecuencia y cruzas dos variables: las horas que duermen y los kilos perdidos en un mes. En esa tabla, una celda te dice por ejemplo que el 17% perdió entre 2 y 4 kilos durmiendo entre 6 y 9 horas [01:00]. Eso es distribución conjunta: el porcentaje cae en la intersección exacta de dos categorías.
¿Para qué sirve una distribución conjunta? Sirve para entender cómo se comportan dos variables juntas. Cada celda de la tabla muestra el porcentaje o frecuencia de los casos que cumplen ambas condiciones a la vez.
¿Cómo leer la distribución marginal en una tabla?
La palabra clave aquí es marginal: piensa en los márgenes de la tabla, es decir, los totales de filas y columnas. Esa última fila y esa última columna concentran la información de una sola variable, ignorando la otra.
Si te enfocas solo en la última fila del ejemplo de los 100 entrevistados, descubres que el 33% perdió entre 4 y 6 kilos, sin importar cuántas horas durmieron [02:14]. Y si miras la columna de totales, ves que el 32% durmió entre 6 y 9 horas, sin importar cuántos kilos bajaron [02:42]. Esa es la utilidad de la marginal: aislar una variable cuando la otra no te interesa.
¿Cuándo usar la distribución condicional?
La distribución condicional entra en juego cuando quieres responder preguntas del tipo dado X, qué pasa con Y. Aquí ya no miras el total general, sino un subconjunto específico.
Vuelve a la tabla. Si te preguntas de las personas que durmieron entre 3 y 6 horas, qué porcentaje perdió entre 2 y 4 kilos, ahora esa fila completa suma 100% y trabajas dentro de ella. En ese grupo, ninguna persona perdió más de 6 kilos [03:30]. Esa es una distribución condicional a filas.
Si giras la pregunta y vas desde los kilos perdidos hacia las horas dormidas, trabajas con condicional a columnas. Por ejemplo, de las personas que perdieron entre 4 y 6 kilos, el 36% durmió entre 9 y 12 horas [04:10].
¿Cuál es la diferencia entre marginal y condicional? La marginal te da el total de una variable ignorando la otra. La condicional te restringe a un subconjunto y calcula porcentajes dentro de ese grupo, no del total general.
¿Cómo armar una distribución conjunta en Sheets o Excel?
La forma más rápida es con una tabla dinámica. En el ejemplo del catálogo de Netflix, el objetivo es comparar por décadas qué país produjo más series o películas.
Los pasos son directos:
- Selecciona toda la tabla con Shift + Command/Control + Espacio.
- Ve a Insertar, Tabla dinámica y elige la hoja de destino.
- Coloca Main country en filas porque tiene más categorías que las décadas.
- Coloca Release year en columnas para cruzarlo con el país.
- Arrastra el campo de títulos al área de valores para contar frecuencias.
Como Release year viene como año individual, conviene agruparlo. Con clic derecho creas una regla de grupo que vaya desde 1921 hasta 2030 con intervalos de 10 años [05:50]. Así obtienes décadas en lugar de años sueltos.
¿Cómo mostrar los valores como porcentaje?
Por defecto, la tabla dinámica muestra conteos. Para verlo como distribución conjunta en porcentajes, abre el menú de la tabla dinámica, busca Mostrar como y elige Como porcentaje de la suma total. Eso te da la distribución conjunta clásica: cada celda representa su peso sobre el 100% global.
¿Cómo pasar a distribución condicional?
Si quieres responder del total de producciones de Canadá, cuánto se estrenó en cada década, cambia la opción a Porcentaje de la fila. Con ese ajuste, cada fila suma 100% y puedes leer condicionales por país. En el ejemplo, alrededor del 7% de las producciones de Canadá se estrenaron entre 2000 y 2010 [07:50].
El mismo principio aplica al revés: si eliges porcentaje de columna, cada década suma 100% y puedes ver qué países dominaron en cada periodo.
Reto para practicar distribuciones conjuntas
Con el mismo data set del catálogo, arma una tabla dinámica que cruce el rating o clasificación con el género principal. Calcula la distribución conjunta como porcentaje del total y luego cámbiala a porcentaje de fila para leerla como condicional.
¿Qué combinación de género y clasificación te sorprendió más al armar tu tabla? Comparte tu hallazgo en los comentarios.