Distribuciones conjuntas en tablas dinámicas

Curso de Estadística y Probabilidad

Contenido del curso

¿Qué es la estadística y con qué se come?

Una imagen vale más que mil datos

Estadística descriptiva

Representación de datos

Muestra y error

¿Y la probabilidad?

Correlación y causalidad

Conclusiones

26
Qué hacer al terminar estadística y probabilidad
01:17 min

Tomar examen

Distribuciones conjuntas en tablas dinámicas

Resumen

Cuando analizas datos, rara vez una sola variable cuenta toda la historia. Las distribuciones conjuntas te permiten ver cómo se relacionan dos variables al mismo tiempo, y junto con las marginales y condicionales forman la base para sacar conclusiones precisas en estadística descriptiva.

¿Qué es una distribución conjunta y cómo se interpreta?

Una distribución conjunta describe el comportamiento de una variable en relación con otra dentro de una misma tabla bidimensional. Sirve para responder preguntas que cruzan dos dimensiones a la vez.

Imagina que entrevistas a 100 personas que se ejercitan con frecuencia y cruzas dos variables: las horas que duermen y los kilos perdidos en un mes. En esa tabla, una celda te dice por ejemplo que el 17% perdió entre 2 y 4 kilos durmiendo entre 6 y 9 horas [01:00]. Eso es distribución conjunta: el porcentaje cae en la intersección exacta de dos categorías.

¿Para qué sirve una distribución conjunta? Sirve para entender cómo se comportan dos variables juntas. Cada celda de la tabla muestra el porcentaje o frecuencia de los casos que cumplen ambas condiciones a la vez.

¿Cómo leer la distribución marginal en una tabla?

La palabra clave aquí es marginal: piensa en los márgenes de la tabla, es decir, los totales de filas y columnas. Esa última fila y esa última columna concentran la información de una sola variable, ignorando la otra.

Si te enfocas solo en la última fila del ejemplo de los 100 entrevistados, descubres que el 33% perdió entre 4 y 6 kilos, sin importar cuántas horas durmieron [02:14]. Y si miras la columna de totales, ves que el 32% durmió entre 6 y 9 horas, sin importar cuántos kilos bajaron [02:42]. Esa es la utilidad de la marginal: aislar una variable cuando la otra no te interesa.

¿Cuándo usar la distribución condicional?

La distribución condicional entra en juego cuando quieres responder preguntas del tipo dado X, qué pasa con Y. Aquí ya no miras el total general, sino un subconjunto específico.

Vuelve a la tabla. Si te preguntas de las personas que durmieron entre 3 y 6 horas, qué porcentaje perdió entre 2 y 4 kilos, ahora esa fila completa suma 100% y trabajas dentro de ella. En ese grupo, ninguna persona perdió más de 6 kilos [03:30]. Esa es una distribución condicional a filas.

Si giras la pregunta y vas desde los kilos perdidos hacia las horas dormidas, trabajas con condicional a columnas. Por ejemplo, de las personas que perdieron entre 4 y 6 kilos, el 36% durmió entre 9 y 12 horas [04:10].

¿Cuál es la diferencia entre marginal y condicional? La marginal te da el total de una variable ignorando la otra. La condicional te restringe a un subconjunto y calcula porcentajes dentro de ese grupo, no del total general.

¿Cómo armar una distribución conjunta en Sheets o Excel?

La forma más rápida es con una tabla dinámica. En el ejemplo del catálogo de Netflix, el objetivo es comparar por décadas qué país produjo más series o películas.

Los pasos son directos:

Selecciona toda la tabla con Shift + Command/Control + Espacio.
Ve a Insertar, Tabla dinámica y elige la hoja de destino.
Coloca Main country en filas porque tiene más categorías que las décadas.
Coloca Release year en columnas para cruzarlo con el país.
Arrastra el campo de títulos al área de valores para contar frecuencias.

Como Release year viene como año individual, conviene agruparlo. Con clic derecho creas una regla de grupo que vaya desde 1921 hasta 2030 con intervalos de 10 años [05:50]. Así obtienes décadas en lugar de años sueltos.

¿Cómo mostrar los valores como porcentaje?

Por defecto, la tabla dinámica muestra conteos. Para verlo como distribución conjunta en porcentajes, abre el menú de la tabla dinámica, busca Mostrar como y elige Como porcentaje de la suma total. Eso te da la distribución conjunta clásica: cada celda representa su peso sobre el 100% global.

¿Cómo pasar a distribución condicional?

Si quieres responder del total de producciones de Canadá, cuánto se estrenó en cada década, cambia la opción a Porcentaje de la fila. Con ese ajuste, cada fila suma 100% y puedes leer condicionales por país. En el ejemplo, alrededor del 7% de las producciones de Canadá se estrenaron entre 2000 y 2010 [07:50].

El mismo principio aplica al revés: si eliges porcentaje de columna, cada década suma 100% y puedes ver qué países dominaron en cada periodo.

Reto para practicar distribuciones conjuntas

Con el mismo data set del catálogo, arma una tabla dinámica que cruce el rating o clasificación con el género principal. Calcula la distribución conjunta como porcentaje del total y luego cámbiala a porcentaje de fila para leerla como condicional.

¿Qué combinación de género y clasificación te sorprendió más al armar tu tabla? Comparte tu hallazgo en los comentarios.

Paulo Esteban Orsini

Estudiante

En la clase se abordaron las distribuciones conjuntas en estadística descriptiva, que analizan cómo dos variables se relacionan entre sí. Se presentó un ejemplo sobre horas de sueño y kilos perdidos, mostrando cómo construir tablas bidimensionales para visualizar estas relaciones. Se explicó también la distribución marginal, enfocándose en totales de filas o columnas, y la distribución condicional, que permite hacer preguntas específicas sobre una variable en función de otra. Se ofrecieron herramientas prácticas para crear tablas de distribución conjunta en Excel y Sheets.

Distribución marginal

Distribución Marginal: Se refiere a la distribución de una variable específica en una tabla bidimensional, ignorando la otra variable. Es como observar los totales por fila o columna.

Uso en Ejemplo: En el contexto de una encuesta sobre horas de sueño y kilos perdidos, la distribución marginal de los kilos perdidos se obtiene sumando los totales de las filas o columnas de la tabla.

Variantes:
- Distribución Marginal Columnar: Enfocada en las columnas, muestra la distribución de una variable a través de los totales de las columnas.
- Distribución Marginal Filar: Enfocada en las filas, muestra la distribución de una variable a través de los totales de las filas.

Estas son herramientas clave para analizar cómo se distribuyen los datos en relación con una sola variable.

Distribución condicional

Distribución Condicional: Es una forma de analizar cómo se comporta una variable en relación con otra en un conjunto de datos. Se expresa en función de una de las variables, considerando una condición específica.

Ejemplo: En la clase, se menciona que, al observar las horas de sueño, se puede preguntar qué porcentaje de personas que durmieron entre 3 y 6 horas perdieron entre 2 y 4 kilos.

Características:
- Se centra en una variable condicionalmente a otra.
- Permite obtener porcentajes específicos de subgrupos dentro de una tabla conjunta.
Variantes:
- Distribución Marginal: Observa los totales sin considerar la otra variable.
- Distribución Conjunta: Examina la relación total entre ambas variables al mismo tiempo.

Esta estructura ayuda a resumir y visualizar cómo se interrelacionan los datos.

Alisson Pineda

Giocrisrai Godoy Bonillo

Jhins Ledys Cárdenas Pardo

Antonio Demarco Bonino

Andrea Paola García

Gustavo Alonso Aguilar Acuña

Teresa Concepcion Hernandez Demeneghi

Ernie Tapia

Pablo Alejandro Figueroa

Sergio Lezama

Paulina Antonio Santamaria

Hanner Dario Barrera Orozco

Daniela Serrano Cárdenas

Jefferson Vilca

Rubén Navarro Montenegro

David Mateo Sanchez

Luciana Benítez

Juan José Arcila Valderrama

Odaliz Alexandra Mejia Gamarra

EDUARDO EMILIO RAMIREZ ACOSTA

Elias Echeverri

Laura Vanessa Cervantes Leal

Jessica Paola Alfonso Cardenas

Daniel Joseph Sierra Mateus

CESAR PEREZ

Oscar Ortega Cabello

Distribuciones conjuntas en tablas dinámicas

¿Qué es la estadística y con qué se come?

Qué es la estadística y para qué sirve

Variables cuantitativas y cualitativas en estadística

Herramientas clave para análisis de datos

Workbook de Ejercicios de Estadística y Probabilidad

Una imagen vale más que mil datos

Tablas unidimensionales vs bidimensionales en datos

Tablas de Frecuencia y Frecuencia Relativa en Google Sheets

Visualizaciones estadísticas: Diagramas y gráficos básicos en Excel

Estadística descriptiva