No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Convierte tus certificados en títulos universitarios en USA

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

19 Días
8 Hrs
41 Min
3 Seg
Curso de Estadística y Probabilidad

Curso de Estadística y Probabilidad

Ilse Beatriz Zubieta Martínez

Ilse Beatriz Zubieta Martínez

Distribuciones conjuntas

8/26
Recursos

Aportes 117

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

APUNTES
La Distribución conjunta es cómo se comporta una variable en relación a otra. Estas distribuciones son pensadas respecto a otra variable.

Ejemplo:

  • Entrevista a 100 individuos que tienen como hábito hacer ejercicio y se quiere relacionar las horas durmiendo respecto a los kilos perdidos en un mes.

  • En la tabla conjunta bidimensional tenemos estas dos variables.

DISTRIBUCIÓN MARGINAL

Es la distribución que está a los márgenes de nuestra tabla bidimensional.

Independientemente de la otra variable se puede hacer conclusiones específicas de mi variable de columnas o de mi variable de filas.

En el ejemplo:

Podemos observar la distribución marginal sumando los totales de las filas y columnas.

  • Si se quiere enfocar la distribución marginal respecto a los kilos perdidos, solo se necesitaría la última fila de la tabla (total). MARGINAL POR COLUMNAS - Distribución por kilos perdidos.
  • Si se quiere enfocar la distribución marginal respecto a los kilos perdidos, solo se necesitaría la última columna de la tabla (total). MARGINAL POR FILAS - Distribución por horas dormidas.

DISTRIBUCIÓN CONDICIONAL

Dado una variable qué pasa con la otra variable. Se hace preguntas sobre una variable respecto a la otra.

Ejemplo:

Distribución condicional por filas → las filas suman el 100%

  • De las personas que durmieron entre 3-6 horas, cuánto porcentaje perdió entre 2-4 kilos.

Distribución condicional por columnas → las columnas suman el 100%

  • De las personas que perdieron 4-56 kilos, cuánto porcentaje durmió entre 9-12 horas.

Hecho el reto:

TIP para los que estamos en excel. Si queremos que los valores en 0% no se muestren, la forma que encontré fue:

  1. Seleccionar la tabla (puede ser con shift, cntrl, espacio)
  2. Ir a inicio / formato condicional /nueva regla
  3. Aplicar formato a celdas que contenga
  4. elegir valor de la celda , igual a , = 0
  5. formato, fuente, color: blanco


ESTADÍSTICA DESCRIPTIVA:

  • Distribuciones conjuntas: cómo se comporta una variable en relación a otra. Como muestra el ejemplo, se puede tener en una tabla bidimensional la distribución conjunta entre las horas que duermen contra los kilos perdidos.

  • DISTRIBUCIÓN MARGINAL: se puede definir como la distribución que está a los márgenes de una tabla bidimensional, se puede observar la distribución marginal sumando tanto los totales de las filas como los de las columnas. Depende de esto, se puede calcular la distribución columnar y por filas. ¿Para qué sirve? Indendientemente de la otra variable, se pueden sacar conclusiones de la variable columnar o por filas.

  • ¿Dado una variable qué sucede con la otra?
    DISTRIBUCIÓN CONDICIONAL: nos hacemos preguntas de una variable en relación con la segunda: relación entre dos variables.

Ejercicio

MIS APUNTES
La distribución conjunta se refiere a la distribución de probabilidad conjunta de dos o más variables aleatorias, proporcionando información sobre cómo se relacionan y combinan. La distribución marginal se obtiene al sumar o integrar la distribución conjunta sobre las variables restantes, y representa la distribución de probabilidad de una variable aleatoria considerada de forma aislada. Por último, la distribución condicional se refiere a la distribución de probabilidad de una variable aleatoria dado un conjunto de información o una condición específica, y es útil para analizar cómo una variable se comporta o cambia en función de otra. Estas distribuciones son fundamentales para comprender el comportamiento conjunto e individual de las variables aleatorias y realizar análisis estadísticos más completos.

Esta es mi tabla

La distribución marginal es la forma en que esa variable se distribuye individualmente, por sí misma, sin considerar otras variables.

Imagina que estás estudiando la altura y el peso de un grupo de personas. La distribución marginal de la altura mostraría cómo se distribuyen las alturas sin tener en cuenta el peso.

La distribución condicional se centra en la distribución de una variable mientras se mantiene fija o se considera una restricción en otra variable.

Siguiendo con el ejemplo anterior, sería estudiar la distribución condicional del peso dado un rango específico de alturas.

Para los que están confundidos con la distribución condicional, aquí les explico a mi manera lo que está pasando. Cuando vemos la distribución condicional nos pueden parecer confusos los porcentajes, pero solo es cosa de entender qué representan. En la distribución condicional básicamente se hace una regla de 3 con los porcentajes de la distribución marginal y los otros datos de la tabla. Por ejemplo, de nuestro total, el 19% durmió de 3 a 6 horas. Entonces, si queremos la distribución condicional en, por ejemplo, de 2 a 4 kilos perdidos, hacemos esta regla de 3: 19% es a 100% como 6% es a X -> 19/6 = 100/X En este caso da ~31,57894%, que se aproxima a 32%, y por eso en la tabla de distribución aparece ahí un 32%. El proceso se repite para el resto de la distribución marginal y el resto de datos en la tabla. Lo mismo para la distribución condicional por filas, pero con la distribución marginal de las filas. Espero que sea útil ;)
* La distribución conjunta describe la probabilidad de dos eventos ocurriendo simultáneamente. * Las distribuciones marginales describen las probabilidades de un evento sin tener en cuenta el otro. * Las distribuciones condicionales describen las probabilidades de un evento dado que otro evento ha ocurrido.
Aquí mi aporte del reto de distribuciones conjuntas: ![](https://static.platzi.com/media/user_upload/image-285a03e9-7bf4-4037-94de-262346c70f7b.jpg)
Mi apunte: ![](https://static.platzi.com/media/user_upload/image-46745a77-8d68-4712-bc4a-447ab7825f66.jpg)

RETO
Con nuestro dataset de Netflix, encuentra la distribución conjunta ente el rating/clasificación de edad y el género principal

DISTRIBUCIÓN CONDICIONAL POR FILAS

Quiero saber qué porcentaje de restricción de edad obtuvo el contenido romántico.

Resultados:

Respecto a películas románticas (Romantic Movies)

  • TV-14 (Mayores de 14 años) representa un 33.33% del contenido al igual que TV-G (Público general) y TV-MA (Mayores de 17 años).

Respecto a series romanticas (Romantic TV Shows)

  • TV-14 (Mayores de 14 años) representa el 56,25%, TV-MA (Mayores de 17 años) el 37,50% y finalmente TV-PG Público general) representa el 6,25%

DISTRIBUCIÓN CONDICIONAL POR COLUMNAS

Quiero saber el contenido que sugiere supervisión parental (PG)

Resultados:

Los contenido que sugieren supervisión parental son:

  • Peliculas familiares y para niños (Children & Family Movies) representando un 62,37%,
  • Acción y aventura (Action & Adventure) representando un 11,15%
  • Dramas con un 10,80%
  • Comedia con un 6,27%
  • Documentales representando un 5.92%
  • Peliculas clásicas con un 1,74%
  • Relacionado a anime 1,39%
  • Y finalmente, peliculas de culto con un 0,35%.

A continuación la solución del reto

![](https://static.platzi.com/media/user_upload/image-0a25fc03-ecb9-44f7-95e8-7bb05b08829a.jpg)
![](https://static.platzi.com/media/user_upload/image-f36e4717-1f4b-48df-9f2b-4b7b3fb9f271.jpg)
![](https://static.platzi.com/media/user_upload/image-64d17c46-3a97-419b-881b-717fccd242b2.jpg)
![](https://static.platzi.com/media/user_upload/image-0adec260-3d36-46ac-9fe5-05bb22ff6355.jpg)
Las distribuciones conjuntas relacionan dos variables. Por ejemplo, al estudiar la relación entre horas de estudio y calificaciones, podrías observar cuántos estudiantes obtuvieron ciertas calificaciones con diferentes horas de estudio. Un ejemplo de distribución marginal sería analizar únicamente las calificaciones totales de los estudiantes, ignorando las horas de estudio. Esto te ayudaría a ver la tendencia general en las calificaciones sin considerar la variable de estudio. Otro ejemplo de distribución conjunta podría ser el análisis del consumo de calorías y el tiempo de ejercicio, donde se observaría cómo se relacionan ambas variables en un grupo de personas. La distribución marginal, en este caso, te mostraría el total de consumo de calorías o el total de tiempo de ejercicio por separado.
![]()![](https://static.platzi.com/media/user_upload/image-96a59882-52c6-4a04-98ce-cd91a31d0571.jpg)![]()![](https://static.platzi.com/media/user_upload/image-d0121996-85fd-4c2d-a5e7-acc59ca23c71.jpg)
![](https://static.platzi.com/media/user_upload/image-d8820176-ae3b-477e-8868-4f7f47ffe461.jpg)
![](https://static.platzi.com/media/user_upload/image-ec6abc0a-1c77-4a1b-8477-a7baab53bfbd.jpg)
comparto mi reto ![](https://static.platzi.com/media/user_upload/image-9376adae-3d4d-42a0-9236-26f383f7ceae.jpg)
💚
Reto: ![](https://static.platzi.com/media/user_upload/image-ceffa2f7-a181-4f25-99a7-271d154960f7.jpg)
Buen dia para todos No se si realmente entendí el ejercicio en su totalidad, pero muestro lo que realice ![](https://static.platzi.com/media/user_upload/image-2ee434f6-59c1-4238-890d-01ae5dc1bbc9.jpg) ![](https://static.platzi.com/media/user_upload/image-5118a865-a70c-466b-9182-13c01bcd4dab.jpg)
![](https://static.platzi.com/media/user_upload/image-97de7934-754d-429a-80f6-8cb6a08cb0c9.jpg)
Recordemos que la razón por la que las décadas se ubicaron en las columnas es porque son menos datos en esta variable que en la de países, como son más países que décadas, los organizamos en filas y visualmente se verá más organizado. Títulos se ubica en valores porque según las variables, son los títulos los que pertenecen a un país y década. ![](https://static.platzi.com/media/user_upload/image-8460ff11-6364-4547-b180-1a5d074f02bd.jpg)
Respuesta al reto de clase ![](https://static.platzi.com/media/user_upload/image-9c43910e-4334-40ee-9e6d-e2b449057cc3.jpg)
Reto listo ![](https://static.platzi.com/media/user_upload/image-e61239e7-b050-4d97-a586-6f1057ad7771.jpg)
Creo que una buena definición para distribución marginal es esta: "La distribución marginal es un concepto en estadística que se utiliza para entender la distribución de una sola variable dentro de una distribución conjunta de dos o más variables."
El 31.04% de los títulos de Drama están dirigidos a la Audiencia R (menores de 17 años).
![](https://static.platzi.com/media/user_upload/image-183d5188-8000-48e1-aace-6e66f073ce24.jpg)
![](https://static.platzi.com/media/user_upload/image-4de1942e-068e-41ef-bc5d-73c87b95738e.jpg) Asi quedo mi ejercicio
Hola, Como puedo solucionar problemas de cantidad de datos, es decir cuando se supera la cantidad de filas en google? en mi trabajo creamos diversas audicencias con un conjunto de zipcodes y necesitamos ver que zipcodes se han usado en las diferentes audiencias y cuales zipcode se usan más.
gracias
![]()![](https://static.platzi.com/media/user_upload/image-7f130ba6-dcff-47a3-90e9-41fd7d7eeb26.jpg)![]()
Gracias
Aqui realicé el top 10 del ejercicio de netflix, aplicando formato condicional. ![](https://static.platzi.com/media/user_upload/image-77bbcf1e-0368-4f0d-bd34-e487de324e80.jpg)
![]()![]()![](https://static.platzi.com/media/user_upload/image-d5263476-9716-45f1-8fa4-659d93c784fc.jpg)
![](https://static.platzi.com/media/user_upload/image-823f1553-07ed-4206-a52e-70128a0ae755.jpg)
RETO ![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202024-03-31%20a%20las%2016.42.31-f811afd8-2509-45e7-812f-bcafd1c071c6.jpg)
Distribución conjunta, con formato condicional :) ![](https://static.platzi.com/media/user_upload/image-06da0e0c-6729-4171-89f9-35f76ec23d0f.jpg)
![](https://static.platzi.com/media/user_upload/image-da66fa52-ffba-4aa9-9a78-aa666ac1ac08.jpg)
![]()![](https://static.platzi.com/media/user_upload/image-bebc6b6b-d30c-40cc-9946-345d6f34d0c8.jpg)

Este reto fue muy interesante en el desarrollo del curso. Aui esta mi parte que desarrolle con respecto al reto:
Distribucion normal:
![](

Distribucion conjunta por filas:
![](

Distribucion conjunta por columnas:
![](

![]()![](https://static.platzi.com/media/user_upload/image-ca9374fb-f16f-4c35-a510-dc10dc85834d.jpg)
![](https://static.platzi.com/media/user_upload/DistribucionConjuntaEjc-d2a2a4ee-1210-46f6-a099-b1f450a3b25d.jpg)
* **Distribución conjunta:** Se refiere a la distribución de probabilidad de dos o más variables aleatorias en conjunto. Describe cómo se relacionan entre sí dos o más variables y proporciona información sobre la probabilidad de que ocurran diferentes combinaciones de valores para esas variables. Se representa comúnmente mediante una tabla o una función de densidad de probabilidad conjunta. * **Distribución marginal:** Se obtiene a partir de la distribución conjunta al sumar o integrar las probabilidades de todas las combinaciones posibles de valores de una o más variables, dejando de lado las otras variables. Es decir, muestra la distribución de probabilidad de una variable en particular sin considerar las demás. Se obtiene sumando las filas o columnas de una tabla de distribución conjunta. * **Distribución condicional:** Se refiere a la distribución de probabilidad de una variable aleatoria dada ciertos valores de otra variable. Describe cómo se distribuye una variable cuando se conoce información específica sobre otra variable. Se calcula dividiendo la probabilidad conjunta de las dos variables por la probabilidad marginal de la variable condicionante.
Estas son las instrucciones del ejemplo que se hizo en clase: **<u>Comparar por décadas, qué país fue el mayor productor de series o películas en el catálogo de Netflix</u>** De aquí podemos identificar que en las **columnas** tenemos a los países y en las **filas** a los años agrupados por décadas; por último, nuestros **valores** provienen de cada película.
![](https://static.platzi.com/media/user_upload/Screenshot%20%28364%29-e974396f-a19d-47d8-90ff-8d5c50bfb31a.jpg)
![](https://static.platzi.com/media/user_upload/image-d40cf3b2-0259-4575-b8ca-e3614ee8ccc2.jpg)
El reto: ![](https://static.platzi.com/media/user_upload/image-1753168f-8b17-49b5-a9df-3a2401491eac.jpg)![](https://static.platzi.com/media/user_upload/image-96036f2b-5adf-4d1d-8cc6-e5c2ad4ba458.jpg)

Sumo mi aporte

Reto asignado realizado en excel: Siempre hay cosas nuevas para aprender, en este caso, la configuración de los datos en 0% que no muestre ningun dato fue parte de mi aprendizaje practico en excel. ![](https://static.platzi.com/media/user_upload/image-4b3cdd56-e9c7-4a67-a5be-ee62ae5afe33.jpg)
![]()reto cumplido ![](https://static.platzi.com/media/user_upload/reto%201-47d96e84-e9a0-4d3b-b523-e9c696e52788.jpg)
![](https://static.platzi.com/media/user_upload/image-9105c223-44e7-4ba1-811f-9d757c320f29.jpg)
Sumo mi aporte al reto.![](https://static.platzi.com/media/user_upload/image-40968c6a-cf00-424b-ade4-b6bbb0fde288.jpg)
![](https://static.platzi.com/media/user_upload/image-e0e3c20d-849f-4023-bfb9-ac2a1cfbe0b3.jpg)
Reto realizado ![](https://static.platzi.com/media/user_upload/image-dcf3c5ff-987f-437d-8225-15b1538eb3c8.jpg)
Resultado del reto: ![](https://static.platzi.com/media/user_upload/image-956827ab-a00c-4691-8a6e-e94dcc89cc65.jpg)
![](https://static.platzi.com/media/user_upload/image-b9aa65de-2782-413a-9e57-8a35d890b315.jpg)
**Mis apuntes:** **Distribuciones conjuntas** Como se comporta una variable en relacion a otra. **Distribucion marginal** Es la distribucion que esta a los margenes de nuestra tablabidmensional. Independientemente de la otra variable puedo hacer conclusions, tomando en cuenta mi variable columnar o de filas. **Distribucion condicional:** preguntas respecto a una variable en relacion con la Segunda. O sea relacion entre dos variables.
Algo así va pero mostrando los porcentages del total. ![](https://static.platzi.com/media/user_upload/Distribuci%C3%B3n%20conjunta-2ce098fb-f20c-44d1-b30d-38cc143282ad.jpg)
Hecho ![](https://static.platzi.com/media/user_upload/image-eb9747f4-6a75-46e9-b535-5ba2a3b53394.jpg)
![](https://static.platzi.com/media/user_upload/image-110a363d-0b9e-45a1-89e8-9e36ec641629.jpg) El Reto con, colorcitos. Hasta ahora todo esta muy interesante

Mi reto:

Reto Aceptado: Se puede observar que un **36,5%** las peliculas y series van dirigidas para mayores de edad y un **24,5%** son para personas mayores de 14 años; lo cual representa más del **60%** de todos los títulos en Netflix. ![](https://static.platzi.com/media/user_upload/image-7c08fc78-d280-4969-bc5a-92abc0a16d9d.jpg)
Aquí muestro la solución al reto: ![](https://static.platzi.com/media/user_upload/image-2f85cf18-376f-4cb9-b9e4-ab77dc93ce52.jpg) ![](https://static.platzi.com/media/user_upload/image-29d2313f-e16d-484c-a607-f6f95cc78c0f.jpg)
![](https://static.platzi.com/media/user_upload/image-7178935c-aaad-4e82-b328-a23cb9459360.jpg) El 36,41% de los titulos entre los diferentes generos son tipo TV-MA.
![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202023-10-12%20152716-11888370-e3ad-4af7-bcf2-3246dd1c00b7.jpg) Cual es el porcentaje de películas (movies) clasificadas como TV-MA? la respuesta sería un 22.81%

DISTRIBICCIÓN CONJUNTA

Distribución conjunta

Horrible mi tabla.

¿Alguien sabe porque al darle clic derecho a la tabla dinamica no me sale la opcion para crear las reglas de agrupacion? Cuando ella convierte los años a decadas. No me sale esa funcion en Google Spreadsheets.
Distribución conjunta![](https://static.platzi.com/media/user_upload/Screenshot_20230929_123135-f8741cdd-3729-4a08-bd84-84aa360ecc14.jpg)
![](https://static.platzi.com/media/user_upload/Captura-43531283-f716-4318-88ff-1d5f43d31268.jpg)
![](https://static.platzi.com/media/user_upload/iii-7356e753-3e9a-4977-b3d7-e71c8ab1ce2b.jpg)

En mi caso para no tener que seleccionar toda la tabla de datos de Netflix, solo me voy a la hoja en la que directamente quiero trabajar, insertar -> tabla dinámica y en el rango de datos selecciono el de Netflix

Distribución conjunta de la clasificación de edad y el género principal:

Distribución marginal por filas:

Distribución marginal columnar:

Genial, de esta distribución conjunta podemos decir, como ejemplo, que del genero drama, con un porcentaje importante de un 38.5% pertenecen a la clasificación TV-MA

Reto!

Mi aporte

Distribución conjunta y distribución marginal

Distribución condicional por filas

Distribución condicional por columnas


Las distribuciones conjuntas involucran el estudio de cómo se comportan dos o más variables en conjunto. Esto incluye analizar sus relaciones y cómo cambian una en relación a la otra. Las distribuciones marginales permiten observar la distribución de una variable a lo largo de una columna o fila en una tabla de frecuencias. Por otro lado, las distribuciones condicionales brindan información sobre la probabilidad de que ocurra una variable bajo ciertas condiciones de otra variable.

me gustaria que se hicieran mas quices en este curso , ayudaria a mas retroalimentacion

Así quedó mi tabla

Reto de la clase:
Distribucion conjunta entre rating y genero principal.