驴Qu茅 es la estad铆stica y con qu茅 se come?

1

Estad铆stica, 驴qu茅 es y por qu茅 aprenderla?

2

Conceptos clave de estad铆stica

3

Software estad铆stico

4

Workbook de ejercicios para practicar

Quiz: 驴Qu茅 es la estad铆stica y con qu茅 se come?

Una imagen vale m谩s que mil datos

5

Tablas unidimensionales y bidimensionales

6

驴Qu茅 es la frecuencia estad铆stica y con qu茅 se come?

7

驴Cu谩l es la mejor visualizaci贸n para mis datos?

Quiz: Una imagen vale m谩s que mil datos

Estad铆stica descriptiva

8

Distribuciones conjuntas

9

Medidas de tendencia central: media, mediana y moda

10

C谩lculo de media, mediana y moda en hojas de c谩lculo

11

Medidas de dispersi贸n: rango e IQR

12

Desplazamiento y escala de valores

13

Box plots y el resumen de 5 n煤meros

Quiz: Estad铆stica descriptiva

Representaci贸n de datos

14

Media, varianza y desviaci贸n est谩ndar

15

Histogramas, pol铆gonos de frecuencia y curvas de densidad

16

Distribuciones sim茅tricas y asim茅tricas

Quiz: Representaci贸n de datos

Muestra y error

17

M茅todos de recopilaci贸n de datos

18

Muestreo y sesgo

驴Y la probabilidad?

19

驴Qu茅 es la probabilidad y c贸mo se relaciona con la estad铆stica?

20

Regla de la suma, uni贸n e intersecci贸n

21

Probabilidad condicional y eventos dependientes e independientes

22

Teorema de Bayes

23

Combinaciones y permutaciones

Quiz: 驴Y la probabilidad?

Correlaci贸n y causalidad

24

驴Correlaci贸n o causalidad?

25

Gr谩ficos de dispersi贸n e introducci贸n a la regresi贸n

Quiz: Correlaci贸n y causalidad

Conclusiones

26

驴Qu茅 aprender con tus nuevos poderes?

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Curso de Estad铆stica y Probabilidad

Curso de Estad铆stica y Probabilidad

Ilse Beatriz Zubieta Mart铆nez

Ilse Beatriz Zubieta Mart铆nez

Distribuciones conjuntas

8/26
Recursos

Aportes 91

Preguntas 4

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

APUNTES
La Distribuci贸n conjunta es c贸mo se comporta una variable en relaci贸n a otra. Estas distribuciones son pensadas respecto a otra variable.

Ejemplo:

  • Entrevista a 100 individuos que tienen como h谩bito hacer ejercicio y se quiere relacionar las horas durmiendo respecto a los kilos perdidos en un mes.

  • En la tabla conjunta bidimensional tenemos estas dos variables.

DISTRIBUCI脫N MARGINAL

Es la distribuci贸n que est谩 a los m谩rgenes de nuestra tabla bidimensional.

Independientemente de la otra variable se puede hacer conclusiones espec铆ficas de mi variable de columnas o de mi variable de filas.

En el ejemplo:

Podemos observar la distribuci贸n marginal sumando los totales de las filas y columnas.

  • Si se quiere enfocar la distribuci贸n marginal respecto a los kilos perdidos, solo se necesitar铆a la 煤ltima fila de la tabla (total). MARGINAL POR COLUMNAS - Distribuci贸n por kilos perdidos.
  • Si se quiere enfocar la distribuci贸n marginal respecto a los kilos perdidos, solo se necesitar铆a la 煤ltima columna de la tabla (total). MARGINAL POR FILAS - Distribuci贸n por horas dormidas.

DISTRIBUCI脫N CONDICIONAL

Dado una variable qu茅 pasa con la otra variable. Se hace preguntas sobre una variable respecto a la otra.

Ejemplo:

Distribuci贸n condicional por filas 鈫 las filas suman el 100%

  • De las personas que durmieron entre 3-6 horas, cu谩nto porcentaje perdi贸 entre 2-4 kilos.

Distribuci贸n condicional por columnas 鈫 las columnas suman el 100%

  • De las personas que perdieron 4-56 kilos, cu谩nto porcentaje durmi贸 entre 9-12 horas.

Hecho el reto:

TIP para los que estamos en excel. Si queremos que los valores en 0% no se muestren, la forma que encontr茅 fue:

  1. Seleccionar la tabla (puede ser con shift, cntrl, espacio)
  2. Ir a inicio / formato condicional /nueva regla
  3. Aplicar formato a celdas que contenga
  4. elegir valor de la celda , igual a , = 0
  5. formato, fuente, color: blanco


Ejercicio

ESTAD脥STICA DESCRIPTIVA:

  • Distribuciones conjuntas: c贸mo se comporta una variable en relaci贸n a otra. Como muestra el ejemplo, se puede tener en una tabla bidimensional la distribuci贸n conjunta entre las horas que duermen contra los kilos perdidos.

  • DISTRIBUCI脫N MARGINAL: se puede definir como la distribuci贸n que est谩 a los m谩rgenes de una tabla bidimensional, se puede observar la distribuci贸n marginal sumando tanto los totales de las filas como los de las columnas. Depende de esto, se puede calcular la distribuci贸n columnar y por filas. 驴Para qu茅 sirve? Indendientemente de la otra variable, se pueden sacar conclusiones de la variable columnar o por filas.

  • 驴Dado una variable qu茅 sucede con la otra?
    DISTRIBUCI脫N CONDICIONAL: nos hacemos preguntas de una variable en relaci贸n con la segunda: relaci贸n entre dos variables.

Esta es mi tabla

Para los que est谩n confundidos con la distribuci贸n condicional, aqu铆 les explico a mi manera lo que est谩 pasando. Cuando vemos la distribuci贸n condicional nos pueden parecer confusos los porcentajes, pero solo es cosa de entender qu茅 representan. En la distribuci贸n condicional b谩sicamente se hace una regla de 3 con los porcentajes de la distribuci贸n marginal y los otros datos de la tabla. Por ejemplo, de nuestro total, el 19% durmi贸 de 3 a 6 horas. Entonces, si queremos la distribuci贸n condicional en, por ejemplo, de 2 a 4 kilos perdidos, hacemos esta regla de 3: 19% es a 100% como 6% es a X -> 19/6 = 100/X En este caso da ~31,57894%, que se aproxima a 32%, y por eso en la tabla de distribuci贸n aparece ah铆 un 32%. El proceso se repite para el resto de la distribuci贸n marginal y el resto de datos en la tabla. Lo mismo para la distribuci贸n condicional por filas, pero con la distribuci贸n marginal de las filas. Espero que sea 煤til ;)

RETO
Con nuestro dataset de Netflix, encuentra la distribuci贸n conjunta ente el rating/clasificaci贸n de edad y el g茅nero principal

DISTRIBUCI脫N CONDICIONAL POR FILAS

Quiero saber qu茅 porcentaje de restricci贸n de edad obtuvo el contenido rom谩ntico.

Resultados:

Respecto a pel铆culas rom谩nticas (Romantic Movies)

  • TV-14 (Mayores de 14 a帽os) representa un 33.33% del contenido al igual que TV-G (P煤blico general) y TV-MA (Mayores de 17 a帽os).

Respecto a series romanticas (Romantic TV Shows)

  • TV-14 (Mayores de 14 a帽os) representa el 56,25%, TV-MA (Mayores de 17 a帽os) el 37,50% y finalmente TV-PG P煤blico general) representa el 6,25%

DISTRIBUCI脫N CONDICIONAL POR COLUMNAS

Quiero saber el contenido que sugiere supervisi贸n parental (PG)

Resultados:

Los contenido que sugieren supervisi贸n parental son:

  • Peliculas familiares y para ni帽os (Children & Family Movies) representando un 62,37%,
  • Acci贸n y aventura (Action & Adventure) representando un 11,15%
  • Dramas con un 10,80%
  • Comedia con un 6,27%
  • Documentales representando un 5.92%
  • Peliculas cl谩sicas con un 1,74%
  • Relacionado a anime 1,39%
  • Y finalmente, peliculas de culto con un 0,35%.

A continuaci贸n la soluci贸n del reto

La distribuci贸n marginal es la forma en que esa variable se distribuye individualmente, por s铆 misma, sin considerar otras variables.

Imagina que est谩s estudiando la altura y el peso de un grupo de personas. La distribuci贸n marginal de la altura mostrar铆a c贸mo se distribuyen las alturas sin tener en cuenta el peso.

La distribuci贸n condicional se centra en la distribuci贸n de una variable mientras se mantiene fija o se considera una restricci贸n en otra variable.

Siguiendo con el ejemplo anterior, ser铆a estudiar la distribuci贸n condicional del peso dado un rango espec铆fico de alturas.

MIS APUNTES
La distribuci贸n conjunta se refiere a la distribuci贸n de probabilidad conjunta de dos o m谩s variables aleatorias, proporcionando informaci贸n sobre c贸mo se relacionan y combinan. La distribuci贸n marginal se obtiene al sumar o integrar la distribuci贸n conjunta sobre las variables restantes, y representa la distribuci贸n de probabilidad de una variable aleatoria considerada de forma aislada. Por 煤ltimo, la distribuci贸n condicional se refiere a la distribuci贸n de probabilidad de una variable aleatoria dado un conjunto de informaci贸n o una condici贸n espec铆fica, y es 煤til para analizar c贸mo una variable se comporta o cambia en funci贸n de otra. Estas distribuciones son fundamentales para comprender el comportamiento conjunto e individual de las variables aleatorias y realizar an谩lisis estad铆sticos m谩s completos.

Aqui realic茅 el top 10 del ejercicio de netflix, aplicando formato condicional. ![](https://static.platzi.com/media/user_upload/image-77bbcf1e-0368-4f0d-bd34-e487de324e80.jpg)
![]()![]()![](https://static.platzi.com/media/user_upload/image-d5263476-9716-45f1-8fa4-659d93c784fc.jpg)
* La distribuci贸n conjunta describe la probabilidad de dos eventos ocurriendo simult谩neamente. * Las distribuciones marginales describen las probabilidades de un evento sin tener en cuenta el otro. * Las distribuciones condicionales describen las probabilidades de un evento dado que otro evento ha ocurrido.
![](https://static.platzi.com/media/user_upload/image-823f1553-07ed-4206-a52e-70128a0ae755.jpg)
RETO ![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202024-03-31%20a%20las%2016.42.31-f811afd8-2509-45e7-812f-bcafd1c071c6.jpg)
Distribuci贸n conjunta, con formato condicional :) ![](https://static.platzi.com/media/user_upload/image-06da0e0c-6729-4171-89f9-35f76ec23d0f.jpg)
![](https://static.platzi.com/media/user_upload/image-da66fa52-ffba-4aa9-9a78-aa666ac1ac08.jpg)
![]()![](https://static.platzi.com/media/user_upload/image-bebc6b6b-d30c-40cc-9946-345d6f34d0c8.jpg)

Este reto fue muy interesante en el desarrollo del curso. Aui esta mi parte que desarrolle con respecto al reto:
Distribucion normal:
![](

Distribucion conjunta por filas:
![](

Distribucion conjunta por columnas:
![](

![]()![](https://static.platzi.com/media/user_upload/image-ca9374fb-f16f-4c35-a510-dc10dc85834d.jpg)
![](https://static.platzi.com/media/user_upload/DistribucionConjuntaEjc-d2a2a4ee-1210-46f6-a099-b1f450a3b25d.jpg)
* **Distribuci贸n conjunta:** Se refiere a la distribuci贸n de probabilidad de dos o m谩s variables aleatorias en conjunto. Describe c贸mo se relacionan entre s铆 dos o m谩s variables y proporciona informaci贸n sobre la probabilidad de que ocurran diferentes combinaciones de valores para esas variables. Se representa com煤nmente mediante una tabla o una funci贸n de densidad de probabilidad conjunta. * **Distribuci贸n marginal:** Se obtiene a partir de la distribuci贸n conjunta al sumar o integrar las probabilidades de todas las combinaciones posibles de valores de una o m谩s variables, dejando de lado las otras variables. Es decir, muestra la distribuci贸n de probabilidad de una variable en particular sin considerar las dem谩s. Se obtiene sumando las filas o columnas de una tabla de distribuci贸n conjunta. * **Distribuci贸n condicional:** Se refiere a la distribuci贸n de probabilidad de una variable aleatoria dada ciertos valores de otra variable. Describe c贸mo se distribuye una variable cuando se conoce informaci贸n espec铆fica sobre otra variable. Se calcula dividiendo la probabilidad conjunta de las dos variables por la probabilidad marginal de la variable condicionante.
Estas son las instrucciones del ejemplo que se hizo en clase: **<u>Comparar por d茅cadas, qu茅 pa铆s fue el mayor productor de series o pel铆culas en el cat谩logo de Netflix</u>** De aqu铆 podemos identificar que en las **columnas** tenemos a los pa铆ses y en las **filas** a los a帽os agrupados por d茅cadas; por 煤ltimo, nuestros **valores** provienen de cada pel铆cula.
![](https://static.platzi.com/media/user_upload/Screenshot%20%28364%29-e974396f-a19d-47d8-90ff-8d5c50bfb31a.jpg)
![](https://static.platzi.com/media/user_upload/image-d40cf3b2-0259-4575-b8ca-e3614ee8ccc2.jpg)
El reto: ![](https://static.platzi.com/media/user_upload/image-1753168f-8b17-49b5-a9df-3a2401491eac.jpg)![](https://static.platzi.com/media/user_upload/image-96036f2b-5adf-4d1d-8cc6-e5c2ad4ba458.jpg)

Sumo mi aporte

Reto asignado realizado en excel: Siempre hay cosas nuevas para aprender, en este caso, la configuraci贸n de los datos en 0% que no muestre ningun dato fue parte de mi aprendizaje practico en excel. ![](https://static.platzi.com/media/user_upload/image-4b3cdd56-e9c7-4a67-a5be-ee62ae5afe33.jpg)
![]()reto cumplido ![](https://static.platzi.com/media/user_upload/reto%201-47d96e84-e9a0-4d3b-b523-e9c696e52788.jpg)
![](https://static.platzi.com/media/user_upload/image-9105c223-44e7-4ba1-811f-9d757c320f29.jpg)
Sumo mi aporte al reto.![](https://static.platzi.com/media/user_upload/image-40968c6a-cf00-424b-ade4-b6bbb0fde288.jpg)
![](https://static.platzi.com/media/user_upload/image-e0e3c20d-849f-4023-bfb9-ac2a1cfbe0b3.jpg)
Reto realizado ![](https://static.platzi.com/media/user_upload/image-dcf3c5ff-987f-437d-8225-15b1538eb3c8.jpg)
Mi apunte: ![](https://static.platzi.com/media/user_upload/image-46745a77-8d68-4712-bc4a-447ab7825f66.jpg)
Resultado del reto: ![](https://static.platzi.com/media/user_upload/image-956827ab-a00c-4691-8a6e-e94dcc89cc65.jpg)
![](https://static.platzi.com/media/user_upload/image-b9aa65de-2782-413a-9e57-8a35d890b315.jpg)
**Mis apuntes:** **Distribuciones conjuntas** Como se comporta una variable en relacion a otra. **Distribucion marginal** Es la distribucion que esta a los margenes de nuestra tablabidmensional. Independientemente de la otra variable puedo hacer conclusions, tomando en cuenta mi variable columnar o de filas. **Distribucion condicional:** preguntas respecto a una variable en relacion con la Segunda. O sea relacion entre dos variables.
Algo as铆 va pero mostrando los porcentages del total. ![](https://static.platzi.com/media/user_upload/Distribuci%C3%B3n%20conjunta-2ce098fb-f20c-44d1-b30d-38cc143282ad.jpg)
Hecho ![](https://static.platzi.com/media/user_upload/image-eb9747f4-6a75-46e9-b535-5ba2a3b53394.jpg)
![](https://static.platzi.com/media/user_upload/image-110a363d-0b9e-45a1-89e8-9e36ec641629.jpg) El Reto con, colorcitos. Hasta ahora todo esta muy interesante

Mi reto:

Reto Aceptado: Se puede observar que un **36,5%** las peliculas y series van dirigidas para mayores de edad y un **24,5%** son para personas mayores de 14 a帽os; lo cual representa m谩s del **60%** de todos los t铆tulos en Netflix. ![](https://static.platzi.com/media/user_upload/image-7c08fc78-d280-4969-bc5a-92abc0a16d9d.jpg)
Aqu铆 muestro la soluci贸n al reto: ![](https://static.platzi.com/media/user_upload/image-2f85cf18-376f-4cb9-b9e4-ab77dc93ce52.jpg) ![](https://static.platzi.com/media/user_upload/image-29d2313f-e16d-484c-a607-f6f95cc78c0f.jpg)
![](https://static.platzi.com/media/user_upload/image-7178935c-aaad-4e82-b328-a23cb9459360.jpg) El 36,41% de los titulos entre los diferentes generos son tipo TV-MA.
![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202023-10-12%20152716-11888370-e3ad-4af7-bcf2-3246dd1c00b7.jpg) Cual es el porcentaje de pel铆culas (movies) clasificadas como TV-MA? la respuesta ser铆a un 22.81%

DISTRIBICCI脫N CONJUNTA

Distribuci贸n conjunta

Horrible mi tabla.

驴Alguien sabe porque al darle clic derecho a la tabla dinamica no me sale la opcion para crear las reglas de agrupacion? Cuando ella convierte los a帽os a decadas. No me sale esa funcion en Google Spreadsheets.
Distribuci贸n conjunta![](https://static.platzi.com/media/user_upload/Screenshot_20230929_123135-f8741cdd-3729-4a08-bd84-84aa360ecc14.jpg)
![](https://static.platzi.com/media/user_upload/Captura-43531283-f716-4318-88ff-1d5f43d31268.jpg)
![](https://static.platzi.com/media/user_upload/iii-7356e753-3e9a-4977-b3d7-e71c8ab1ce2b.jpg)

En mi caso para no tener que seleccionar toda la tabla de datos de Netflix, solo me voy a la hoja en la que directamente quiero trabajar, insertar -> tabla din谩mica y en el rango de datos selecciono el de Netflix

Distribuci贸n conjunta de la clasificaci贸n de edad y el g茅nero principal:

Distribuci贸n marginal por filas:

Distribuci贸n marginal columnar:

Genial, de esta distribuci贸n conjunta podemos decir, como ejemplo, que del genero drama, con un porcentaje importante de un 38.5% pertenecen a la clasificaci贸n TV-MA

Reto!

Mi aporte

Distribuci贸n conjunta y distribuci贸n marginal

Distribuci贸n condicional por filas

Distribuci贸n condicional por columnas


Las distribuciones conjuntas involucran el estudio de c贸mo se comportan dos o m谩s variables en conjunto. Esto incluye analizar sus relaciones y c贸mo cambian una en relaci贸n a la otra. Las distribuciones marginales permiten observar la distribuci贸n de una variable a lo largo de una columna o fila en una tabla de frecuencias. Por otro lado, las distribuciones condicionales brindan informaci贸n sobre la probabilidad de que ocurra una variable bajo ciertas condiciones de otra variable.

me gustaria que se hicieran mas quices en este curso , ayudaria a mas retroalimentacion

As铆 qued贸 mi tabla

Reto de la clase:
Distribucion conjunta entre rating y genero principal.

Aca el reto, con el % total;

Reto de la clase

  • La distribuci贸n conjunta es un concepto utilizado para describir c贸mo se relacionan dos o m谩s variables aleatorias. En palabras sencillas, es una manera de analizar la probabilidad de ocurrencia de diferentes combinaciones de valores de esas variables.

Imagina que est谩s estudiando el rendimiento acad茅mico de los estudiantes y quieres examinar c贸mo se relaciona con la cantidad de horas de estudio y la cantidad de horas de sue帽o. La distribuci贸n conjunta te permitir铆a ver c贸mo se distribuyen las calificaciones en funci贸n de diferentes combinaciones de horas de estudio y sue帽o.

En resumen, la distribuci贸n conjunta te proporciona informaci贸n sobre c贸mo se combinan y relacionan las variables aleatorias, lo cual puede ser 煤til para entender los patrones y las tendencias en un conjunto de datos.

Aca les dejo mi tabla:

Reto

asi quedo mi tabla

A continuaci贸n, comparto la tabla del reto sobre Distribuci贸n Conjunta:
.

RETO
Con nuestro dataset de Netflix, encuentra la distribuci贸n conjunta ente el rating/clasificaci贸n de edad y el g茅nero principal.

8. Distribuciones conjuntas

  • Distribuci贸n conjunta: la relaci贸n entre dos variables
  • Distribuci贸n marginal: variables al margen de la tabla
  • Distribuci贸n condicional: se hacen preguntas para una variable con respecto a la segunda.
**Reto** ![](https://static.platzi.com/media/user_upload/image-69a021d2-0c35-46b9-a5dc-1e66627e8597.jpg) Distribucion condicional por filas: ![](https://static.platzi.com/media/user_upload/image-0912c426-2e57-44a3-9347-0544eb70b746.jpg)