You don't have access to this class

Keep learning! Join and start boosting your career

Aprovecha el precio especial y haz tu profesión a prueba de IA

Antes: $249

Currency
$209
Suscríbete

Termina en:

0 Días
3 Hrs
18 Min
28 Seg
Curso de Estadística y Probabilidad

Curso de Estadística y Probabilidad

Ilse Beatriz Zubieta Martínez

Ilse Beatriz Zubieta Martínez

Distribuciones simétricas y asimétricas

16/26
Resources

What is a symmetric distribution?

In exploring the world of data distributions, we find symmetric distributions to be a key concept. These distributions are those in which the graph is mirrored to itself if a vertical line is drawn through the midpoint. Basically, 50% of the data is to the left and 50% to the right of this center line.

How to identify symmetric distributions?

To identify a symmetric distribution, observe whether the measures of central tendency, i.e. the mean, median and mode, coincide at the center point of the distribution.

Examples of symmetric distributions

  • Normal distribution: Also known as "Gaussian bell," this distribution is the most common example of symmetry, with 50% of its values located two-thirds of a standard deviation to the left and right of the mean.
  • Measurement errors: In interviews, symmetric distributions may appear due to random errors that swing on either side of the midpoint.
  • Blood pressure and piece size: Environments where measured quantities tend to be equally distributed around a central point.

What is the rule of thumb?

The rule of thumb is fundamental to understanding normal distributions. It tells us what percentage of data is within 1, 2 and 3 standard deviations of the mean.

How does the rule of thumb apply?

  1. 68% of the data is within 1 standard deviation of the mean.
  2. 95% is within 2 standard deviations.
  3. 99.7% is within 3 standard deviations.

With these figures, it is possible to predict the behavior of a large data set within a normal distribution.

What are asymmetric distributions?

Contrary to symmetric distributions, asymmetric distributions are not uniformly mirrored on both sides of the midpoint. They are recognized by having a "tail" that can be to the right or to the left, which is due to the concentration of outliers.

Types of asymmetric distributions

  • Positive asymmetric: The tail extends to the right side. Examples include difficult test scores.
  • Negative asymmetric: The tail is on the left side. Example: movie release years analyzed in a boxplot.

How to identify measures of central tendency in asymmetric distributions?

In asymmetric distributions:

  • The mode is the highest point of the curve.
  • The mean and median are spread in the direction of the tails. In a positive distribution, the median is slightly to the right of the mode, and the mean further to the right. For a negative distribution, the median and mean are to the left of the mode.

How to use boxplot to analyze distributions?

The boxplot is an effective tool to visualize distributions and easily identify skewness and outliers:

  1. Quartiles: shows the minimum value, Q1, median (Q2), Q3, and the maximum.
  2. Box and whiskers: Reflect data concentration and dispersion.
  3. Outliers: Indicated outside the boxplot whiskers.

Examples in data analysis

Visualizing the year of Netflix movie release in a boxplot highlights older outliers, with most of the data clustered toward recent years, indicating a possible negative skewed distribution.

I invite you to continue to explore and identify different distributions in your own data sets by applying these techniques and recommendations. Statistics is a powerful tool for informed decision making and deep understanding of information - keep learning!

Contributions 45

Questions 8

Sort by:

Want to see more contributions, questions and answers from the community?

APUNTE

Distribuciones simétricas y asimétricas

Su diferencia radica en qué forma toman cuando la curva está suavizada. PARA LA DISTRIBUCION LOS DATOS DEBEN ESTAR ORDENADOS

Las distribuciones son simétricas cuando los datos de la izquierda son los mismos que la derecha respecto a la media. La media y mediana están en el punto central.

En los gráficas podemos determinar que la moda es diferente para cada gráfica, el gráfico superior nos indica que las medidas de tendencia central están en el mismo punto (media, mediana y moda); mientras que la segunda gráfica que es bimodal, indica que tiene 2 modas.

EJEMPLOS:

  • Calificaciones de un examen
  • Errores de medida
  • Presión sanguínea
  • Tamaño de piezas producidas en una máquina

DISTRIBUCIÓN NORMAL

  • Tambien llamada “de campana”,”de Gauss” o “Gaussiana”
  • Sus medidas de tendencia central son las mismas
  • Su “50%” central está dentro de 2/3 de desviación estándar hacia la izquierda y derecha de la media.
  • Regla empírica: Nos explica qué tanto porcentaje de valores están agrupados en el 68%, 95% y 99,7% de estos. Al hacer 3 desviaciones estándar podemos verificar el porcentaje de datos que la desviación contiene.

Las distribuciones son asimétricas cuando los datos tienden hacia la izquierda o hacia la derecha. Gran cantidad de valores atípicos. La cola es la gran concentración de valores atípicos

Menor frecuencia a mayor distancia que nos estemos alejando de nuetros datos.

  • La gráfica superior indica que tiene distribución asimétrica positiva ya que la cola tiende hacia la derecha (se hace más delgada a la derecha)
  • La gráfica inferior indica que la mayoría de datos se concentran en la parte derecha y nuestos valores atípicos tienden hacia la izquierda, entonces tenemos una distribución asimétrica negativa.


La moda será el punto más alto, es decir el valor más frecuente.

La mediana (representa el punto de equilibrio) :

  • En la distribución asimétrica positiva estará a la derecha de la moda
  • En la distribución asimétrica negativa estará a la izquierda de la moda:

La media:

  • En la distribución asimétrica positiva estará a la derecha de la mediana
  • En la distribución asimétrica negativa estará a la izquierda de la mediana


*No es exacta pero es un putno de referencia

VALORES ATÍPICOS

  • Valores atípicos bajos
    • Q1 - 1.5 (IQR)
  • Valores atípicos altos
    • Q3 + 1.5 (IQR)

EJEMPLOS:

  • Calificaciones en un examen muy dificil o injusto
  • Año de estreno de películas

Realizaremos un boxplot para verificar

!

Comprobamos en Excel

Para los valores atípicos, por si no te pareció precisa la explicación, sólo es multiplicar 1.5 por el iqr y ya se le resta o suma el cuartil debido.
Por ejemplo, con los datos de los años:
Para los atípicos bajos es: Q1 - 1.5 (IQR), es decir:
2013 - (1.5 x 6) = 2004, por lo que las fechas del 2004 para abajo son valores atípicos bajos.

Para los atípicos altos es: Q3 - 1.5 (IQR), es decir:
2019 + (1.5 x 6) = 2028, por los que las fechas del 2028 para arriba se considerarán valores atípicos altos
Por lo que vi en internet, el 1.5 no es realmente una regla universal, solo es un acuerdo entre estadistas para tener una mejor definición de los valores atípicos.

Pues sí que se cumple

Si se cumple el comportamiento para las distribución negativa o hacia la izquierda

16. Distribuciones simétricas y asimétricas

  • Distribuciones simétricas: Dividen al 50% sus datos a la derecha e izquierda. Distribución normal. Regla empírica (69-95-99.7)1,2,3 desvest.
  • Distribuciones asimétricas: bimodal. Gran distancia de valores atípicos. Asimétrica positiva cola derecha. Asimétrica negativa cola izquierda. Moda curva más alta. Mediana a izquierda o derecha de moda. Media derecha o izquierda de moda, después a antes de la mediana. Valores atípicos bajos Q1 - 1.5 (IQR). Valores atípicos altos Q3 + 1.5 (IQR)

Ejercicio

Reto: Gráfica de película según su año de realización.

Reto

  1. Distribuciones Simétricas:
    • Características:
      • La forma del conjunto de datos es aproximadamente la misma a ambos lados de su centro.
      • La media, la mediana y la moda coinciden en el centro de la distribución.
    • Ejemplo:
      • La distribución normal estándar es un ejemplo clásico de simetría, donde la mitad de los datos están a cada lado de la media.
  2. Distribuciones Asimétricas:
    • Características:
      • La forma del conjunto de datos no es igual en ambos lados de su centro.
      • La media, la mediana y la moda pueden no coincidir.
    • Tipos:
      • Asimetría Positiva (Cola a la Derecha): La cola de la distribución se extiende más hacia la derecha. La media está a la derecha de la mediana.
      • Asimetría Negativa (Cola a la Izquierda): La cola de la distribución se extiende más hacia la izquierda. La media está a la izquierda de la mediana.
    • Ejemplo:
      • Ingresos económicos, donde algunos individuos tienen ingresos muy altos, creando una cola a la derecha.
  3. Uso Práctico:
    • Comprender la simetría o asimetría ayuda a caracterizar la forma de la distribución.
    • Puede proporcionar información sobre la tendencia central y la dispersión de los datos.
  4. Consideraciones:
    • La simetría es un concepto importante en estadísticas y afecta la interpretación de medidas centrales.
    • La asimetría puede indicar la presencia de valores atípicos o sesgo en los datos.

Ejemplo Rápido:
Supongamos que estamos analizando la distribución de calificaciones en un examen. Si la mayoría de los estudiantes obtienen calificaciones cercanas a la media y hay pocos estudiantes con calificaciones extremadamente altas o bajas, la distribución puede ser simétrica. Si, en cambio, hay más estudiantes con calificaciones extremadamente altas que bajas, la distribución podría ser asimétrica positiva.

Estos conceptos son fundamentales para comprender la forma y la estructura de los conjuntos de datos.

Distribución simétrica: En una distribución simétrica, los datos están igualmente distribuidos a ambos lados de la media, lo que significa que la mitad de los datos están por encima de la media y la otra mitad está por debajo de la media, lo que permite dividir la gráfica en dos partes iguales mediante un eje vertical que pase por la media. Un ejemplo común de una distribución simétrica es la distribución normal, también conocida como distribución de campana o de “de Gauss”. 1. **Distribución asimétrica**: En una distribución asimétrica, los datos están sesgados hacia un lado de la media. Esto significa que la mayoría de los datos se encuentran en un lado de la media, mientras que el otro lado tiene pocos datos dispersos. La forma de la distribución no es simétrica y no se puede dividir en dos partes iguales mediante un eje vertical que pase por la media. Hay tres tipos principales de distribuciones: * **Sesgo a la derecha (positivo)**: La cola de la distribución se extiende hacia la derecha, lo que significa que hay valores extremadamente altos que están alejados de la media. Los valores que se encuentran en la cola, o al lado derecho se denominan “atípicos”. * **Sesgo a la izquierda (negativo)**: La cola de la distribución se extiende hacia la izquierda, lo que significa que hay valores extremadamente bajos que están alejados de la media. Los valores que se encuentran en la cola, o al lado izquierdo se llaman “atípicos” donde hay algunos casos que afectan la media. * **Sesgo en U**: En este caso, la distribución tiene dos colas y la forma se asemeja a la letra "U". Esto puede ocurrir cuando hay subgrupos distintos en los datos que tienen diferentes distribuciones. Esta gráfica contiene muchos elementos en los extremos de la gráfica y pocos elementos en el centro, dando la forma de “U”.

Las distribuciones en estadística describen cómo se extienden los datos en torno a ciertos valores. Una distribución simétrica tiene una forma equilibrada en ambos lados de su punto central y sus medidas de tendencia central (media, mediana y moda) coinciden. La distribución normal es un ejemplo importante de distribución simétrica, caracterizada por su campana y regida por la media y la desviación estándar. La regla empírica 68-95-99.7 establece patrones comunes en la distribución normal. Por otro lado, las distribuciones asimétricas pueden ser positivas (cola hacia la derecha) o negativas (cola hacia la izquierda), y sus medidas de tendencia central varían en relación con la mediana. Los valores atípicos, que se desvían significativamente de la distribución, se pueden identificar mediante el rango intercuartílico y la regla del 1.5 veces el RIQ.

Mi aporte del reto.

Siendo que en las clases anteriores determinamos un valor para la desviación estándar, cabe aclarar que las desviaciones 2 y 3 son multiples de la primera. Ejemplo: Supongamos que: * Media = 100 * Desviación estándar = 10 Entonces: * **1σ** → intervalo: `100 ± 10` → de **90 a 110** * **2σ** → intervalo: `100 ± 20` → de **80 a 120** * **3σ** → intervalo: `100 ± 30` → de **70 a 130**
![](https://static.platzi.com/media/user_upload/upload-5cb4b9fc-bf87-4983-a368-1648b408e605.png)
![]()![](https://static.platzi.com/media/user_upload/upload-12be6501-5c37-4872-8a33-354ed3af9aaa.png)
![](https://static.platzi.com/media/user_upload/image-1711ac53-8e69-4836-8bc1-0af90509a1ed.jpg)
En la clase se abordaron las distribuciones simétricas y asimétricas. Las simétricas, como la normal, tienen media, mediana y moda en el mismo punto central, y el 50% de los datos se ubica entre dos tercios de la desviación estándar de la media. Las asimétricas se caracterizan por tener colas inclinadas y medidas de tendencia central que no están alineadas. Se discutieron ejemplos prácticos y la visualización de datos mediante histogramas y boxplots. Además, se mencionó la importancia de identificar valores atípicos. ## Distribución simétrica Una distribución simétrica es aquella donde los datos están distribuidos de manera uniforme a ambos lados de un punto central, lo que significa que la media, mediana y moda se encuentran en el mismo lugar. Esto implica que el 50% de los valores se sitúan a la izquierda y el 50% a la derecha de este punto central. Un ejemplo clásico de distribución simétrica es la distribución normal, también conocida como distribución de Gauss, que tiene una forma de campana. ## Tipos de distribuciones simétricas Existen principalmente dos tipos de distribuciones simétricas: 1. **Distribución Normal**: También conocida como distribución de Gauss, se caracteriza por tener una forma de campana. En esta distribución, la media, la mediana y la moda son iguales y se ubican en el centro de la distribución. El 50% de los datos se encuentra a una desviación estándar a ambos lados de la media. 2. **Distribución Bimodal**: Esta distribución tiene dos picos o modas, lo que significa que hay dos valores que aparecen con mayor frecuencia. Aunque es simétrica, su forma no es idéntica a la normal, ya que presenta dos concentraciones de datos en lugar de una sola. Es útil reconocer estas distribuciones para analizar y entender mejor tus datos en el contexto de estadística y probabilidad. ## Ejemplos de distribuciones simétricas Las distribuciones simétricas son aquellas en las que los datos se distribuyen de manera uniforme a ambos lados de la media. Algunos ejemplos son: 1. **Distribución Normal**: Conocida como la "campana de Gauss", tiene la media, mediana y moda en el mismo punto central. 2. **Distribución T de Student**: Utilizada en inferencias estadísticas para muestras pequeñas. 3. **Distribución Uniforme**: Todos los valores tienen la misma probabilidad, como el lanzamiento de un dado. 4. **Distribución Bimodal**: Puede presentar dos picos, pero sigue siendo simétrica. Estos ejemplos son fundamentales en la estadística y ayudan a comprender el comportamiento de los datos. ## Distribución asimétrica La distribución asimétrica es aquella en la que los datos no están distribuidos de manera uniforme en ambos lados de la media. En este tipo de distribución, la cola de los datos se extiende más hacia un lado que hacia el otro. Existen dos tipos de distribuciones asimétricas: 1. **Asimétrica positiva** (o cola a la derecha), donde la mayoría de los datos se concentran en el lado izquierdo y hay valores atípicos hacia la derecha. 2. **Asimétrica negativa** (o cola a la izquierda), donde la mayoría de los datos están en el lado derecho y hay valores atípicos hacia la izquierda. Este concepto es clave para el análisis de datos en estadística y probabilidad. ## Tipos de distribuciones asimétricas Existen dos tipos principales de distribuciones asimétricas: 1. **Distribución Asimétrica Positiva**: La cola de la distribución se extiende hacia la derecha. Esto significa que la mayoría de los datos se agrupan a la izquierda, y hay algunos valores atípicos altos a la derecha. Un ejemplo son los ingresos en una población donde la mayoría gana menos, pero algunos tienen ingresos muy altos. 2. **Distribución Asimétrica Negativa**: La cola de la distribución se extiende hacia la izquierda. Aquí, la mayoría de los datos se agrupan a la derecha, mientras que hay valores atípicos bajos a la izquierda. Un ejemplo podría ser las calificaciones en un examen muy difícil, donde la mayoría tiene puntajes altos, pero algunos obtienen calificaciones bajas. Ambos tipos son útiles para identificar la naturaleza de los datos en análisis estadístico. ## Ejemplos de distribuciones simétricas Las distribuciones asimétricas son aquellas donde los datos no se distribuyen de manera uniforme a ambos lados de la media. Ejemplos incluyen: 1. **Calificaciones de un examen difícil**: donde muchos estudiantes obtienen bajas calificaciones y pocos logran altos puntajes, generando una cola hacia la izquierda. 2. **Ventas de productos en un e-commerce**: donde algunos productos tienen ventas extremadamente altas (pocos) mientras que la mayoría tiene ventas bajas, creando una distribución con cola hacia la derecha. 3. **Entradas a un evento popular**: donde la mayoría de las entradas se venden rápidamente, pero hay algunas que quedan sin vender, resultando en una cola hacia la izquierda. Estas situaciones son comunes en estudios de mercado y análisis de datos.
![](https://static.platzi.com/media/user_upload/image-0882f114-8fcf-402c-9f7c-f07a03daa937.jpg)
La regla empírica, también conocida como la regla del 68-95-99.7, describe cómo se distribuyen los datos en una distribución normal. Indica que aproximadamente el 68% de los datos se encuentran dentro de una desviación estándar de la media, el 95% dentro de dos desviaciones estándar y el 99.7% dentro de tres desviaciones estándar. Esta regla es útil para entender la dispersión de los datos y es fundamental en estadística para realizar inferencias sobre poblaciones a partir de muestras.
comparto mi aporte: ![](https://static.platzi.com/media/user_upload/image-3b09afdb-0ad7-4d80-8055-e44ef84e23fa.jpg)
* Valores atípicos bajos: Q1−1.5×IQR 2013−1.5×6 \=2013−9 \=2004 Cualquier valor **menor** que 2004 será considerado un **valor atípico bajo**. * Valores atípicos altos: Q3+1.5×IQR 2019+1.5×6 \=2019+9 \=2028 Cualquier valor **mayor** que 2028 será considerado un **valor atípico alto.** ### **\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_\_** * **Valores atípicos bajos**: Cualquier valor **menor** que 2004. * **Valores atípicos altos**: Cualquier valor **mayor** que 2028. ###
![](https://static.platzi.com/media/user_upload/image-e354efb7-dcea-412c-903a-852f223a5321.jpg)
![](https://static.platzi.com/media/user_upload/HISTOGRAMA-9141c0b1-46f8-4305-86b9-4da5084f7213.jpg)
Comparto mi interpretación de la distribución y es asimétrica negativa: ![](https://static.platzi.com/media/user_upload/image-73d33b6e-43c2-4b82-adbe-be0beaa31873.jpg)
Gracias
He tratado de subir los resultados de mi gráfica, pero me sale error, si alguien me puede ayudar sobre como subir imágenes :''c. Psdta. ¡Excelente clase! ![](file:///var/folders/7b/f07jc6fn7s1360lclcgm06v00000gn/T/TemporaryItems/NSIRD_screencaptureui_Z9RVOd/Captura%20de%20pantalla%202024-04-19%20a%20la\(s\)%2021.44.27.png)
![](file:///var/folders/7b/f07jc6fn7s1360lclcgm06v00000gn/T/TemporaryItems/NSIRD_screencaptureui_Z9RVOd/Captura%20de%20pantalla%202024-04-19%20a%20la\(s\)%2021.44.27.png)![](file:///var/folders/7b/f07jc6fn7s1360lclcgm06v00000gn/T/TemporaryItems/NSIRD_screencaptureui_Z9RVOd/Captura%20de%20pantalla%202024-04-19%20a%20la\(s\)%2021.44.27.png)
![](https://static.platzi.com/media/user_upload/image-87d4ad73-b7e7-4c1a-8d16-b09a503eec5a.jpg)
![]()![](https://static.platzi.com/media/user_upload/image-9b641160-359c-4980-b814-90132a829305.jpg)
RETO GRAFICA DE PELICULA SEGUN AÑO DE LANZAMIENTO![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202024-03-18%20180806-d3103c73-e4da-4679-81ef-f0de709c96c1.jpg)

Es interesante el ejercicio de este problema. Aqui esta el reto.
![](

Wujuuu si pude :D ![](https://static.platzi.com/media/user_upload/image-248ee3eb-4383-40fd-b0b5-72dd66f4b4f4.jpg)
aporte: ![](https://static.platzi.com/media/user_upload/image-073ce77c-7420-4fd0-ab62-3a54849967d6.jpg)
![](https://static.platzi.com/media/user_upload/image-21940908-73cb-4e07-9836-121ff8c90d62.jpg)

¿Las distribuciones asimétricas se producen por alta presencia de datos atípicos?


La profesora indica en el minuto 7:30 que las distribuciones asimétricas se producen por la presencia de datos atípicos, lo cual no es necesariamente así.

Aunque las distribuciones asimétricas pueden estar influenciadas por valores atípicos, no todas las distribuciones asimétricas se deben a la presencia de datos atípicos.

La asimetría en una distribución puede ser causada por varios factores, tales como sesgo en los datos, características de la variable, efectos de truncamiento, etc.

Es importante tener en cuenta que los valores atípicos pueden tener un impacto en la asimetría de una distribución. Si hay valores extremos en una cola de la distribución, esto puede hacer que la distribución se sesgue hacia esa dirección. Sin embargo, no todos los casos de asimetría se deben a datos atípicos.

Es posible tener una distribución asimétrica sin valores atípicos, y también es posible tener valores atípicos en una distribución simétrica.

![](https://static.platzi.com/media/user_upload/image-5c64087d-a77d-4c12-b196-65c2bf575b4d.jpg)
![](https://static.platzi.com/media/user_upload/image-0eab58db-156d-45bb-b656-0e09f8c7cc9c.jpg)
![](https://static.platzi.com/media/user_upload/image-626544f4-15ab-4c07-a4f2-19bd98504dad.jpg)Los años de las peliculas tienen una distribución asimetrica hacia la izquierda.
![](https://static.platzi.com/media/user_upload/image-12608772-9eb6-4e88-be73-cac63eacfc2d.jpg)
![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202023-09-27%20132015-0ee3b7bb-ce4d-4bd2-b582-c054c931e66d.jpg)
¿Cómo se grafica las medidas de tendencia central en el histograma?

Mi aporte