¿Qué es la estadística y con qué se come?

1

Estadística, ¿qué es y por qué aprenderla?

2

Conceptos clave de estadística

3

Software estadístico

4

Workbook de ejercicios para practicar

Quiz: ¿Qué es la estadística y con qué se come?

Una imagen vale más que mil datos

5

Tablas unidimensionales y bidimensionales

6

¿Qué es la frecuencia estadística y con qué se come?

7

¿Cuál es la mejor visualización para mis datos?

Quiz: Una imagen vale más que mil datos

Estadística descriptiva

8

Distribuciones conjuntas

9

Medidas de tendencia central: media, mediana y moda

10

Cálculo de media, mediana y moda en hojas de cálculo

11

Medidas de dispersión: rango e IQR

12

Desplazamiento y escala de valores

13

Box plots y el resumen de 5 números

Quiz: Estadística descriptiva

Representación de datos

14

Media, varianza y desviación estándar

15

Histogramas, polígonos de frecuencia y curvas de densidad

16

Distribuciones simétricas y asimétricas

Quiz: Representación de datos

Muestra y error

17

Métodos de recopilación de datos

18

Muestreo y sesgo

¿Y la probabilidad?

19

¿Qué es la probabilidad y cómo se relaciona con la estadística?

20

Regla de la suma, unión e intersección

21

Probabilidad condicional y eventos dependientes e independientes

22

Teorema de Bayes

23

Combinaciones y permutaciones

Quiz: ¿Y la probabilidad?

Correlación y causalidad

24

¿Correlación o causalidad?

25

Gráficos de dispersión e introducción a la regresión

Quiz: Correlación y causalidad

Conclusiones

26

¿Qué aprender con tus nuevos poderes?

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Estadística y Probabilidad

Curso de Estadística y Probabilidad

Ilse Beatriz Zubieta Martínez

Ilse Beatriz Zubieta Martínez

Media, varianza y desviación estándar

14/26
Recursos

Aportes 49

Preguntas 12

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Media, varianza y desviación estándar

MEDIA:Promedio, el valor central de los datos

Parámetro = Poblacional
Estadístico = Muestral

VARIANZA: Distancia de los valores respecto a la media o promedio, ed decir, que tan lejos y que tan cerca están cada uno de ellos respecto a la media.

La suma entre las distancias de cada uno de mis valores restando la media poblacional, esto elevado al cuadrado. Sumado cada una de esas diferencia y lo divido al numero de muestras.
Parámetro = Poblacional

Estadístico = Muestral

En la siguiente formula no hay subestimación ni sobreestimación de la varianza

DESVIACIÓN ESTÁNDAR: Qué tan alejado el valor respecto al promedio, nos explicará las desviaciones que tendremos en cada uno de los elementos.

Si la desviación estándar es mayor → el conjunto de está muy alejado de la media

Si la desviación estándar es menor→ el conjunto de está muy cerca del promedio

Si la desviación estándar es 0 → los valores son iguales

Parámetro = Poblacional

Estadístico = Muestral

Para mi siempre ha sido muy complejo asimilar estos conceptos porque me gusta relacionarlos con la vida real. Así que, les traigo el siguiente ejemplo para aquellas personas que no logran comprender la desviación estándar:

Se pueden imaginar lo siguiente:

el centro es nuestra población. Entonces, cada flecha nos representa un dato. Si consideramos lo siguiente:

Si la desviación estándar es mayor → el conjunto de está muy alejado de la media o nuestros tiros estan muy alejados del centro.

Si la desviación estándar es menor→ el conjunto de está muy cerca del promedio. Los tiros estan muy cercanos al centro.

Si la desviación estándar es 0 → los valores son iguales a la población.

No se asusten si no entienden a la primera. Está medio complejo a mi parecer. Pero les dejo mis apuntes respecto a población, muestra y varianza muestral y poblacional. Quizás les ayude:

Población y muestra

Cuando queremos hacer un análisis estadístico de un conjunto de datos en su completitud, se denomina un análisis de población.

Pero generalmente este tipo de análisis puede ser impráctico por una cuestión de recursos (tiempo, dinero, etc.) por lo que se recurre a un análisis de muestra.

Por ejemplo, un análisis de población puede ser un análisis de todos los ingenieros graduados en la ORT en el año 2019. Pero un análisis de muestra sería tomar un 30% de esa info.

Media

La media poblacional se define con la µ (miu).
La media muestral se define con X̅ (promedio aritmético).

La fórmula que indica la profe para ambas es la misma. Es la suma del conjunto de datos dividido la cantidad de datos. La diferencia es que N mayúscula representa a todo el conjunto de datos, y la n minúscula representa a la muestra.

Varianza
Es la distancia de cada uno de los valores en relación a la media.

Por ejemplo: Supongamos que lanzas la pelota varias veces y anotas cuán lejos cae cada vez de tu objetivo. La varianza sería cuan lejos o cuan cerca cayó la pelota del objetivo.

Hay dos tipos de varianza: varianza poblacional y muestral.

Tal y como vemos en las fórmulas de la clase, el cálculo sería el siguiente:

Varianza muestral
Explicación de la fórmula

Resta cada número al promedio: Primero, tomas cada número en la muestra y le restas el promedio. Esto te dice cuánto se aleja cada número del promedio.

Eleva eso al cuadrado: Luego, tomas cada uno de esos resultados y los multiplicas por sí mismos (los elevas al cuadrado). Eso es para asegurarte de que todos los números sean positivos.

Suma todo eso: Después de hacer eso para cada número, sumas todos los resultados.

Divide entre n - 1: Por último, divides esa suma por un número especial llamado “n menos 1.” “n” es la cantidad de números en tu muestra.

La fórmula te dice cuán “saltarines” son los números en la muestra alrededor del promedio. Si los números están muy cerca del promedio, la varianza será pequeña. Si están muy separados, la varianza será más grande.

Varianza poblacional
Calculas la varianza poblacional de manera similar a la varianza muestral, pero en lugar de dividir entre n - 1, divides entre N (donde N es el tamaño total de la población) y se utiliza µ (miu) como media poblacional en vez de X̅ (promedio aritmético).

Les comparto mis notas

[](

como consejo, la varianza sesgada se utiliza comúnmente en estadística inferencial, ya que es una estimación más precisa de la varianza poblacional cuando se trabaja con muestras pequeñas. Sin embargo, cuando se trabaja con muestras grandes, se recomienda el uso de la varianza no sesgada para obtener una estimación más precisa de la varianza poblacional.

Para hacer este reto:

  1. Usé la siguiente fórmula para cuadrar los individuos de mi muestra con la base de datos que se tiene
  2. Lo siguiente es hacer lo que hicimos en clase basicamente ( EN LA PARTE CELESTE ESTA LO PEDIDO)

    Este fue mi resultado, cuál fue el tuyo??

FUNCIÓN VAR.P

En inglés: VAR.P

  • Calcula la varianza en función de toda la población.

 
FUNCIÓN VAR.S

En inglés: VAR.S

  • Calcula la varianza de una muestra.
     

 
FUNCIÓN VARPA

En inglés: VARPA

  • Calcula la varianza de toda la población, incluidos números, texto y valores lógicos.

 
FUNCIÓN VARA

En inglés: VARA

  • Calcula la varianza de una muestra, incluidos números, texto y valores lógicos.
     

 
FUNCIÓN VARP Y VAR

  • Compatibilidad con Excel 2007 y versiones anteriores

ahí ta!!!

14. Media, varianza y desviación estándar

  • Representación de datos.
  • Dentro de una población podemos seleccionar una muestra.
  • Parámetro: Población Estadístico: Muestra
  • Varianza: distancia entre nuestros datos
  • Desviación estándar: que tan alejados están los datos del promedio

Comparto mis resultados, notando que el valor de la varianza poblacional entre el que hice a mano y formula y la desviacion estandar tambien calculada a mano y con formula son diferntes por pocos decimales.
.

TIP para los que están en excel… 😄

Con las flechitas del teclado, mientras presionas la tecla shif, puedes ir seleccionando varios elementos a la vez.

Si a esto le sumas que con la tecla control y las flechitas del teclado saltas hasta encontrar el proximo campo vacio, tienes como resultado una forma rapida de seleccionar toda la columna o fila

en resumen; seleccionar datos agrupados con el teclado = control + shift + flechas

(tengan cuidado con los espacio vacios, donde inician a hacer la seleccion y de no seleccionar los titulos de las columnas)

Reto

  • La diferencia principal entre la media poblacional y la media muestral es que la primera representa a toda la población, mientras que la segunda representa solo a una muestra de la población.

Es importante tener en cuenta que, en general, la media muestral no será exactamente igual a la media poblacional, pero se espera que se acerque a ella si la muestra es representativa y suficientemente grande.


La fórmula para calcular la media poblacional y la media muestral es la misma:

La fórmula para la media poblacional es la siguiente:
Media poblacional = (Suma de todos los valores en la población) / (Tamaño de la población)


La fórmula para la media muestral es la siguiente:
Media muestral = (Suma de todos los valores en la muestra) / (Tamaño de la muestra)

Cabe mencionar que la fiabilidad de la muestra depende muchisimo de la muestra que se tome en si…

Si quieres saber cuantos helados compra cada persona en estados unidos… y solo tomas una muestra de las personas que viven en alazca, realmente los datos que obtendras estarán super mal xD porque para este caso en concreto, una muestra de alazca no representa fielmente al 100% a la poblacion de USA~

¿Alguien podría aclararme cuando es pertinente utilizar la varianza y cuando la varianza sesgada? GRACIAS!

Profesora Ilse necesito ayuda en el reto no me dan los valores, muchas gracias!

* Media, Varianza y Desviación Estándar para "n![]()um-actors" ![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202024-03-18%20173609-65b0e75b-c3fc-4d06-a90f-d6cb7518febb.jpg)

Aqui termine el reto que dejaron. Fue algo comlicado en la obtencion de los numeros pero al final logre el ejercicio. Aqui esta.
![](

### Media, varianza y desviación estándar La media, varianza y desviación estándar se usan en casos donde nuestro total de números puede ser poblacional o muestral. La diferencia de ambos casos se resumen a: Todos los datos son nuestra población, y una pequeña parte de esa población es una muestra. * Media: Es la suma de todos los valores en un conjunto de datos dividida por el número total de valores. El numero total de valores “n” debe referirse a una población o a una muestra al inicio del desarrollo de la media. ![Untitled](https://prod-files-secure.s3.us-west-2.amazonaws.com/d3198403-6ac7-43d9-b40c-608386c6c503/bec4357b-67db-404f-8555-c42edeee8dda/Untitled.png) * Varianza: Es una medida de dispersión que indica que tan dispersos están los valores con respecto a la media. Se calcula como la media de los cuadrados de las diferencias entre cada valor y la media, de la siguiente manera: cada valor se resta por la media y se eleva al cuadrado. Luego se suman todos los resultados divididos por los totales poblacional o muestral. ![Untitled](https://prod-files-secure.s3.us-west-2.amazonaws.com/d3198403-6ac7-43d9-b40c-608386c6c503/e0b21902-2ff9-4b8a-8086-012451ebb707/Untitled.png) * Desviación estándar: Es la raíz cuadrada de la varianza y proporciona una medida de dispersión en la misma escala que los datos originales. Se calcula como: =Raíz(varianza) ![Untitled](https://prod-files-secure.s3.us-west-2.amazonaws.com/d3198403-6ac7-43d9-b40c-608386c6c503/63bb00d4-c8bc-4971-91eb-e859cafd8f05/Untitled.png) 💡 Formulas para Excel y Sheets: **=Promedio** para la media y **=VARP** para la varianza. Con la varianza, se hace **=Raíz** para la desviación.
Reto cumplido :) ![](https://static.platzi.com/media/user_upload/image-96a0cb5a-c7ef-4723-bc8e-826fa16040dc.jpg)
Como respuesta al reto, tenemos: ![](https://static.platzi.com/media/user_upload/image-5adafb83-7ebd-419c-a39b-5279d0067fe1.jpg)
![](https://static.platzi.com/media/user_upload/Ashampoo_Snap_mi%C3%A9rcoles%2C%2031%20de%20enero%20de%202024_12h56m08s_002_-f59b1b88-510d-4206-9d98-af67fdf7c3b4.jpg) Reto
La diferencia más significativa entre la varianza y la desviación estándar es que la varianza nos arroja unidades al cuadrado, pero en la mayoría de las ocasiones es más representativo expresar la dispersión de los datos usando las unidades originales, lo cual obtenemos con la desviación estándar simplemente calculando la raíz cuadrada positiva de la varianza.
Aporte: Para no estar cambiando de pestaña usar la referencia de la tabla total y el nombre de la columna que vas a hacer el cálculo entre llaves \[ ], yo la llame "Tabla1", entonces en las fórmulas pones =SUMA(Tabla1\[release\_year]) y listo, asi te traes toda la información de ese Rango creado.

De acuerdo con el reto, mi solución es la siguiente:

¿como puedo mostrar las formulas de esta manera en google sheets? ![](https://static.platzi.com/media/user_upload/image-51b6c79b-b499-4677-af91-48f6133523f3.jpg)
**DISTRIBUCION DE LOS DATOS** **Media, varianza y desviacion estandar.** **Diferencia entre población y muestra.** Dentro de una población podemos seleccionar una muestra. **Media**: promedio y valor central. **Varianza**: La varianza es una medida de dispersión que representa la variabilidad de una serie de datos con respecto a su media **Desviacion estandar:** que tan alejado esta el valor del promedio. Mayor valor de desviacion estandar dice que el conjunto esta alejado del promedio, si es 0 todos los valores son iguales. Si es menor esta mas cerca del promedio
pues a mi me quedo bien creo ![](https://static.platzi.com/media/user_upload/image-7fbed5c1-8484-4a7b-91df-cb34449142f7.jpg)
Hola! ¿cómo descargan la base de datos para trabajar?
De verdad no logro entender, el valor que me dio mal. lo he revisado mil veces. \=SUM(P8:P8814)/COUNT(P8:P8814) en P tengo (min-media)^2 (poblacional) ![](https://static.platzi.com/media/user_upload/template-para-estudiantes-de-proyecto-curso-estadistica-y-probabilidad-platzi_3895678a-4a47-4ff5-80c8-f9a3a48b6b53%20-%20Hojas%20de%20c%C3%A1lculo%20de%20Google-36602610-7364-48c0-a528-f5dca696f2da.jpg)
![](https://static.platzi.com/media/user_upload/image-b2dac348-f66a-4fd0-9c93-6147aa45ba3d.jpg) Lograr determinar el comportamiento de nuestra base nos permita conocer muchos insight para generar reportes y demás KPI relevantes de los mismos.
![](https://static.platzi.com/media/user_upload/image-ccd05c2d-9bf5-43d1-a0a9-ef5ea7fcd698.jpg) Muestra de 700. Me confundí mucho usando las fórmulas porque estaba calculándolo sobre la resta de (años - media muestral ^2) y resulta que las fórmulas son directas y no necesitas ese dato para nada si usas las fórmulas. Así media hora en bucle. Por si a alguien le pasa 🫣![]()

Es interesante como Excel hace las matemáticas y cálculos complejos de manera mas simple y rápida.

# Varianza vs Desviación estandar A diferencia de la varianza, la desviación estándar se mide en las mismas unidades que los datos analizados. En el ejemplo tenemos la desviación estándar en duración y año de estreno. Esto significa que nuestros valores varían 28 (poblacional) / 29 (muestral) minutos de la media

Mis resultados:

Por lejos la mejor explicación del tema de Varianza y Desviación Estándar… les comparto un par de videos que dejan el tema ultra explicado 😉
Video 1: Concepto
https://www.youtube.com/watch?v=hLmsEFNaOgY&list=PLeySRPnY35dE25b7mIEUlsMCQqlhJFhyG&index=2

Video 2: Aplicación de las formulas
https://www.youtube.com/watch?v=oZRaDwnpXkY&list=PLeySRPnY35dE25b7mIEUlsMCQqlhJFhyG

Media, varianza y desviación estándar
Mi aporte a la resolución del ejercicio:

Muestra: primeros 622 valores resultantes del ordenamiento según “id”, “title” y “director”.

 

 

  • Media, Varianza y Desviación Estándar para “num-actors”
     

La media es el promedio de los valores, mientras que la varianza mide cuánto se esparcen los datos alrededor de la media. La varianza no sesgada ajusta la varianza muestral para evitar subestimar la dispersión. La desviación estándar muestra la dispersión en términos fáciles de entender.

hubiese estado mas bueno si el sheet estaria en español

Done 😃

La población es un universo completo a analizar La muestra es una representación de un universo Parámetro: poblacional - miu, la suma de todos mis elementos dividido en la población Estadístico: muestral - x barra, la suma de todos mis elementos dividido en la muestra La varianza es la distancia de nuestros valores respecto a la media de nuestros valores. Con la fórmula de varianza no sesgada no hay subestimación o sobreestimación de la varianza.

Ejercicio