Fundamentos de estadística inferencial

1

Estadística Inferencial en Ciencia de Datos: Técnicas y Aplicaciones

2

Componentes Clave de la Estadística: Población, Muestra y Variables

3

Aplicación del Teorema Central del Límite en Estadística

4

Muestreo: Tipos y Aplicación del Teorema del Límite Central

5

Muestras aleatorias y sistemáticas en Python con Pandas y NumPy

6

Muestreo estratificado con Python: optimización y aplicación práctica

Quiz: Fundamentos de estadística inferencial

Estadísticos y cálculos

7

Cálculo de la media muestral paso a paso

8

Varianza vs Desviación Estándar: Población y Muestra

9

Varianza y Desviación Estándar en Python paso a paso

10

Intervalos de Confianza en Estadísticas y Ciencia de Datos

11

Cálculo de Intervalos de Confianza con Ejemplos Prácticos

12

Cálculo de Intervalos de Confianza en Python

Quiz: Estadísticos y cálculos

Pruebas de hipótesis y validación

13

Pruebas de Hipótesis Estadísticas en Ciencia de Datos

14

Pruebas de Hipótesis: Test-Student, Pearson y ANOVA

15

Errores Tipo I y II en Pruebas de Hipótesis Estadísticas

16

Pruebas de hipótesis con Python: The Student y más técnicas

17

ANOVA y Coeficiente de Pearson en Python

18

Técnica de Bootstrapping para Muestras Pequeñas

19

Bootstrapping y remuestreo en Python

20

Validación Cruzada en Modelos de IA

21

Automatización de Validación Cruzada en Python

Quiz: Pruebas de hipótesis y validación

Cierre del curso

22

Errores Comunes en Validación de Hipótesis y Modelos Estadísticos

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Aplicación del Teorema Central del Límite en Estadística

3/22
Recursos

¿Qué es una distribución normal y por qué es importante?

La distribución normal, también conocida como curva de Gauss o campana de Gauss, es una de las distribuciones de probabilidad más importantes en estadística y ciencia de datos. Su relevancia radica en que muchas variables del mundo real, como la altura, la presión sanguínea y los resultados de exámenes, tienden a seguir este patrón. A nivel gráfico, se representa de manera simétrica, formando una campana donde la mayoría de los datos se concentran en el centro.

¿Qué características tiene la distribución normal?

Una de las propiedades clave de la distribución normal es que la media, la mediana y la moda son iguales, ubicándose todas en el centro de la distribución. Esto significa que la mayoría de los datos se agrupan alrededor del punto medio, mientras que es menos frecuente encontrar datos en los extremos. Este comportamiento es especialmente útil en la estadística porque permite normalizar datos y realizar inferencias sobre una población más amplia.

¿Cómo se aplica la distribución normal en la vida cotidiana?

La distribución normal tiene aplicaciones prácticas en múltiples contextos. Veamos algunos ejemplos:

  • Consumo de calorías y peso corporal: La mayoría de las personas consumen alrededor de 2000 calorías al día, y sus pesos están distribuidos de manera similar. Sin embargo, hay quienes suben o bajan de peso más rápidamente al modificar su consumo calórico, ubicándose en los extremos de la distribución.

  • Presión sanguínea: La presión sanguínea suele seguir un patrón de distribución normal. Aunque la mayoría tiene valores similares y saludables, algunos individuos presentan niveles mucho más bajos o altos.

  • Producción industrial en masa: En la fabricación, se espera que los productos tengan dimensiones estándares. No obstante, algunos productos pueden ser ligeramente más pequeños o más grandes, colocándose a la izquierda o derecha de la curva normal.

¿Cómo identificar otras distribuciones normales en nuestro entorno?

Reflexionar sobre otros ejemplos de distribución normal en la vida diaria puede ser un ejercicio enriquecedor. Considere fenómenos como la puntuación de exámenes estandarizados, el tiempo de respuesta en procesos industriales o incluso la inteligencia medida mediante test. Estos ejemplos muestran cómo la distribución normal es omnipresente y crucial para entender y modelar datos eficientemente.

En futuras lecciones, exploraremos cómo se relaciona esta distribución con conceptos avanzados como el teorema central del límite, ampliando aún más tu comprensión de las ciencias de datos. ¡Continúa explorando!

Aportes 14

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Hola a todos, me gustaría aportar con cinco imágenes de los histogramas de las cinco distribuciones en mención, en el cual se puede observar perfectamente como son distribuciones normales y en contextos de la vida cotidianos pero diferentes.

  1. Distribución de peso de los recién nacidos.
  2. Distribución de altura de los hombres.
  3. Distribución de la talla de zapatos.
  4. Distribución del puntaje de la prueba ACT de EEUU.
  5. Distribución de la edad de retiro de un jugador de la NFL.

Otros tipos de distribuciones

  • Uniforme
  • Binomial
  • Exponencial
  • Poisson

Una población se considera normal cuando se distribuye de acuerdo con una distribución normal.
La distribución normal es una distribución continua de probabilidad que se caracteriza por tener una media, una mediana y una moda iguales, y una forma que se asemeja a una campana.
Es también conocida como distribución gaussiana o distribución de campana de Gauss.

La distribución normal es una de las distribuciones de probabilidad más importantes y ampliamente utilizadas en estadística, ya que muchas variables continuas en la naturaleza y en la investigación científica siguen una distribución normal.
Algunos ejemplos de poblaciones que pueden seguir una distribución normal incluyen altura, peso, inteligencia, tiempo de reacción, entre otros.

Sin embargo, no todas las poblaciones siguen una distribución normal.
Por ejemplo, algunas variables como la edad, el ingreso, el precio de un activo financiero, entre otros, no siempre siguen una distribución normal. En estos casos, se deben utilizar otros métodos estadísticos para analizar los datos.

Algunos ejemplos de variables que pueden seguir una distribución normal incluyen:

  1. Altura de las personas: Es común que la altura de las personas siga una distribución normal, con una media cercana a 1.75 metros para hombres y 1.62 metros para mujeres.

  2. Peso de las personas: El peso de las personas también puede seguir una distribución normal, con una media y mediana cercanas a 75 kg para hombres y 60 kg para mujeres.

  3. Puntuaciones en un examen: Las puntuaciones en un examen también pueden seguir una distribución normal, con una media y mediana cercanas a 70 y una desviación estándar cercana a 10.

  4. Tiempo de reacción: El tiempo de reacción a un estímulo también puede seguir una distribución normal, con una media y mediana cercanas a 200 milisegundos y una desviación estándar cercana a 50 milisegundos.

  5. Mediciones de laboratorio: Muchas mediciones de laboratorio como las concentraciones de una sustancia, también pueden seguir una distribución normal.

  6. Es importante mencionar que para poder afirmar que una variable sigue una distribución normal es necesario realizar pruebas estadísticas para comprobarlo.

Ejemplos de distribuciones normales:

  • La altura de las montañas de una región
  • Velocidades permitidas en las rutas
  • Tiempos de demoras en el tránsito en X días y en Y horarios

Una pregunta que me surgió cuando vi esto en la universidad era porque se daba tan temprano al ver estadística. Resulta que, para la mayoría de estudios, se puede ‘normalizar’ los datos para formar una distribución de Gauss y facilitar el estudio y análisis.

La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la distribución binomial y la distribución de Poisson. La distribución normal proporciona la base para la estadística inferencial clásica por su relación con el teorema de límite central.

ejemplos de variables con distribución normal:

  • Notas en un examen.
  • Errores de medida.
  • Presión sanguínea.
  • Tamaño de las piezas producidas por una máquina.
Otro producto que tiene una distribución normal es el volumen de líquido que se llena en las botellas en la fabricación de bebidas

📝 Distribución normal

Les dejo un resumen de la distribución normal que he hecho en cursos previos
.
Esta distribución de probabilidad es una de las más recurrentes en cualquier ámbito, como las finanzas, sociología e incluso la psicología y un largo etc.
.
La forma de representar esta distribución es mediante una gráfica en forma de montaña (según el principito sería un elefante 🐘 dentro de una serpiente 🐍), llamada “campana de gauss” ó “campana gaussiana”


.
Principales características:

  • Sus medidas de tendencia central (MTC) son iguales.
  • El 50% de sus datos esta en el 2/3 de la desviación estándar hacia la izquierda y derecha de la media.
  • Cumple con la regla empírica: 68, 95, 99.7, donde:
    • 68% de los datos están a una desviación estándar (σ)
    • 95% de los datos están a dos desviaciones estándar (2σ)
    • 99.7.% de los datos están a tres desviaciones estándar (3σ)

.
Para representar esta distribución se necesitan:

  • Una variable aleatoria
  • Calcular la media de la variable aleatoria
  • Calcular la varianza y posteriormente la desviación estándar
  • Decidir la función que queremos representar: función de densidad de probabilidad o función de distribución.

Formula

Donde:

  • σ : Desviación estándar
  • π: Pi con valor de $3.1416…$
  • e: Constante de euler, su valor es de 2.71828…
  • μ : Media de de la pobación

.
Podemos observar la distribución de varias formas, en la siguiente imagen hay dos ejemplos de ella:

.
En ambos ejemplos, su media es de 10, sin embargo la desviación estándar es diferente.

  1. En el ejemplo de la izquierda la $\sigma$ es de 1, existe menor variabilidad de los datos.
  2. En el ejemplo de la derecha la $\sigma$ es de 3, existe mayor variabilidad en los datos.

Con lo anterior se dice que:

A mayor desviación estándar ($\sigma$) mayor será la variabilidad en los datos.

.
.
Ejemplos de distribución normal en la vida cotidiana

made with 💚 by pahoalapizco

Existen numerosos ejemplos de distribuciones que difieren de la distribución normal. A continuación, te proporcionaré algunos ejemplos comunes de distribuciones no normales:

Distribución uniforme: En una distribución uniforme, todos los valores posibles tienen la misma probabilidad de ocurrencia. Un ejemplo podría ser el lanzamiento de un dado justo de seis caras, donde cada número del 1 al 6 tiene la misma probabilidad de aparecer.

Distribución exponencial: La distribución exponencial se utiliza para modelar el tiempo entre eventos sucesivos e independientes que ocurren a una tasa constante. Por ejemplo, el tiempo que transcurre entre dos llegadas consecutivas de autobuses en una parada podría seguir una distribución exponencial.

Distribución binomial: La distribución binomial se utiliza para modelar el número de éxitos en una secuencia de ensayos independientes, donde cada ensayo tiene dos posibles resultados (éxito o fracaso) con una probabilidad fija. Por ejemplo, el número de caras obtenidas al lanzar una moneda justo varias veces sigue una distribución binomial.

Distribución de Poisson: La distribución de Poisson se utiliza para modelar la ocurrencia de eventos raros e independientes en un intervalo de tiempo o espacio. Por ejemplo, el número de llamadas telefónicas que llegan a una centralita en un minuto podría seguir una distribución de Poisson.

Distribución gamma: La distribución gamma se utiliza para modelar el tiempo de espera hasta que ocurra un determinado número de eventos en un proceso de Poisson. Por ejemplo, el tiempo que tarda en llegar un cierto número de clientes a un mostrador de servicio podría seguir una distribución gamma.

Estos son solo algunos ejemplos de distribuciones no normales. En la práctica, es común encontrar datos que siguen distribuciones distintas a la normal, y es importante utilizar técnicas estadísticas apropiadas para analizar y comprender adecuadamente estos conjuntos de datos.

Un ejemplo de distribucion normal, seria la edad en que las personas deciden casarse y/o tener hijos, biologicamente hablando, segun estudios científicos la edad optima para tener el menor riesgo de complicaciones en el embarazo y en el postparto es entre los 25 y los 29,9 años, teniendo en cuenta el descenso de la natalidad adolescente y planificacion activa del embazaro en paises del primer mundo, asi como embarazos adolescentes de alta incidencia en paises no pertenecientes al primer mundo, creo que mas o menos se adaptaria a una distribucion normal en que la edad media debe estar rondando quizas no los 29 años, pero si debe estar cercana a los 25.

https://www.nationalgeographic.com.es/mundo-ng/natalidad-mundo-madres-mas-mayores-y-menos-prolificas_11118

El tamaño de las alas de las moscas también sigue una distribución normal

Otros casos de uso

  • Los datos antropométricos en los seres humanos
  • Crecimiento de las plantas
  • El consumo de petróleo, gas, electricidad, de una ciudad, un pais, en un determinado periodo de tiempo

El peso de los bebes al nacer y la duración del embarazo.

La edad de alumnos que estudian una carrera universitaria.