Estadística descriptiva aplicada: funciones de densidad de probabilidad

Curso de Análisis Exploratorio de Datos

Contenido del curso

Introducción al análisis exploratorio de datos

Análisis univariado

Análisis bivariado

Análisis multivariado

Conclusiones

Tomar examen

Estadística descriptiva aplicada: funciones de densidad de probabilidad

Gabriel Obregón

Estudiante

FUNCIONES DE DENSIDAD DE PROBABILIDAD

1.Gráfico de Estimación de Densidad (KDE) para flipper_length_mm sns.kdeplot(data=processed_penguins_df, x='flipper_length_mm')

Descripción: Genera un gráfico de estimación de densidad (KDE) para la variable flipper_length_mm del conjunto de datos processed_penguins_df. La KDE proporciona una estimación suave de la función de densidad de probabilidad.
Salida: El gráfico muestra la densidad de valores de flipper_length_mm, donde el eje x representa la longitud de las aletas en milímetros y el eje y la densidad.

2.Gráfico de Densidad para flipper_length_mm (con ajuste de ancho de banda) sns.kdeplot(data=processed_penguins_df, x='flipper_length_mm', bw_adjust=0.5)

Descripción: Similar al anterior, pero ajusta el ancho de banda (suavidad) del KDE con bw_adjust=0.5. Un ancho de banda menor genera una curva de densidad menos suave.
Salida: Un gráfico de densidad con mayor sensibilidad a las variaciones en los datos.

3.Resumen Estadístico de body_mass_gstats = processed_penguins_df.body_mass_g.describe()

Descripción: Calcula estadísticas descriptivas (conteo, media, desviación estándar, mínimo, cuartiles y máximo) para la variable body_mass_g del conjunto de datos.
Salida: Muestra las estadísticas de resumen del peso corporal en gramos.

4.Generar Valores Espaciados Linealmente para body_mass_g xs = np.linspace(stats['min'], stats['max'])

Descripción: Crea un arreglo de valores uniformemente espaciados entre el mínimo y el máximo del peso corporal, utilizado para cálculos estadísticos posteriores.

5.Función de Distribución Acumulativa (CDF) ys = scipy.stats.norm(stats['mean'], stats['std']).cdf(xs)

Descripción: Calcula la CDF de una distribución normal con la media y desviación estándar de body_mass_g para cada valor en xs.

6.Gráfico de CDF Empírica y Teóricaempirical = processed_penguins_df.body_mass_g

plt.plot(xs, ys, color='black', linestyle='dashed')

empirical.cdf(plot=True, normalize=True)

Descripción:
- Dibuja la CDF teórica de body_mass_g (línea discontinua negra).
- Superpone la CDF empírica calculada a partir del conjunto de datos para comparación.
Salida: Un gráfico que compara las funciones de distribución acumulativa teórica y empírica.

**7.Comparación de Función de Densidad de Probabilidad (PDF)**ys = scipy.stats.norm(stats['mean'], stats['std']).pdf(xs)

sns.kdeplot(data=processed_penguins_df, x='body_mass_g')

Descripción:
- Calcula la PDF teórica de body_mass_g basada en una distribución normal.
- La superpone con el gráfico de densidad KDE de la variable body_mass_g.
Salida: Un gráfico combinado que muestra las curvas de densidad teórica y empírica.

Estadística descriptiva aplicada: funciones de densidad de probabilidad

Introducción al análisis exploratorio de datos

¿Qué es y para qué sirve el análisis exploratorio de datos?

¿Cómo hacer un análisis exploratorio de datos?

Tipos de análisis de datos

Tipos de datos y análisis de variables

Herramientas de software para el análisis exploratorio de datos

Conociendo nuestros datos: palmerpenguins

Recolección de datos, limpieza y validación

Ejercicio de validación de datos

Análisis univariado

Explorando una variable categórica: conteos y proporciones

Estadística descriptiva aplicada: medidas de tendencia central

Estadística descriptiva aplicada: medidas de dispersión

Ejercicio de obtención de medidas de dispersión

Estadística descriptiva aplicada: distribuciones