Ejercicio de obtención de medidas de dispersión

Curso de Análisis Exploratorio de Datos

Contenido del curso

Introducción al análisis exploratorio de datos

Análisis univariado

Análisis bivariado

Análisis multivariado

Conclusiones

Tomar examen

Ejercicio de obtención de medidas de dispersión

Carlos Mazzaroli

Estudiante

Aca visualizamos la distribucion de las distintas caracteristicas por especie

numeric_columns = penguins_df.select_dtypes(include=np.number).columns

fig,ax = plt.subplots(1,len(numeric_columns), figsize=(15,5))

for i in range(len(numeric_columns)):
    sns.histplot( 
        ax=ax[i],
        data=penguins_df,
        x=numeric_columns[i],
        multiple='stack',
        hue='species',
        bins=15,
        palette=penguin_color,
        kde=True,
        )

Aca visualizamos una caracteristica en especifico con su media respectiva, cuantiles y ya separadas las especies

species = penguins_df.species.unique()

adelie_df = penguins_df.query("species == 'Adelie'")
gentoo_df = penguins_df.query("species == 'Gentoo'")
chinstrap_df = penguins_df.query("species == 'Chinstrap'")

list = [adelie_df,gentoo_df,chinstrap_df]

fig,ax = plt.subplots(1,len(list), figsize=(15,5), sharey=True)

for i in range(len(list)):
    sns.histplot( 
        ax=ax[i],
        data=list[i],
        x='flipper_length_mm',
        multiple='layer',
        hue='species',
        bins=15,
        kde=True,
        palette=penguin_color,
        )

    ax[i].axvline(
        x=list[i]['flipper_length_mm'].mean(),
        color='red'
        )

    ax[i].axvline(
        x=list[i]['flipper_length_mm'].quantile(.25),
        color='blue'
        )

    ax[i].axvline(
        x=list[i]['flipper_length_mm'].quantile(.75),
        color='blue'
        )```

Naren Fragozo

Estudiante

numeric_columns = df_preprocess_penguins.select_dtypes(include=np.number).columns

fig, ax = plt.subplots(1, len(numeric_columns), figsize=(24,5))

for i, col in enumerate(numeric_columns):
    sns.histplot(
        data=df_preprocess_penguins,
        ax=ax[i],
        x=col,
        hue="species",
        binwidth=1,
        bins="auto",
        kde=True,
        alpha=.5,
        element="step",
        common_norm=False,
        stat="density",
    )
    
    ax[i].set_title(col)
    ax[i].set_xlabel(None)
    ax[i].set_ylabel("Density")

plt.tight_layout()

Jhon Edward Bedoya

Fernando Jesús Núñez Valdez

Eduardo Hoppenstedt

Profesor

Jeinfferson Bernal G

Miguel Sánchez Guerrero

Marlon Yuleison Mosquera Sánchez

Christian Rangel

Yonatan Efraín Jara Boza

Sergei Beltran

Roger Christian Cansaya Olazabal

Mauricio Escobar

María Eugenia Pereira Chévez

María José Medina

Jeison Esteban Gaviria Moncayo

Daniela Mendoza Redondo

sebastián Giraldo Vargas

Juan R. Vergara M.

Alfonso Andres Zapata Guzman

Diego Cesar Lerma Torres

Nestor Enrique Martínez Guillén

Laura Juliana Piraneque Esquivel

Daniel Castañeda

Ejercicio de obtención de medidas de dispersión

Introducción al análisis exploratorio de datos

¿Qué es y para qué sirve el análisis exploratorio de datos?

¿Cómo hacer un análisis exploratorio de datos?

Tipos de análisis de datos

Tipos de datos y análisis de variables

Herramientas de software para el análisis exploratorio de datos

Conociendo nuestros datos: palmerpenguins

Recolección de datos, limpieza y validación

Ejercicio de validación de datos

Análisis univariado

Explorando una variable categórica: conteos y proporciones

Estadística descriptiva aplicada: medidas de tendencia central

Estadística descriptiva aplicada: medidas de dispersión