No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Aprende Inglés, Programación, AI, Ciberseguridad y mucho más.

Antes: $249

Currency
$209
Suscríbete

Termina en:

4 Días
10 Hrs
16 Min
43 Seg

Bonus: visualización múltiple de imputaciones

20/21
Recursos

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Misma pregunta que unas clases anteriores, esto tambien podria pasarlo a un archivo dentro de utils?

Truchas porque en el 1er gráfico no sale cuántos valores fueron imputados. Curiosamente, si quitas el parámetro common_bins hace que aparezcan. Le estuve intentando si pudiera arreglarlo pero no, a ver si alguien puede hacerlo en el futuro.

Código de visualización múltiple de imputaciones

(
    riskfactors_df
    .select_columns("weight_lbs","height_inch","bmi")
    .missing.bind_shadow_matrix(true_string=True,false_string=False)
    .apply(
        axis="rows",
        func = lambda column : column.fillna(column.mean()) if "_NA" not in column.name else column
    )
    .pivot_longer(
        index="*_NA"
    )
    .pivot_longer(
        index=["variable","value"],
        names_to="variable_NA",
        values_to="value_NA"
    )
    .assign(
        valid=lambda df : df.apply(axis="columns", func= lambda column : column.variable in column.variable_NA)
    )
    .query("valid")
    .pipe(
        lambda df:(
            sns.displot(
                data=df,
                x="value",
                hue="value_NA",
                col="variable",
                common_bins=False,
                facet_kws={
                    "sharex":False,
                    "sharey":False
                }
            )
        )
    )
)