Misma pregunta que unas clases anteriores, esto tambien podria pasarlo a un archivo dentro de utils?
Introducción a los valores faltantes
¿Por qué explorar y lidiar con valores faltantes?
Operaciones con valores faltantes
Conociendo datasets para manejo de datos faltantes
Correr una notebook dentro de otra en Deepnote
Extendiendo la API de Pandas
Tabulación de valores faltantes
Visualización de valores faltantes
Manipulación inicial de valores faltantes
Codificación de valores faltantes
Conversión de valores faltantes implícitos en explícitos
Exponer filas faltantes implícitas en explícitas
Tipos de valores faltantes
MCAR, MAR, MNAR en Python
Búsqueda de relaciones de valores faltantes
Matriz de sombras: shadow matrix
Visualización de valores faltantes en una variable
Visualización de valores faltantes en dos variables
Scatterplot con valores faltantes
Correlación de nulidad
Tratamiento de valores faltantes
Eliminación de valores faltantes: pairwise y listwise
Imputación básica de datos
Bonus: visualización múltiple de imputaciones
Cierre de curso
Continúa aprendiendo sobre el manejo de valores faltantes
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.
Antes: $249
Paga en 4 cuotas sin intereses
Termina en:
Jesús Vélez Santiago
Aportes 4
Preguntas 0
Misma pregunta que unas clases anteriores, esto tambien podria pasarlo a un archivo dentro de utils?
Truchas porque en el 1er gráfico no sale cuántos valores fueron imputados. Curiosamente, si quitas el parámetro common_bins
hace que aparezcan. Le estuve intentando si pudiera arreglarlo pero no, a ver si alguien puede hacerlo en el futuro.
Código de visualización múltiple de imputaciones
(
riskfactors_df
.select_columns("weight_lbs","height_inch","bmi")
.missing.bind_shadow_matrix(true_string=True,false_string=False)
.apply(
axis="rows",
func = lambda column : column.fillna(column.mean()) if "_NA" not in column.name else column
)
.pivot_longer(
index="*_NA"
)
.pivot_longer(
index=["variable","value"],
names_to="variable_NA",
values_to="value_NA"
)
.assign(
valid=lambda df : df.apply(axis="columns", func= lambda column : column.variable in column.variable_NA)
)
.query("valid")
.pipe(
lambda df:(
sns.displot(
data=df,
x="value",
hue="value_NA",
col="variable",
common_bins=False,
facet_kws={
"sharex":False,
"sharey":False
}
)
)
)
)
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?