si al importar janitor les devuelve un error ‘type’
!pip uninstall pyjanitor --yes
y vuelvan a instalarlo pero agreguenle la versión
!pip install pyjanitor==0.23.1
–
ahi vulven a importar y ya en teoría les tendría que funcionar ❤️
Introducción a los valores faltantes
¿Por qué explorar y lidiar con valores faltantes?
Operaciones con valores faltantes
Conociendo datasets para manejo de datos faltantes
Correr una notebook dentro de otra en Deepnote
Extendiendo la API de Pandas
Tabulación de valores faltantes
Visualización de valores faltantes
Manipulación inicial de valores faltantes
Codificación de valores faltantes
Conversión de valores faltantes implícitos en explícitos
Exponer filas faltantes implícitas en explícitas
Tipos de valores faltantes
MCAR, MAR, MNAR en Python
Búsqueda de relaciones de valores faltantes
Matriz de sombras: shadow matrix
Visualización de valores faltantes en una variable
Visualización de valores faltantes en dos variables
Scatterplot con valores faltantes
Correlación de nulidad
Tratamiento de valores faltantes
Eliminación de valores faltantes: pairwise y listwise
Imputación básica de datos
Bonus: visualización múltiple de imputaciones
Cierre de curso
Continúa aprendiendo sobre el manejo de valores faltantes
Aportes 8
Preguntas 1
si al importar janitor les devuelve un error ‘type’
!pip uninstall pyjanitor --yes
y vuelvan a instalarlo pero agreguenle la versión
!pip install pyjanitor==0.23.1
–
ahi vulven a importar y ya en teoría les tendría que funcionar ❤️
Aprender otro idioma no es solo aprender diferentes palabras para las mismas cosas, sino aprender otra forma de pensar sobre las cosas
nombre_df.isna()
nombre_df.isnull()
nombre_df.nombre_columna.isnull()
El curso que faltaba
Aproveche para poner en practica lo aprendido en el curso de entornos de trabajos (cookiecutter) para crear la estructura de carpetas y trabajar mis notebooks desde VSC, no tuve problemas como en deepnote
== >>True cuando son iguales.
IS >>True cuando ambos apuntan al mismo objeto.
np.nan == np.nan # is always False! Use special numpy functions instead.
(10:15) El que ‘None’ en la columna ‘x’ cambio a ‘nan’ mientras que en la columna ‘y’ se mantiene como ‘None’… esta conectado en cómo pandas interpreta la columna (en este caso ‘float64’ y ‘object’).
E interpretará como ‘object’ mientras que uno de sus elementos sea un objeto de pandas como pd. NA o pd.NaT.
Sin embargo todos son interpretados por pandas como ‘missing values’ o ‘valores faltantes’ (a pesar que ‘none’ significa ‘ninguno’, ‘nan’ significa ‘not an number’). PD: ‘NA’ significa ‘not available’ o ‘no disponible’.
CODIGO DE PANDAS
test_missing_df = pd.DataFrame.from_dict(
data=dict(
x=[0, 1, np.nan, np.nan, None],
y=[0, 1, pd.NA, np.nan, None]
)
)
Es curso mas nuevo en mis dos años en platzi
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.