Aprende todo un fin de semana sin pagar una suscripción 🔥

Aprende todo un fin de semana sin pagar una suscripción 🔥

Regístrate

Comienza en:

3D
4H
8M
1S

Operaciones con valores faltantes

2/21
Recursos

Aportes 8

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

si al importar janitor les devuelve un error ‘type’

!pip uninstall pyjanitor --yes

y vuelvan a instalarlo pero agreguenle la versión

!pip install pyjanitor==0.23.1

ahi vulven a importar y ya en teoría les tendría que funcionar ❤️

Operaciones con valores faltantes

Aprender otro idioma no es solo aprender diferentes palabras para las mismas cosas, sino aprender otra forma de pensar sobre las cosas

  • En Python, None no tiene definido operaciones con valores numericos, booleanos… Ademas al comparar los None (==) ó utilizar la funcion is, arroja True
  • En Numpy, los valores faltantes se representan con nan y tienen definido operaciones con valores numericos ya que es de tipo float. Por otro lado, al comparar los None arroja False es decir, que no son el mismo objeto y al compararlos mediante la funcion is arroja True es decir que un nan esta contenido en otro nana. Tener cuidado
  • En Pandas, existen varias maneras de representar los valores faltantes (nan, <NA>, None)

Funciones para buscar valores nulos en Pandas

nombre_df.isna()
nombre_df.isnull()

Buscar valores faltantes en una columna del DataFrame

nombre_df.nombre_columna.isnull()

El curso que faltaba

Aproveche para poner en practica lo aprendido en el curso de entornos de trabajos (cookiecutter) para crear la estructura de carpetas y trabajar mis notebooks desde VSC, no tuve problemas como en deepnote

== >>True cuando son iguales.
IS >>True cuando ambos apuntan al mismo objeto.

np.nan == np.nan # is always False! Use special numpy functions instead.

(10:15) El que ‘None’ en la columna ‘x’ cambio a ‘nan’ mientras que en la columna ‘y’ se mantiene como ‘None’… esta conectado en cómo pandas interpreta la columna (en este caso ‘float64’ y ‘object’).

E interpretará como ‘object’ mientras que uno de sus elementos sea un objeto de pandas como pd. NA o pd.NaT.

Sin embargo todos son interpretados por pandas como ‘missing values’ o ‘valores faltantes’ (a pesar que ‘none’ significa ‘ninguno’, ‘nan’ significa ‘not an number’). PD: ‘NA’ significa ‘not available’ o ‘no disponible’.

CODIGO DE PANDAS

test_missing_df = pd.DataFrame.from_dict(
    data=dict(
        x=[0, 1, np.nan, np.nan, None],
        y=[0, 1, pd.NA, np.nan, None]
    )
)

Es curso mas nuevo en mis dos años en platzi