Aprende todo un fin de semana sin pagar una suscripci贸n 馃敟

Aprende todo un fin de semana sin pagar una suscripci贸n 馃敟

Reg铆strate

Comienza en:

3D
4H
8M
1S

Operaciones con valores faltantes

2/21
Recursos

Aportes 8

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

si al importar janitor les devuelve un error 鈥榯ype鈥

!pip uninstall pyjanitor --yes

y vuelvan a instalarlo pero agreguenle la versi贸n

!pip install pyjanitor==0.23.1

ahi vulven a importar y ya en teor铆a les tendr铆a que funcionar 鉂わ笍

Operaciones con valores faltantes

Aprender otro idioma no es solo aprender diferentes palabras para las mismas cosas, sino aprender otra forma de pensar sobre las cosas

  • En Python, None no tiene definido operaciones con valores numericos, booleanos鈥 Ademas al comparar los None (==) 贸 utilizar la funcion is, arroja True
  • En Numpy, los valores faltantes se representan con nan y tienen definido operaciones con valores numericos ya que es de tipo float. Por otro lado, al comparar los None arroja False es decir, que no son el mismo objeto y al compararlos mediante la funcion is arroja True es decir que un nan esta contenido en otro nana. Tener cuidado
  • En Pandas, existen varias maneras de representar los valores faltantes (nan, <NA>, None)

Funciones para buscar valores nulos en Pandas

nombre_df.isna()
nombre_df.isnull()

Buscar valores faltantes en una columna del DataFrame

nombre_df.nombre_columna.isnull()

El curso que faltaba

Aproveche para poner en practica lo aprendido en el curso de entornos de trabajos (cookiecutter) para crear la estructura de carpetas y trabajar mis notebooks desde VSC, no tuve problemas como en deepnote

== >>True cuando son iguales.
IS >>True cuando ambos apuntan al mismo objeto.

np.nan == np.nan # is always False! Use special numpy functions instead.

(10:15) El que 鈥楴one鈥 en la columna 鈥榵鈥 cambio a 鈥榥an鈥 mientras que en la columna 鈥榶鈥 se mantiene como 鈥楴one鈥欌 esta conectado en c贸mo pandas interpreta la columna (en este caso 鈥榝loat64鈥 y 鈥榦bject鈥).

E interpretar谩 como 鈥榦bject鈥 mientras que uno de sus elementos sea un objeto de pandas como pd. NA o pd.NaT.

Sin embargo todos son interpretados por pandas como 鈥榤issing values鈥 o 鈥榲alores faltantes鈥 (a pesar que 鈥榥one鈥 significa 鈥榥inguno鈥, 鈥榥an鈥 significa 鈥榥ot an number鈥). PD: 鈥楴A鈥 significa 鈥榥ot available鈥 o 鈥榥o disponible鈥.

CODIGO DE PANDAS

test_missing_df = pd.DataFrame.from_dict(
    data=dict(
        x=[0, 1, np.nan, np.nan, None],
        y=[0, 1, pd.NA, np.nan, None]
    )
)

Es curso mas nuevo en mis dos a帽os en platzi