Una estrategia que resulta ser bastante común y útil en ciertas ocasiones, aunque se debe tener cuidado de si tiene sentido aplicarla, es eliminar las filas o columnas que tengan valores nan. una manera sencilla de hacerlo es:
''' para el data frame meteoritos(df), por ejemplo la variable masa tiene valores nan, esto lo podemos ver haciendo primero viendo que variables tienen valores nan.'''
df.isna().any()
''' si nos concetramos en la variable masa, veremos la cantidad de
nan's que se tienen.'''
df['masa'].isna().value_counts()
''' ahora si se quiere borrar los nan hacemos:'''
df['masa']=df['masa].dropna()
''' si queremos borrar los nan de todas las variables
axis=0 para filas y 1 para borrar columnas con nan
how = 'any' o 'all'. el primero borra la fila o columna si algunas entradas tienen nan, el segundo solo la borra si todos los valores son nan'''
df.dropna(axis= , how=)
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.