Filtrado por condiciones
Clase 16 de 24 • Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Resumen
Funciona por lógica booleana y retorna los valores que están en “True”. Es muy útil porque en ocasiones queremos filtrar o separar datos.
- Llamamos los datos de un archivo csv para manejarlos
df_books = pd.read_csv('bestsellers-with-categories.csv')
df_books.head(2) ---> #muestra los primeros dos registros del dataFrame
- Mostrar datos que sean mayores a cierto valor
mayor2016 = df_books['Year'] > 2016
mayor2016
---> #muestra el dataFrame con valores booleanos. True para libros publicados desde el 2017
- Filtrar datos en nuestro DataFrame que sean mayores a cierto valor
df_books[mayor2016]
---> #filtra los datos que cumplen con la condicion
- También se puede colocar la condición directamente como parámetro
df_books[df_books['Year'] > 2016]
---> #filtra los datos que cumplen con la condicion
- Mostrar los datos que sean igual a cierto valor
genreFiction = df_books['Genre'] == 'Fiction'
genreFiction ---> #muestra el dataFrame con valores booleanos. True para libros de tipo Fiction
- Filtrado con varias condiciones
df_books[genreFiction & mayor2016]
---> #Filtra los libros que sean de tipo Fiction y que hayan sido publicado desde 2017
- Filtrado con negación
df_books[~mayor2016]
---> #Filtra los libros publicados antes o igual al 2016
Contribución creada por: Edward Giraldo.