Filtrado por condiciones
Clase 16 de 24 • Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Contenido del curso
NumPy
Pandas
- 11

Series y DataFrames en Pandas
12:14 min - 12

Leer archivos CSV y JSON con Pandas
08:21 min - 13

Filtrado con loc y iloc
09:25 min - 14

Agregar o eliminar datos con Pandas
11:52 min - 15

Manejo de datos nulos
08:12 min - 16

Filtrado por condiciones
Viendo ahora - 17

Funciones principales de Pandas
09:34 min - 18

groupby
10:15 min - 19

Combinando DataFrames
03:58 min - 20

Merge y Concat
14:20 min - 21

Join
05:12 min - 22
Pivot y Melt
01:51 min - 23

Apply
07:41 min Quiz Pandas
Cierre
Resumen
Funciona por lógica booleana y retorna los valores que están en “True”. Es muy útil porque en ocasiones queremos filtrar o separar datos.
- Llamamos los datos de un archivo csv para manejarlos
df_books = pd.read_csv('bestsellers-with-categories.csv')
df_books.head(2) ---> #muestra los primeros dos registros del dataFrame
- Mostrar datos que sean mayores a cierto valor
mayor2016 = df_books['Year'] > 2016
mayor2016
---> #muestra el dataFrame con valores booleanos. True para libros publicados desde el 2017
- Filtrar datos en nuestro DataFrame que sean mayores a cierto valor
df_books[mayor2016]
---> #filtra los datos que cumplen con la condicion
- También se puede colocar la condición directamente como parámetro
df_books[df_books['Year'] > 2016]
---> #filtra los datos que cumplen con la condicion
- Mostrar los datos que sean igual a cierto valor
genreFiction = df_books['Genre'] == 'Fiction'
genreFiction ---> #muestra el dataFrame con valores booleanos. True para libros de tipo Fiction
- Filtrado con varias condiciones
df_books[genreFiction & mayor2016]
---> #Filtra los libros que sean de tipo Fiction y que hayan sido publicado desde 2017
- Filtrado con negación
df_books[~mayor2016]
---> #Filtra los libros publicados antes o igual al 2016
Contribución creada por: Edward Giraldo.