Funciones principales de Pandas
Clase 17 de 24 • Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Contenido del curso
NumPy
Pandas
- 11

Series y DataFrames en Pandas
12:14 min - 12

Leer archivos CSV y JSON con Pandas
08:21 min - 13

Filtrado con loc y iloc
09:25 min - 14

Agregar o eliminar datos con Pandas
11:52 min - 15

Manejo de datos nulos
08:12 min - 16

Filtrado por condiciones
05:42 min - 17

Funciones principales de Pandas
Viendo ahora - 18

groupby
10:15 min - 19

Combinando DataFrames
03:58 min - 20

Merge y Concat
14:20 min - 21

Join
05:12 min - 22
Pivot y Melt
01:51 min - 23

Apply
07:41 min
Cierre
Resumen
Hay ciertas funciones que son muy importantes y que siempre estaremos usando a la hora de hacer análisis de datos, para mayor facilidad y comprensión del DataFrame.
- Mostrar las primeras dos líneas de registro
df_books.head(2)
---> #muestra los primeros dos registros del dataFrame
- Mostrar los diferentes datos que contiene el DataFrame
df_books.info()
---> py
RangeIndex: 550 entries, 0 to 549 #numero de registro
Data columns (total 7 columns): #total de columnas
# Column Non-Null Count Dtype #tipos de cada columna
--- ------ -------------- -----
0 Name 550 non-null object
1 Author 550 non-null object
2 User Rating 550 non-null float64
3 Reviews 550 non-null int64
4 Price 550 non-null int64
5 Year 550 non-null int64
6 Genre 550 non-null object
dtypes: float64(1), int64(3), object(3)
- Obtener diferentes datos estadísticos de las columnas numéricas.
df_books.describe()
---> User.Rating Reviews Price Year
count 550 550 550 550
mean 4.618 11953.281 13.1 2014
std 0.226 11731.132 10.84 3.165
min 3.3 37 0 2009
25% 4.5 4058 7 2011
50% 4.7 8580 11 2014
75% 4.8 17253.25 16 2017
max 4.9 87841 105 2019
- Mostrar los últimos 5 registros del DataFrame
df_books.tail()
---> #muestra los ultimos 5 registros
- Obtener el uso de la memoria de cada columna
df_books.memory_usage(deep=True)
--->
Index 128
Name 59737
Author 39078
User Rating 4400
Reviews 4400
Price 4400
Year 4400
Genre 36440
dtype: int64
- Obtener cuantos datos tenemos de algo en específico
df_books['Author'].value_counts()
---> Muestra cuantos datos hay de cada autor
- Eliminar registros duplicados
df_books.drop_duplicates()
- Ordenar los registros según valores de la columna (orden ascendente)
df_books.sort_values('Year')
---> #ordena los valores de menor a mayor segun el año
- Ordenar los registros según valores de la columna (orden descendente)
df_books.sort_values('Year', ascending=False)
---> #ordena los valores de mayor a menor segun el año
Reto
En este artículo de Pandas podrás encontrar las funciones más usadas
- Carga un DataSet de tu preferencia e implementa estas funciones y cuéntanos cuál te ha parecido más interesante
Contribución creada por: Edward Giraldo.