Join
Clase 21 de 24 • Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Contenido del curso
NumPy
Pandas
- 11

Series y DataFrames en Pandas
12:14 min - 12

Leer archivos CSV y JSON con Pandas
08:21 min - 13

Filtrado con loc y iloc
09:25 min - 14

Agregar o eliminar datos con Pandas
11:52 min - 15

Manejo de datos nulos
08:12 min - 16

Filtrado por condiciones
05:42 min - 17

Funciones principales de Pandas
09:34 min - 18

groupby
10:15 min - 19

Combinando DataFrames
03:58 min - 20

Merge y Concat
14:20 min - 21

Join
Viendo ahora - 22
Pivot y Melt
01:51 min - 23

Apply
07:41 min Quiz Pandas
Cierre
Resumen
Join Es otra herramienta para hacer exactamente lo mismo, una combinación. La diferencia es que join va a ir a los índices y no a columnas específicas.
izq = pd.DataFrame({'A': ['A0','A1','A2'],
'B':['B0','B1','B2']},
index=['k0','k1','k2'])
der =pd.DataFrame({'C': ['C0','C1','C2'],
'D':['D0','D1','D2']},
index=['k0','k2','k3'])
- Combinamos
izqconder
izq.join(der)
---> A B C D
k0 A0 B0 C0 D0
k1 A1 B1 nan nan
k2 A2 B2 C1 D1
- Traer todos los datos aunque no hagan match.
izq.join(der, how = 'outer')
---> A B C D
k0 A0 B0 C0 D0
k1 A1 B1 nan nan
k2 A2 B2 C1 D1
k3 nan nan C2 D2
Pregunta:
En temas de performance y velocidad, ¿cuál es mejor el Merge o el Join, cuando se trata de miles de registros?
@gustavomp, Platzinauta
Respuesta:
join suele ser mejor
@alarcon7a, Profe Platzi
Contribución creada por: Edward Giraldo.