Join
Clase 21 de 24 • Curso de Manipulación y Transformación de Datos con Pandas y NumPy
Resumen
Join
Es otra herramienta para hacer exactamente lo mismo, una combinación. La diferencia es que join va a ir a los índices y no a columnas específicas.
izq = pd.DataFrame({'A': ['A0','A1','A2'],
'B':['B0','B1','B2']},
index=['k0','k1','k2'])
der =pd.DataFrame({'C': ['C0','C1','C2'],
'D':['D0','D1','D2']},
index=['k0','k2','k3'])
- Combinamos
izq
conder
izq.join(der)
---> A B C D
k0 A0 B0 C0 D0
k1 A1 B1 nan nan
k2 A2 B2 C1 D1
- Traer todos los datos aunque no hagan match.
izq.join(der, how = 'outer')
---> A B C D
k0 A0 B0 C0 D0
k1 A1 B1 nan nan
k2 A2 B2 C1 D1
k3 nan nan C2 D2
Pregunta:
En temas de performance y velocidad, ¿cuál es mejor el Merge o el Join, cuando se trata de miles de registros?
@gustavomp, Platzinauta
Respuesta:
join suele ser mejor
@alarcon7a, Profe Platzi
Contribución creada por: Edward Giraldo.