No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Merge de DataFrames

16/28
Recursos

Aportes 37

Preguntas 9

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Por si alguien necesita:
los df_left y df_right:

df_left = pd.DataFrame(
    {'X':['x0','x1','x2','x3'],
    'W':['w0','w1','w2','w3'],
    'Y':['y0','y1','y2','y3'],
    'Mix':['y2','y3','a2','a3']},
    index = ['y2','y3','a2','a3'])

df_right = pd.DataFrame(
    {'Z':['z2','z3','z4','z5'],
     'A':['a2','a3','a4','a5'],
     'Y':['y2','y3','y4','y5']},
    index = [2,3,4,5])

¿Por que no crear un Df y concatenarlo con algo que tenga sentido logico para potenciar el aprendizaje, un caso real con pocas columnas?
Dejar tal vez un ejercicio de practica en cada video. Personalmente siento que tengo que complementar mucho estos videos con tutoriales en youtube o en otras plataformas.

el link de la imagen del minuto 4:22

![](http://www.datasciencemadesimple.com/wp-content/uploads/2017/09/join-or-merge-in-python-pandas-1.png)

La figura de David para los apuntes

vaya la verdad me gustaban mucho las primeras clases cunado usabamos bases de datos reales. Ahora solo usan ejemplos que ni siquiera tienen sentido 😦
Me parecía uno de los mejores cursos de platzi hasta que llegamos a estas clases

Deberían usar Datos con sentido… no como el de esta clase que solo son letras… el uso de estos datos sin sentido AUMENTA la CARGA COGNITIVA de los alumnos

Excelente, funciona como SQL

No me quedó del todo claro el uso de esta función merge! Creo que deberían explicarlo haciendo el ejemplo que dio al final con llaves primarias y foraneas en vez de estos DataFrames aleatorios.

Con esta clase estoy entendiendo mas la estructura y le mecanismo de las consultas de las relaciones de las bases de datos con los JOIN

  • INNER
  • RIGHT
  • LEFT
  • CROSS

Gracias…

¿Qué vamos a aprender en esta clase?

Vamos a aprender a unificar dos Dataframes a través de un parámetro en común, esto usando la función merge.

Nota: Cuando un científico de datos analiza varios fuentes de información es ideal juntarlos por medio de estos parámetros ya que normalmente en las bases de datos las llaves están correlacionadas a través de llaves primarias y llaves secundarias.

![](

Me encantó el parámetro para los sufijos! Siempre había sufrido con eso ❤️.

Todas estas clases deberian ser explicadas con ejemplos que tengas sentido, realizar comandos sobre valores sin sentido no es lo mas didáctico

super interesante

¿Qué vamos a aprender en esta clase?

Vamos a aprender a como hacer Merge entre 2 dataframes, esta es un tipo de concatenación que se da cuando 2 dataframes contienen una columna en común, esto es muy útil cuando se tiene fuentes de datos diferentes y se quieren unificar dentro de un parámetro que se comparte entre ella.

Tipos de merge

con estos ejemplitos es super duro entender, veníamos bien, y en contexto ya no se está explicando tan bien. Qué esfuerzo tan grande tuve que hacer para entender merge, toca documentarse mucho por afuera y esa no es la idea, se supone que pago yo mi suscipción para poder tener información de calidad en un solo lugar. Ojo con los contenidos, por eso aveces toca recurrir a udemy.

Recomendado comprender primero cómo funcionan los Joins en bases de datos relacionales.
Les aseguro que les puede hacer mucho más fácil el comprender la información de esta clase.

UN EJEMPLO REAL

Tenía la duda si esto podría ayudarme con un caso real en mi día a día, suponiendo que quisiera automatizar un proceso en excel MERGE() SI PUEDE HACER LA FUNCIÓN DE UN VLOOKUP, en el siguiente enlace hay una explicación sencilla y objetiva que explica muchísimo mejor esta clase (para mi).

How to do a vlookupo in python using pandas (Merge)

https://www.geeksforgeeks.org/how-to-do-a-vlookup-in-python-using-pandas/

Haber llevado el curso de fundamentos de bases de datos antes, me ayudo a entender mejor el porque el profesor usa inner merge. Recomiendo que le den un vistazo a esta clase
https://platzi.com/clases/1566-bd/19819-from/
aunque este lo hace para SQL, los fundamentos son los mismos.

  • Dado que es poco intuitivo el uso de variables tipo x1, x2, etc, les recomiendo usar DataFrames con datos que nos den más sentido. Por ejemplo pueden ejecutar todas las funciones de la clase con este ejemplo que hice:
  • DataFrames:

df_left = pd.DataFrame(
                      {'Nombre': ['Juan', 'Gabriela', 'David', 'Camila'],
                        'Membresía': ['1', '2', '3', '4'], 
                        'Curso': ['Data', 'Web', 'Backend', 'Marketing'],
                        'Mix': ['Backend', 'Marketing', 'Café', 'Vino'] },
                       index=[0,1,2,3])
df_left

df_right = pd.DataFrame(
                       {'Hora': ['02:00', '03:00', '04:00', '05:00'],
                         'Bebida': ['Te', 'Aromática', 'Café', 'Vino'], 
                         'Curso': ['Backend', 'Marketing', 'Blandas', 'Proyectos'] },
                        index=[2,3,4,5])
df_right

 
  • Y el df_left del final:

df_left = pd.DataFrame(
                      {'Nombre': ['Juan', 'Gabriela', 'David', 'Camila'],
                        'Membresía': ['1', '2', '3', '4'], 
                        'Curso': ['Data', 'Web', 'Backend', 'Marketing'],
                        'Hora': ['00:00', '01:00', '02:00', '03:00'],},
                       index=[0,1,2,3])
df_left

Un curso muy recomendado para aprender todo lo relacionado con Bases de Datos es el “Curso de Fundamentos de Bases de Datos” que tiene Platzi 💚.

Aquí encuentran el enlace a ese curso:

a mi en lo personal no me gusto la clase, se me hizo una clase en la cual me quiero dormir.

Con respecto a los comentarios negativos sobre esta sesión es importante tener en cuenta que previo a tomar este curso se dan unas recomendaciones; se deben tener algunos conocimientos previos en temas de bases de datos, como la identidad referencial, el papel de las key variables y los tipos de relaciones entre bases de datos. Se debe respetar la ruta de aprendizaje recomendada porque entonces quedan confundidos con este tipo de explicaciones.

Esta clase se sintió como si estuviera usando Pawer Query para combinar bases de datos

la clase es confusa porque el colab en recursos esta mal

Obtuve una fuente real cliente.csv—creditos.csv y funciona el merge.

Entendido, es TSQL pero con algunas modificaciones.

A mi parecer, no debe asustarse con aprender a fondo bases de datos compañeros, las bases de datos es un tema muy profundo e igual de difícil de lo que estamos viendo.

Así como existe un un científico de datos, también existe un arquitecto de datos (o ingeniero de datos) y ese mundo si bien esta correlacionado con la ciencia de datos, en realidad es como un Inner Join, los conjuntos no son iguales, simplemente hay un a intersección.


Así que yo diría y en mi experiencia, que con solo hacerse el curso de fundamentos de bases de datos basta para pasarse a pandas.

Aquí inicia con el Merge. Ten los datos ya cargados

Parámetro how

Unir dos Data frames indicando que columna será la separación

Tipos de merge

Merge con dos columnas

editar sufijos