hay valores duplicados los cuales nunca se tratan.
movies_v2.duplicated(['movie_title'],keep=False).value_counts()
#valores repetidos
False 4298
True 87
dtype: int64
#dataframe.drop_duplicates() devuelve un dataframe nuevo por eso hay que asignarlo a una nueva variable.
movies_v3 = movies_v2.drop_duplicates(subset='movie_title')
movies_v3.shape
(4341, 11)
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?