
erick blanco
Preguntacuando se habla de limpiar los datos que se quiere decir? algún ejemplo que me puedan dargracias
- Errores de introducción de datos: errores tipográficos, valores incorrectos, etc.
- Valores atípicos: valores inusuales o inesperados que no pertenecen al conjunto de datos.
- Valores perdidos: valores que faltan en el conjunto de datos.
- Los tipos de datos no son correctos (por ejemplo strings en vez de números)
- Datos nulos
- Strings combinados con números (ejemplo $10.000 y lo que tú necesitas es 10000)
- Valores negativos donde no van
- Formatos de fechas indeseados
- Hojas de Excel que agrupan de maneras no deseada la información
- Datos agrupados por filas en vez de columnas

Manuel Alejandro Arias Rodriguez
La limpieza de datos es el proceso de identificar y limpiar las inexactitudes e incoherencias de los datos.
Es necesario limpiar los datos antes de utilizarlos para el análisis o la toma de decisiones. Los datos inexactos pueden dar lugar a conclusiones erróneas y a decisiones equivocadas.
El primer paso en la limpieza de datos es identificar el tipo de errores que hay que corregir. Hay tres tipos de errores:

erick blanco
gracias eres muy amable por la aclaración

Anthony Ismael Manotoa Moreno
Hola :)
Cuando tienes un dataset "sucio", seguramente te encontrarás con varias situaciones como:
Y un largo etcétera que no te permitirá trabajar y tendrás que hacer una "limpieza de datos" primero