cuando se habla de limpiar los datos que se quiere decir? algún ejemplo que me puedan dargracias

erick blanco

erick blanco

Pregunta
studenthace 3 años

cuando se habla de limpiar los datos que se quiere decir? algún ejemplo que me puedan dargracias

3 respuestas
para escribir tu comentario
    Manuel Alejandro Arias Rodriguez

    Manuel Alejandro Arias Rodriguez

    studenthace 3 años

    La limpieza de datos es el proceso de identificar y limpiar las inexactitudes e incoherencias de los datos.

    Es necesario limpiar los datos antes de utilizarlos para el análisis o la toma de decisiones. Los datos inexactos pueden dar lugar a conclusiones erróneas y a decisiones equivocadas.

    El primer paso en la limpieza de datos es identificar el tipo de errores que hay que corregir. Hay tres tipos de errores:

    • Errores de introducción de datos: errores tipográficos, valores incorrectos, etc.
    • Valores atípicos: valores inusuales o inesperados que no pertenecen al conjunto de datos.
    • Valores perdidos: valores que faltan en el conjunto de datos.
    erick blanco

    erick blanco

    studenthace 3 años

    gracias eres muy amable por la aclaración

    Anthony Ismael Manotoa Moreno

    Anthony Ismael Manotoa Moreno

    studenthace 3 años

    Hola :)

    Cuando tienes un dataset "sucio", seguramente te encontrarás con varias situaciones como:

    • Los tipos de datos no son correctos (por ejemplo strings en vez de números)
    • Datos nulos
    • Strings combinados con números (ejemplo $10.000 y lo que tú necesitas es 10000)
    • Valores negativos donde no van
    • Formatos de fechas indeseados
    • Hojas de Excel que agrupan de maneras no deseada la información
    • Datos agrupados por filas en vez de columnas

    Y un largo etcétera que no te permitirá trabajar y tendrás que hacer una "limpieza de datos" primero

Guía para Empezar una Carrera en Data Science e Inteligencia Artificial

Guía para Empezar una Carrera en Data Science e Inteligencia Artificial

Empieza tu carrera en Data Science e Inteligencia Artificial con fundamentos en roles clave como Data Analyst, Data Scientist y Machine Learning Engineer. Aprende herramientas, técnicas de modelado y las aplicaciones prácticas en la industria.

Guía para Empezar una Carrera en Data Science e Inteligencia Artificial
Guía para Empezar una Carrera en Data Science e Inteligencia Artificial

Guía para Empezar una Carrera en Data Science e Inteligencia Artificial

Empieza tu carrera en Data Science e Inteligencia Artificial con fundamentos en roles clave como Data Analyst, Data Scientist y Machine Learning Engineer. Aprende herramientas, técnicas de modelado y las aplicaciones prácticas en la industria.