El eliminar los NA del dataset puede ser contraproducente y puede generar Sesgo. En los entornos productivos es mejor aplicar técnicas de imputación de datos y esa directriz no la puede dar la industria. Por ejemplo una técnica de imputación es remplazar los valores NA por el valor promedio de la variable, otro ejemplo es remplazar los NA por el valor que más se repite en la variable.
Seria de utilidad que Platzi pueda hacer un curso orientado al Data Quality para enfocarse en curar los datos y hacer análisis mucho más refinados y limpios. Just think about it !
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?