Adecuación de los datos, transformación y eliminación de NA

Clase 19 de 34Curso Profesional de Ciencia de Datos 2019

Resumen

Nuestros datos van a pasar por el algoritmo K-means, para ello debemos transformar nuestros datos a puros valores numéricos.

El proceso de adecuación de datos va a ser el siguiente:

  • Transformamos el tipo de dato a cadena de texto.
  • Eliminamos los caracteres especiales.
  • Convertimos los datos a un tipo numérico.
  • En caso de haber NA debemos sustituirlos, para este caso lo cambiaremos por el valor promedio del dato.