Workflow Típico de un Data Scientist

Clase 15 de 30Curso de Big Data y Ciencia de Datos 2016

Resumen

¿Cuál es la probabilidad que un tweet que viene de Colombia contiene la palabra yo?

 

1. El primer paso es formular muy bien la pregunta
2. Una vez definida esta pregunta debemos recopilar datos
3. Una vez tengamos los datos debemos limpiarlos.


Recuerda:
La ambigüedad no va bien con las computadoras
 

      Workflow Típico de un Data Scientist