¿Qué es big data y cuál es su papel en datascience?

Clase 30 de 30Curso de Big Data y Ciencia de Datos 2016

Resumen

¿Qué es big data?

 

Si tus datos caben en memoria RAM no tienes en big data, este se aplica en procesos de análisis de datos que requieren gran cantidad de datos y estos deben ser analizados a través de varios servidores.

 

¿Quién actualmente usa big data?

 

Empresas que manejan millones de datos como google, facebook, etc. Cada vez procesamos más datos en la nube por esto en un futuro tal vez no necesitemos usar big data, tendremos herramientas para procesar esta cantidad de datos desde un computador personal.

 

¿Porque existen herramientas cómo spark, big query? y ¿Qué aportan al proceso de data science?

 

Al aumentar la cantidad de datos necesitaremos más poder computacional, para hacer computación distribuida de nuestros datos necesitamos este tipo de herramientas.

 

¿Cómo data scientist es necesario solo aprender sobre big data?

 

Hoy un data scientist sabe de todo, pero entre mas madura el campo vemos especialización. 

 

¿Cuales son tus referencias favoritas?

 

  • https://www.kaggle.com/
  • http://www.datatau.com/
  • https://news.ycombinator.com/