Cada interacción que hacemos en internet deja una huella digital, día a día generamos grandes cantidades de datos alrededor del internet. Nos encontramos en la cuarta revolución industrial o industria 4.0, donde se manejan e intercambian datos con el fin de automatizar y optimizar procesos.
Ante esta necesidad de manejar los datos de manera óptima y rápida es que nace el Big Data, donde los datos cuentan con:
Todos estos datos podemos aprovecharlos de muchas maneras, entre ellas:
Supongamos que somos dueños de Foodie, una aplicación de recetas de cocina. Recientemente empezamos a recibir por parte de los clientes múltiples quejas diciendo que las recetas disponibles son difíciles de realizar.
Lo primero que debemos hacer es reunir los datos generados, quedando de la siguiente forma:
Antes de adentrarnos en fórmulas con nuestros datos, es importante realizar análisis exploratorio de datos (EDA) donde nos enfocaremos en visualizar de mejor manera los datos para obtener un mayor contexto.
Con las gráficas obtenidas podemos realizar las siguientes observaciones:
Con estas observaciones podemos optar por generar contenido introductorio para aquellos clientes primerizos en la cocina, esto con el fin de que tengan una mejor progresión en las recetas.
Como podrás ver en la era actual el manejo de datos es de suma importancia para cualquier negocio. Un científico de datos o Data Scientist debe tener varios conocimientos para poder trabajar de forma correcta con los datos, estos conocimientos son:
Si quieres aprender más sobre el proceso y manejo de un dataset te invito a que mires el curso de Fundamentos de R.
Oh! que interesante 😃
¿en estos casos servir{ia hacer bases de datos con mySQL?(estoy apremdiemdo hace poco su funcionammiento)