Ingeniero de datos: Origen de los datos, está construyendo la información que manejaremos. Ellos hacen API’s, ETL, sql.
Analista, Bi: Extracción y dashboards, automatización, SQL y Excel. Lee la información.
Data Scientist: Sabe hacer el rol del analista, pero también sabe predecir. Sabe usar R o Python
Data Translator: Entiende un poco de datos pero entiende muy bien el negocio.
Herramientas para cada etapa
Ya hemos visto los roles, veamos algunas herramientas.
Para el ingeniero de datos: SQL
Para el científico de datos: R y Python sirven para análisis y visualización.
Hay tipos de información, ya lo sabemos, pero hablemos sobre la ética de los datos, si es amenazante para ti, entonces, deberías cuestionarlo. Tinder por ejemplo sabe quien eres y que estás buscando, ellos podrían mostrarte solo a las personas que saben que te van a gustar ¿Ellos que deberían hacer? ¿Mostrarte todo o solo lo que te gusta? Ellos deben cuidar de no sesgarte, además hacen minería de texto y saben que haces.
Estructura del problema
Problema: Puede surgir de cualquier área. No los podemos identificar y no podemos prevenir X comportamiento.
Solución: Crear un script que nos permita conocer quienes son los clientes que mas se quejan y porque. Sabiendo el porqué podremos clasificar y generar acción para prevenirlo.
Alcance: Clientes, actualización mensual. El alcance debe ser el mas grande posible.
Desglosar un problema.
Qué: Algunos clientes se quejan en exceso.
Por qué: Motivación económica, preguntas, problemas tecnológicos.
Como:
Análisis cuantitativo.
Análisis cualitativo.
Matriz cuantitativa- cualitativa.
Definir acciones.
Validar la hipótesis.