Resumen

El proceso de datos es todo el camino que recorren nuestro datos desde que entran a nuestra organización hasta que terminan en un bonito informe.

Los datos deben seguir el siguiente recorrido:

Data Collection: La recolección de los datos. Recuerda que recolectar es importante pero solo funciona si seleccionamos los datos correctos, esos que nos ayudan a mejorar nuestro negocio.

Las herramientas tecnologicas nos ayudan a complir con las reglas de un conjunto de datos, es decir:

  • Precisión: Contexto, rango de tiempo y rango de valores bien definidos.
  • Limpieza: Coherencia entre los datos.
  • Sin sesgos: La información debe ser segura y no puede ser manipulada.
  • Confiable: No debe haber duda de que los datos son correctos.

Visualización de datos: La vida de un analista de datos consiste en Obtener, limpiar y preparar los datos el 80% del tiempo, mientras que construir modelos, analizar y visualizar ocupa el otro 20%.

Data Access: Los datos recolectados deben ser accesibles y consultables (queryable). La forma en que se recolectan los datos debe permitir que, en un futuro, se agreguen más datos cuando sea necesario hay muchas opciones como bases de datos relacionales, no relacionales o preparadas para Big data como Hadoop.

Reporting: Reportes. Los datos pueden ser procesados por personas especialistas en la gestión de datos o herramientas tecnológicas como Power BI. Los encargados de estos reportes deben conocer muy bien la estructura de los datos y realizar consultas (un proceso que también es mucho más rápido y sencillo con herramientas como Power BI).

Alerting: Las alertas son reportes sobre todo lo que está sucediendo en nuestra organización. Al igual que los reportes, no nos dicen cuál es el motivo del problema/éxito ni cuáles son los planes de acción para encontrar una solución o replicar la acción que nos dió buenos resultados.

Reportar vs. Analizar:

Comparación reportar y analizar