Llevar a cabo un proyecto de Business Intelligence sin una guía clara es como construir sin planos. Cada fase, desde la identificación de necesidades hasta la gobernanza de datos, determina si el resultado será útil o terminará abandonado. A continuación se desglosan los pasos fundamentales para planificar con éxito.
¿Cómo identificar las necesidades del negocio y analizar la brecha de datos?
El punto de partida es reconocer qué necesita la organización. Muchas veces no sabemos qué tenemos, qué queremos ni cómo solucionarlo [0:10]. Esa falta de claridad es normal, pero debe resolverse antes de avanzar.
Al hablar con las distintas áreas se recopila un conjunto variado de requerimientos. Esos requerimientos deben estar apalancados por datos reales [0:25]. Aquí aparece el concepto de brecha de datos: la distancia entre lo que se pide y la información disponible para responderlo.
- Requerimientos bien definidos sin datos suficientes generan frustración.
- Datos abundantes sin requerimientos claros producen ruido sin valor.
- La suma de requerimientos más datos es lo que genera éxito [0:30].
Cuando alguno de los dos lados de la balanza falla, es necesario crear estrategias para compensar: buscar nuevas fuentes de datos o refinar los requerimientos con las áreas involucradas.
¿Por qué la viabilidad técnica define la priorización de objetivos?
Una vez que se tiene el listado de requerimientos, el siguiente paso es convertirlos en objetivos concretos. Pero aquí entra una variable adicional: la viabilidad técnica [1:05]. No basta con tener datos y requerimientos; si técnicamente no es posible hacerlos interactuar, el resultado deseado no se alcanzará.
Cada requerimiento debe pasar por una evaluación técnica que determine si es factible. Esto permite priorizar los objetivos más críticos y de mayor valor estratégico para la organización [1:22].
¿Qué rol juega el proceso ETL en el diseño de la solución?
Con los requisitos priorizados, se diseña la solución. Aquí se aplica una estrategia de extracción, transformación y carga de datos, conocida como ETL [1:45]. Este proceso es la columna vertebral que permite obtener datos útiles a partir de fuentes dispersas.
El ciclo de vida de los datos guía todo el proceso [1:55]:
- Captura: obtener los datos desde sus fuentes originales.
- Procesamiento: limpiar y clasificar los datos.
- Visualización: presentar la información de forma comprensible.
- Eliminación: descartar datos que ya no aportan valor.
Durante el procesamiento, la limpieza de datos implica verificar el tipo de cada dato: numérico, texto, booleano o coordenadas geográficas [2:20]. Solo después de esta clasificación se puede pasar al modelado.
¿Qué es el modelado de datos y qué modelos existen?
El modelado de datos consiste en organizar toda esa información que llega desde archivos Excel, bases de datos y repositorios diversos, para que los datos puedan interactuar entre sí [2:35]. Se traduce en dos elementos principales: una tabla de hechos y una tabla de dimensiones [2:50].
Los dos modelos más utilizados son:
- Modelo estrella: estructura simple donde la tabla de hechos se conecta directamente a cada dimensión.
- Modelo copo de nieve: variante más normalizada donde las dimensiones se subdividen en tablas adicionales [2:58].
Ambos permiten trabajar con todas las dimensiones que los datos contienen, pero la elección depende de la complejidad del proyecto.
¿Por qué el feedback y la gobernanza de datos son indispensables?
Un proyecto de BI no termina con la entrega del producto. Es fundamental mantener comunicación continua con los interesados, las mismas personas que proporcionaron los requerimientos iniciales [3:15]. Ellos validan si las respuestas que arroja el sistema son adecuadas y sugieren mejoras.
Pero nada de esto funciona sin una buena gobernanza de datos [3:35]. Se trata de una estandarización organizacional que define:
- Cómo se introducen y escriben los datos.
- Qué formato deben tener.
- Dónde se almacenan.
- Quién los administra y otorga permisos [3:50].
Es clave que la gobernanza esté respaldada por alguien con autoridad suficiente dentro de la organización, alguien que pueda gestionar permisos y difundir las estrategias en todos los equipos [3:58].
Planificar los datos es planificar el éxito [4:10]. Si has enfrentado alguno de estos desafíos en tu organización o has recibido un requerimiento inusual, comparte tu experiencia en los comentarios.