Resumen

Cada minuto se generan millones de datos en redes sociales, bases de datos internas y archivos dispersos por todo el mundo. Cruzar toda esa información no es sencillo, y ahí es donde Business Intelligence y Data Warehousing entran en acción para convertir datos caóticos en decisiones conscientes y basadas en evidencia.

¿Qué es Business Intelligence y cómo se define?

Existen múltiples definiciones de inteligencia de negocios. Una de ellas, atribuida a Peter, describe la habilidad para entender la interconexión de hechos presentes como medio para hacer juicios predictivos y acertar en la toma de decisiones [0:57]. Otra definición más directa señala que BI usa datos de ayer y hoy para tomar decisiones acerca del mañana [1:27].

Sin embargo, lo más valioso no es memorizar conceptos, sino interiorizarlos. Una forma práctica de entender Business Intelligence es verlo como un flujo:

  • Se toman datos de distintas fuentes.
  • Esos datos se transforman en información.
  • La información se analiza para generar conocimiento.
  • Con ese conocimiento se toman decisiones informadas, no necesariamente las mejores, pero sí decisiones conscientes y basadas en datos [2:26].

El reto principal radica en que las organizaciones manejan información descentralizada: archivos CSV, JSON, archivos planos y bases de datos transaccionales almacenadas en distintos lugares [0:35]. Business Intelligence busca capturar toda esa información, llevarla a un solo lugar y aplicar reglas de negocio para facilitar el análisis.

¿Qué es Data Warehousing y cuál es su rol?

El concepto de Data Warehousing complementa directamente a Business Intelligence. Consiste en tomar información que está dispersa en fuentes descentralizadas y consolidarla en una bodega de datos que se convierte en la única fuente de la verdad [2:42].

Durante este proceso se aplican técnicas conocidas como ETL (Extract, Transform, Load), que permiten:

  • Extraer datos desde distintas fuentes.
  • Transformar esos datos aplicando reglas de calidad y negocio.
  • Cargar la información procesada en un modelo dimensional [3:04].

Este modelo dimensional es diferente al modelo relacional que se usa en bases de datos transaccionales. Mientras el modelo relacional está diseñado para registrar operaciones del día a día, el modelo dimensional organiza la información en dimensiones y tablas de hechos para facilitar el análisis y la medición de indicadores [3:36].

¿Cómo se transforma un modelo relacional en uno dimensional?

El proceso parte de identificar las necesidades del negocio: qué métricas se quieren medir y a qué nivel de granularidad se necesita la información [3:13]. Una vez claras esas preguntas, se extraen los datos de la fuente original, en este caso una base de datos Postgres con múltiples esquemas y tablas, y se llevan al modelo dimensional aplicando las técnicas de ETL [3:24].

Es fundamental entender estos elementos:

  • Dimensiones: representan las perspectivas desde las cuales se analiza la información, como tiempo, geografía o producto.
  • Tabla de hechos (fact table): contiene los indicadores numéricos y las métricas del negocio.
  • Granularidad: el nivel de detalle al que se almacena y consulta la información.

¿Qué herramienta se utiliza para construir el flujo ETL?

La herramienta central es Pentaho, donde se construye todo el flujo de extracción, transformación y carga de datos [3:52]. En Pentaho se pueden crear variables que funcionan como parámetros entre pasos del proceso, generar dimensiones de tiempo que no existan en la fuente original y cargar la tabla de hechos con todos los indicadores necesarios [4:06].

¿Por qué importan los niveles de analítica en BI?

No toda analítica tiene el mismo objetivo. Existe una jerarquía en los datos que determina el tipo de análisis que se puede realizar [4:30]. Analizar el pasado es diferente a intentar predecir el futuro, y Business Intelligence se ubica en un nivel específico dentro de esa jerarquía. Identificar ese nivel permite aplicar el tipo correcto de analítica según los objetivos del negocio.

Si ya tienes tu propia definición de Business Intelligence, compártela en los comentarios. Construir ese concepto con tus propias palabras es el primer paso para dominarlo.