Qué son data warehouse, data mart y dimensiones

Resumen

Si quieres entender cómo funciona realmente la inteligencia de negocios, necesitas dominar cuatro conceptos que sostienen toda la arquitectura: data warehouse, data mart, dimensiones y métricas. Aquí los conectamos para que veas cómo trabajan juntos al momento de transformar datos en decisiones.

¿Qué es un data warehouse y por qué se considera la fuente única de la verdad?

En cualquier empresa, los datos viven dispersos. Tienes archivos en CSV, hojas de Excel, bases de datos operativas y, en muchos casos, información alojada en servidores ubicados en distintos puntos geográficos. Ese desorden complica responder preguntas simples del negocio.

El data warehouse resuelve ese problema porque actúa como un repositorio central que reúne toda esa información en un solo lugar. Al consolidarla, se convierte en la fuente única de la verdad, y desde ahí construyes reportes confiables para tomar decisiones.

¿Qué es un data warehouse? Es un repositorio centralizado que integra datos provenientes de múltiples fuentes (CSV, Excel, bases de datos) en un único lugar para análisis y reportería.

¿En qué se diferencia un data mart de un data warehouse?

Mientras el data warehouse contiene la información completa del negocio, el data mart es una sección más acotada, pensada para un área específica. Puedes tener un data mart de ventas, otro de finanzas y otro de auditoría, cada uno con los datos relevantes para esa función.

La diferencia clave está en el alcance:

  • El data warehouse cubre toda la organización.
  • El data mart se enfoca en un área de negocio particular.
  • El data mart suele construirse como una base de datos aparte derivada del warehouse.

Esto permite que cada equipo trabaje con la porción de datos que realmente necesita, sin perderse en el universo completo.

¿Cómo se relacionan las dimensiones y las métricas para responder preguntas de negocio?

Una dimensión es la perspectiva desde la que analizas la información. Te ayuda a contestar preguntas como: ¿cuál es el producto más vendido?, ¿quién lo compró?, ¿qué método de pago usó? Cada una de esas preguntas representa un ángulo distinto sobre los mismos datos.

Una métrica, en cambio, es el indicador que quieres medir. Las ventas son un ejemplo claro de métrica, y cobra sentido cuando la cruzas con dimensiones como producto, cliente, subcategoría, línea, talla o color.

¿Cuál es la diferencia entre dimensión y métrica? La métrica es el valor que mides (por ejemplo, ventas). La dimensión es el atributo desde el cual analizas esa métrica (producto, cliente, color, fecha).

Ejemplo práctico aplicado a ventas

Imagina que tu métrica es el total de ventas. Con las dimensiones puedes descomponerla así:

  • Ventas por producto.
  • Ventas por cliente.
  • Ventas por subcategoría o línea.
  • Ventas por talla y color.

Cada combinación te da una respuesta distinta sobre el comportamiento del negocio, y ahí está el verdadero valor de estructurar bien tu modelo de datos.

¿Para qué sirven las dimensiones en BI? Permiten analizar una misma métrica desde múltiples perspectivas, facilitando responder preguntas específicas del negocio sin duplicar datos.

¿Qué sigue después de entender estos conceptos de inteligencia de negocios?

Con estas bases ya puedes leer cualquier arquitectura de BI sin perderte. El siguiente paso es entender por qué conviene mover los datos desde los sistemas operativos hacia un repositorio analítico, y ahí entran dos siglas que escucharás mucho: OLTP y OLAP.

¿Qué dimensiones usarías tú para analizar las ventas de tu negocio? Cuéntalo en los comentarios.