Metodologías de Data Warehouse

Clase 5 de 26Curso de Data Warehousing y Modelado OLAP

Resumen

¿Qué metodologías existen para crear modelos de Business Intelligence?

Comenzar en el mundo de Business Intelligence puede parecer abrumador, pero entender las metodologías adecuadas nos puede guiar en este viaje. En esta clase, exploramos tres metodologías comunes que ofrecen distintos enfoques para manejar y transformar datos en modelos valiosos. Estas metodologías incluyen diferentes componentes cruciales como el origen de datos, las dimensiones o modelos dimensionales, y la visualización final. Veamos las tres enfoques principales: Billimon, Ralph Kimball y EFESTO.

¿Qué propone la metodología Billimon?

Billimon es reconocido como un pionero en las metodologías de inteligencia de negocios. Este enfoque propone un flujo que comienza con una base de datos temporal conocida como Staging. Aquí es donde se trasladan todos los datos de las fuentes antes de transformar y cargar en el Data Warehouse:

  • Staging: Es la base de datos temporal que actúa como un buffer para evitar afectaciones a estas bases transaccionales al efectuar transformaciones pesadas de datos.
  • Data Warehouse: Un repositorio centralizado donde se almacenan los datos transformados. Desde aquí, se construyen los Data Marts para alimentar tableros y reportes.

Este proceso se realiza mediante ETL (Extracción, Transformación y Carga), lo que garantiza que las operaciones empresariales no sean afectadas durante las transformaciones.

¿Cuáles son las características de la metodología de Ralph Kimball?

Ralph Kimball ofrece un enfoque distinto, saltándose el Data Warehouse, y dirigiendo los datos del Staging directamente a los Data Marts. Esta metodología no considera necesariamente indispensable el uso de un Data Warehouse. Se pueden tener ambos o prescindir de uno.

El flujo propuesto por Kimball para crear los modelos de datos incluye:

  1. Planificación del proyecto: Definir el propósito, objetivos y alcance del proyecto de Business Intelligence.
  2. Definición de requerimientos de negocio: Utilizar entrevistas para identificar las necesidades y preguntas del negocio.
  3. Modelo dimensional: Determinación de la granularidad y las dimensiones necesarias para medir los datos.
  4. Diseño físico: Construcción de la infraestructura de bases de datos necesaria para implementar el modelo.
  5. Implementación del subsistema de ETL: Configuración del flujo de extracción y carga de datos.
  6. Divulgación y prueba: Importante comunicar el proceso y los resultados al negocio.

¿Cómo se explica la metodología EFESTO?

La metodología EFESTO, relativamente más reciente, es una alternativa que se puede combinar efectivamente con otras metodologías, como la de Kimball. Sus pasos incluyen:

  • Análisis de requerimientos: Identificar qué necesita el negocio y el nivel de granularidad de los datos.
  • Análisis de OLTP: Entender dónde están ubicadas las fuentes de datos y el detalle que ofrecen.
  • Modelo lógico/físico del Data Warehouse: Creación de las tablas y modelos de datos para almacenar información.
  • Integración de datos: Implementación del proceso ETL para capturar y trasladar datos al destino final.

Este enfoque es particularmente útil para quienes prefieren una arquitectura que considere etapas de Staging en el manejo de datos, sobre todo para negocios de menor tamaño.

Estas metodologías ofrecen distintos caminos hacia la implementación efectiva de sistemas de Business Intelligence. ¡Explora cuál se adapta mejor a tus necesidades y objetivos! Y como siempre, mantente aprendiendo y experimentando. Comparte en los comentarios cualquier otra metodología que hayas utilizado o que conozcas, y continúa tu travesía hacia la maestría en Business Intelligence.