Creación del modelo físico

Clase 17 de 26Curso de Data Warehousing y Modelado OLAP

Resumen

¿Cómo se realiza el mapeo de las tablas en un Data Warehouse?

El diseño estructural de un Data Warehouse es vital para asegurar que los datos se integren y estructuren adecuadamente. Para comprender este proceso, se debe realizar un mapeo de tablas. Este mapeo implica la identificación de las dimensiones relevantes, como clientes, productos, territorio y vendedores, además de la tabla de hechos (FAC) que recopila las ventas. Durante este proceso, se debe considerar la fuente de cada atributo, proponiendo transformaciones y calculando campos cuando sea necesario.

Dimensión de cliente

La dimensión de cliente se construye mapeando los atributos directamente desde la fuente de datos hasta cada campo de la tabla. Ejemplo de estos campos son el ID del cliente, código, nombre y teléfono. Los tamaños para cada campo son cuidadosamente seleccionados, basándose en la información contenida en la base de datos transaccional.

Dimensión de vendedores

Para la dimensión de vendedores, se introducen dos campos especiales, la fecha de inicio y la fecha de fin. Esta dimensión es única porque se comporta como una dimensión lentamente cambiante tipo 2, lo que significa que se registran los cambios en tiempos diferentes. Además, se ejecutan transformaciones, como la conversión de género de una letra a su forma completa ("M" a "masculino" y "F" a "femenino").

Transformaciones en la tabla de hechos

La tabla FAC o tabla de ventas se encarga de almacenar los datos cruciales para analizar las ventas. Una transformación esencial es calcular el valor total multiplicando la cantidad por el precio unitario. Además, el descuento se calcula multiplicando el descuento unitario por la cantidad.

¿Cómo se construyen las tablas dimensionales en una base de datos?

La construcción de tablas dimensionales en un Data Warehouse implica la creación de esquemas y tablas basadas en un modelo dimensional. En este contexto, se utiliza una base de datos llamada Redshift, que se nutre de datos provenientes de PostgreSQL. El proceso comienza con la creación de tablas como DimClientes, y se diseñan con campos de un tamaño adecuado y atributos de auditoría importantes como la fecha de carga y actualización.

Creación de la tabla DimClientes

Para la tabla DimClientes, se definen los campos siguiendo el mapeo de dimensiones. Aquí hay un ejemplo de cómo se establece la estructura:

CREATE TABLE DimClientes (
  ID_Cliente INTEGER,
  Codigo_Cliente VARCHAR(10),
  Nombre VARCHAR(50),
  Apellido VARCHAR(50),
  Nombre_Completo VARCHAR(100),
  Telefono_Celular VARCHAR(20),
  Telefono_Casa VARCHAR(20),
  Telefono_Trabajo VARCHAR(20),
  Ciudad_Casa VARCHAR(50),
  Fecha_Carga TIMESTAMP,
  Fecha_Actualizacion TIMESTAMP,
  PRIMARY KEY (ID_Cliente)
);

Validación de la creación de la tabla

Una vez que la tabla se crea exitosamente, se ejecuta un SELECT para validar su estructura, asegurando que los campos sean correctos y la tabla esté lista para poblarse con datos.

SELECT * FROM DimClientes;

Este proceso asegura que las dimensiones estén mapeadas y estructuradas adecuadamente, listas para recibir datos extraídos y transformados de las fuentes transaccionales.

¿Cuál es el próximo paso en la construcción de un Data Warehouse?

Después de establecer las bases creando las tablas y esquemas, el siguiente paso crucial es la extracción y transformación de datos. Este proceso implica extraer información relevante de la base de datos transaccional (como Postgres en el caso del desafío propuesto) y poblar las tablas creadas en el Data Warehouse.

Reto propuesto

Como práctica enriquecedora, se invita a los estudiantes a terminar de construir las tablas dentro del Data Warehouse. Siguiendo con las de productos, vendedores, territorio y la tabla FAC de ventas, se reta a completar esta tarea teniendo en cuenta los elementos estructurales y transformaciones necesarias para integrarlas.

Este ejercicio es fundamental para fortalecer el entendimiento del modelo dimensional y la práctica del diseño de un Data Warehouse eficiente y bien conectado.


Conocer el proceso de mapeo y creación de tablas en un Data Warehouse es clave para una gestión eficiente de los datos empresariales. Cada paso, desde el mapeo hasta la implementación y transformación, es crucial para garantizar datos limpios, organizados y listos para el análisis. Así que sigue explorando y practicando, el éxito en este campo está a un paso de la persistencia y el aprendizaje continuo.