Dimensiones lentamente cambiantes

Clase 8 de 26Curso de Data Warehousing y Modelado OLAP

Resumen

¿Qué son las dimensiones y por qué son importantes?

Las dimensiones son componentes fundamentales en el análisis de datos de un negocio. Permiten responder preguntas sobre el qué, cómo, cuándo y dónde de las operaciones. Cada dimensión se compone de atributos que pueden ser jerárquicos, descriptivos o de control.

  • Atributos jerárquicos: Permiten estructurar información en niveles, como una ciudad dentro de un departamento, y un departamento dentro de un país.
  • Atributos descriptivos: Nos ayudan a conocer mejor una entidad, como un cliente, definiendo características propias como su nombre, dirección o teléfono.
  • Atributos de control: Son esenciales para auditoría. Indican cuándo y quién almacenó un registro, garantizando la trazabilidad y avalando la integridad de los datos.

¿Cuáles son los tipos de dimensiones lentamente cambiantes?

Las dimensiones lentamente cambiantes definidas en tres tipos principales son cruciales a la hora de manejar actualizaciones y cambios de datos en una fuente. Cada tipo aborda los cambios de manera distinta, permitiendo distintos grados de conservación histórica.

Tipo 1: ¿Cómo funciona?

Este tipo de dimensión se asemeja a las tablas transaccionales. Solo almacena la información más actual reemplazando el valor previo sin conservar el historial. Si un producto inicialmente registrado como azul cambia a amarillo, la nueva carga de datos sobrescribe el azul con el amarillo, sin mantener el registro del cambio.

Ejemplo de código para cargar una dimensión tipo 1:

UPDATE productos SET color = 'amarillo' WHERE codigo_producto = '001' AND color = 'azul';

Tipo 2: ¿Cuál es su enfoque?

A diferencia del tipo 1, las dimensiones tipo 2 mantienen un registro histórico. Cada cambio significativo, como el color de un producto, genera un nuevo registro con información de auditoría, permitiendo saber qué vigencia tuvo cada estado del producto.

Ejemplo de código para cargar una dimensión tipo 2:

INSERT INTO productos (codigo_producto, color, fecha_inicio, fecha_fin) 
VALUES ('001', 'amarillo', '2023-10-01', NULL);

UPDATE productos SET fecha_fin = '2023-09-30' WHERE codigo_producto = '001' AND color = 'azul';

Tipo 3: ¿Qué propone esta técnica?

Este tipo crea una nueva columna para registrar el valor anterior del atributo y el actual. Esto asegura un tipo de historia más resumida, adecuada para ciertos tipos de análisis sin crear múltiples registros por cada cambio.

Ejemplo de código para cargar una dimensión tipo 3:

UPDATE productos
SET color_anterior = color, color = 'amarillo'
WHERE codigo_producto = '001' AND color = 'azul';

Consejos para implementar dimensiones lentamente cambiantes

Elegir el tipo adecuado de dimensión es clave para el diseño eficaz de un almacén de datos. Considere las necesidades de su negocio:

  1. Historia Completa: Si necesita rastrear todos los cambios, opte por el tipo 2.
  2. Auditoría: Utilice atributos de control para una mejor auditoría y trazabilidad, especialmente con el tipo 2.
  3. Simplicidad: Use el tipo 1 para situaciones donde la información pasada no es relevante.
  4. Análisis Rápido: Tipo 3 es útil si se requieren comparaciones directas entre el estado actual y uno anterior inmediato.

¡Manténgase motivado! Cada aprendizaje en torno a las dimensiones lentamente cambiantes abre puertas a un análisis más profundo y sólido de los datos. Experimentar con estos conceptos te llevará a un mejor dominio del modelado de datos y te ayudará a enfrentar exitosamente los desafíos que surjan en la gestión de información empresarial.