Introducción a BI y Data Warehouse
¿Qué es BI y Data Warehousing?
Niveles de analÃtica y jerarquÃa del conocimiento
Conceptos de BI: Data Warehouse, Data Mart, Dimensiones y Hechos
Base de datos OLTP vs. OLAP
MetodologÃas de Data Warehouse
Quiz: Introducción a BI y Data Warehouse
Modelos dimensionales
Data Warehouse, Data Lake y Data Lakehouse: ¿Cuál utilizar?
Tipos de esquemas dimensionales
Dimensiones lentamente cambiantes
Dimensión tipo 1
Dimensión tipo 2
Dimensión tipo 3
Tabla de hechos (fact)
Configuración de herramientas para Data Warehouse y ETL
Modelado dimensional: identificación de dimensiones y métricas
Modelado dimensional: diseño de modelo
Quiz: Modelos dimensionales
ETL para inserción en Data Warehouse
Documento de mapeo
Creación del modelo fÃsico
Extracción: querys en SQL
Extracción en Pentaho
Transformación: dimensión de cliente
Carga: dimensión de cliente
Soluciones ETL de las tablas de dimensiones y hechos
Parámetros en ETL
Orquestar ETL en Pentaho: job
Revisión de todo el ETL
Quiz: ETL para inserción en Data Warehouse
Cierre
Reflexiones y cierre
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
En este segmento, exploraremos cómo integrar las dimensiones tipo 1, 2 y 3 para crear lo que se conoce como dimensión tipo 6. Esta dimensión combina las caracterÃsticas de las dimensiones anteriores para registrar cambios de manera eficaz y flexible en nuestro modelo de datos. El ejemplo se centrará en un caso donde la información de un estudiante cambia a lo largo del tiempo.
Para gestionar los cambios temporales en los registros, es esencial utilizar las columnas de fecha de inicio y fecha fin.
Dichos campos permiten seguir la evolución histórica de los registros, asegurando que siempre podamos determinar el estado de un dato en cualquier momento del tiempo.
La combinación de las dimensiones tipo 1, 2 y 3 nos permite manejar registros de cambios de manera más completa. Imaginemos que tenemos un estudiante llamado Pepito Pérez, quien cambia de facultades a lo largo del tiempo, desde ingenierÃa a comercio y luego de vuelta a salud. Al realizar cada cambio, se crea un nuevo registro con un ID único, reflejando las caracterÃsticas y vigencias actualizadas.
La tabla de hechos es el núcleo del modelo dimensional y almacenará todos los indicadores que se deseen medir. Se debe construir con cuidado, asegurándose de cargar las dimensiones antes de procesar los registros de hechos.
Descargar y procesar dimensiones: Es crucial que todas las dimensiones estén cargadas primero, ya que actuarán como un catálogo de datos para cruzar con los hechos.
Ejemplo práctico de carga: Supongamos que se genera una factura el 14 de junio de 2030, para un vendedor con código VEN01, referencia de producto 10 y cliente 1000. Se registran 500 unidades vendidas por $100. Los pasos son buscar en las dimensiones correspondientes:
El nivel de detalle al que se maneja un modelo puede ser tan granular como el usuario desee. En este ejemplo, el modelo se lleva al nivel de factura, pero podrÃa simplificarse al nivel de vendedor, producto y cliente, sumando métricas y desechando la granularidad de la factura, si se decide asà en el proceso de extracción, transformación y carga (ETL).
Es esencial definir claramente la agregación que se aplicará a las métricas, ya sea suma, conteo, media o mediana. Además, campos adicionales como la fecha de carga proporcionan trazabilidad y valor de auditorÃa al modelo.
Esta estructura permite no solo flexibilidad en el análisis histórico, sino también una robustez a la hora de integrar nuevas actualizaciones o cambios sin pérdida de información relevante. Asà se construye un sistema dimensional eficiente y confiable.
Aportes 4
Preguntas 4
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?