Contenido del curso
Modelos dimensionales
- 6

Data Warehouse, Data Lake y Lakehouse
07:02 min - 7

Modelo estrella vs copo de nieve en datos
05:14 min - 8

Tipos de dimensiones lentamente cambiantes
04:32 min - 9

Dimensión tipo 1: sobrescribir sin guardar historia
07:13 min - 10

Dimensión tipo 2
06:05 min - 11

Dimensión tipo 3: historia en columnas
03:31 min - 12

Tabla de hechos (fact)
09:04 min - 13

Configuración de herramientas para Data Warehouse y ETL
03:22 min - 14

Cómo extraer dimensiones de preguntas de negocio
08:54 min - 15

Diseño de tablas en un modelo dimensional
11:23 min
ETL para inserción en Data Warehouse
- 16

Documento de mapeo en ETL para data warehouse
19:25 min - 17

Creando tablas dimensionales en Redshift
07:09 min - 18

Extracción: querys en SQL
17:28 min - 19

Cruce de fuentes en Pentaho con Stream Lookup
09:25 min - 20

Transformación ETL con Pentaho paso a paso
15:19 min - 21

Carga de datos transformados a Redshift con Pentaho
15:01 min - 22

Cómo cargar la tabla de hechos con Pentaho
12:21 min - 23

Cómo calcular MaxID y MaxDate en Pentaho
17:26 min - 24

Orquestar ETL en Pentaho: job
24:27 min - 25

Solución ETL con dimensiones en paralelo en Redshift
07:27 min
Cierre
Qué son data warehouse, data mart y dimensiones
Resumen
Si quieres entender cómo funciona realmente la inteligencia de negocios, necesitas dominar cuatro conceptos que sostienen toda la arquitectura: data warehouse, data mart, dimensiones y métricas. Aquí los conectamos para que veas cómo trabajan juntos al momento de transformar datos en decisiones.
¿Qué es un data warehouse y por qué se considera la fuente única de la verdad?
En cualquier empresa, los datos viven dispersos. Tienes archivos en CSV, hojas de Excel, bases de datos operativas y, en muchos casos, información alojada en servidores ubicados en distintos puntos geográficos. Ese desorden complica responder preguntas simples del negocio.
El data warehouse resuelve ese problema porque actúa como un repositorio central que reúne toda esa información en un solo lugar. Al consolidarla, se convierte en la fuente única de la verdad, y desde ahí construyes reportes confiables para tomar decisiones.
¿Qué es un data warehouse? Es un repositorio centralizado que integra datos provenientes de múltiples fuentes (CSV, Excel, bases de datos) en un único lugar para análisis y reportería.
¿En qué se diferencia un data mart de un data warehouse?
Mientras el data warehouse contiene la información completa del negocio, el data mart es una sección más acotada, pensada para un área específica. Puedes tener un data mart de ventas, otro de finanzas y otro de auditoría, cada uno con los datos relevantes para esa función.
La diferencia clave está en el alcance:
- El data warehouse cubre toda la organización.
- El data mart se enfoca en un área de negocio particular.
- El data mart suele construirse como una base de datos aparte derivada del warehouse.
Esto permite que cada equipo trabaje con la porción de datos que realmente necesita, sin perderse en el universo completo.
¿Cómo se relacionan las dimensiones y las métricas para responder preguntas de negocio?
Una dimensión es la perspectiva desde la que analizas la información. Te ayuda a contestar preguntas como: ¿cuál es el producto más vendido?, ¿quién lo compró?, ¿qué método de pago usó? Cada una de esas preguntas representa un ángulo distinto sobre los mismos datos.
Una métrica, en cambio, es el indicador que quieres medir. Las ventas son un ejemplo claro de métrica, y cobra sentido cuando la cruzas con dimensiones como producto, cliente, subcategoría, línea, talla o color.
¿Cuál es la diferencia entre dimensión y métrica? La métrica es el valor que mides (por ejemplo, ventas). La dimensión es el atributo desde el cual analizas esa métrica (producto, cliente, color, fecha).
Ejemplo práctico aplicado a ventas
Imagina que tu métrica es el total de ventas. Con las dimensiones puedes descomponerla así:
- Ventas por producto.
- Ventas por cliente.
- Ventas por subcategoría o línea.
- Ventas por talla y color.
Cada combinación te da una respuesta distinta sobre el comportamiento del negocio, y ahí está el verdadero valor de estructurar bien tu modelo de datos.
¿Para qué sirven las dimensiones en BI? Permiten analizar una misma métrica desde múltiples perspectivas, facilitando responder preguntas específicas del negocio sin duplicar datos.
¿Qué sigue después de entender estos conceptos de inteligencia de negocios?
Con estas bases ya puedes leer cualquier arquitectura de BI sin perderte. El siguiente paso es entender por qué conviene mover los datos desde los sistemas operativos hacia un repositorio analítico, y ahí entran dos siglas que escucharás mucho: OLTP y OLAP.
¿Qué dimensiones usarías tú para analizar las ventas de tu negocio? Cuéntalo en los comentarios.