Contenido del curso
Modelos dimensionales
- 6

Data Warehouse, Data Lake y Lakehouse
07:02 min - 7

Modelo estrella vs copo de nieve en datos
Viendo ahora - 8

Tipos de dimensiones lentamente cambiantes
04:32 min - 9

Dimensión tipo 1: sobrescribir sin guardar historia
07:13 min - 10

Dimensión tipo 2
06:05 min - 11

Dimensión tipo 3: historia en columnas
03:31 min - 12

Tabla de hechos (fact)
09:04 min - 13

Configuración de herramientas para Data Warehouse y ETL
03:22 min - 14

Cómo extraer dimensiones de preguntas de negocio
08:54 min - 15

Diseño de tablas en un modelo dimensional
11:23 min
ETL para inserción en Data Warehouse
- 16

Documento de mapeo en ETL para data warehouse
19:25 min - 17

Creando tablas dimensionales en Redshift
07:09 min - 18

Extracción: querys en SQL
17:28 min - 19

Cruce de fuentes en Pentaho con Stream Lookup
09:25 min - 20

Transformación ETL con Pentaho paso a paso
15:19 min - 21

Carga de datos transformados a Redshift con Pentaho
15:01 min - 22

Cómo cargar la tabla de hechos con Pentaho
12:21 min - 23

Cómo calcular MaxID y MaxDate en Pentaho
17:26 min - 24

Orquestar ETL en Pentaho: job
24:27 min - 25

Solución ETL con dimensiones en paralelo en Redshift
07:27 min
Cierre
Modelo estrella vs copo de nieve en datos
Resumen
Si trabajas con datos y necesitas estructurarlos para análisis, entender la diferencia entre modelo estrella y copo de nieve te ayuda a decidir cómo organizar tus métricas y dimensiones. Esta guía explica ambos esquemas con ejemplos prácticos, pensada para quienes están dando sus primeros pasos en modelado dimensional.
¿Qué es un modelo dimensional y cómo se compone?
Un modelo dimensional es la base de cualquier análisis de negocio bien estructurado. Se compone de dos elementos: las métricas, que son los hechos o actividades que quieres medir (los indicadores de tu negocio), y los atributos, que viven en las dimensiones y representan las perspectivas desde las cuales analizar esas métricas.
La estructura central es una tabla de hechos rodeada por dimensiones. La conexión se hace llevando el ID de cada dimensión como clave foránea hacia la tabla de hechos, y así ambas tablas quedan relacionadas.
¿Qué es una tabla de hechos? Es la tabla central de un modelo dimensional donde se almacenan las métricas o indicadores del negocio, como ventas, ingresos o cantidades.
¿Cómo visualizar un modelo dimensional con un cubo?
Piensa en una tabla dinámica de Excel: ingresas una métrica y la puedes ver desde diferentes perspectivas, como producto, tiempo o ubicación. Un cubo funciona igual, pero en tres caras.
Imagina un cubo donde cada cara representa una dimensión distinta. Si lo volteas, cambias la perspectiva de análisis. Cada cubito dentro del cubo te entrega un dato puntual: qué producto se vendió, en qué fecha y a qué cliente.
Por ejemplo, una cocina de madera comprada en una fecha específica en HomeCenter es un punto exacto dentro del cubo, cruzando las dimensiones de producto, tiempo y ubicación.
¿Qué es el modelo estrella y cuándo usarlo?
El modelo estrella ubica la tabla de hechos en el centro y la relaciona directamente con sus dimensiones, a un solo nivel. No hay intermediarios: cada dimensión se conecta de forma directa con la tabla de hechos y allí están todos los atributos que necesitas para analizar.
Este esquema funciona cuando los datos no requieren niveles adicionales de detalle. Por ejemplo, una dimensión de producto que incluye nombre, ID, descripción, talla y línea es suficiente si tu negocio no maneja más niveles de clasificación.
Ventajas del modelo estrella:
- Estructura simple y fácil de entender.
- Consultas más rápidas al tener menos uniones entre tablas.
- Ideal cuando los atributos de cada dimensión son acotados.
¿Qué es el modelo copo de nieve y por qué normalizar dimensiones?
El modelo copo de nieve mantiene la tabla de hechos en el centro, pero ahora una dimensión puede relacionarse con otras dimensiones. Es decir, normalizas la dimensión principal separando atributos en tablas adicionales.
Una regla clave: nunca relaciones tablas de hechos entre sí. Las relaciones en los modelos siempre se dan a través de las dimensiones que comparten.
¿Cuándo conviene usar copo de nieve en lugar de estrella? Cuando una dimensión tiene jerarquías o muchos valores repetidos, como producto con categoría y subcategoría. Separarlos reduce redundancia y agiliza filtros.
¿Cómo se aplica el copo de nieve con un ejemplo de productos?
Supón que tu dimensión de producto tiene nombre, ID y subcategoría. Si manejas muchas subcategorías, el valor se repite muchas veces dentro de la tabla de productos, lo que pesa al filtrar.
La solución es crear una dimensión aparte para subcategorías. Así, la tabla de productos guarda solo el ID de la subcategoría, y la descripción vive en su propia tabla dimensional.
Ventajas concretas de este enfoque:
- Reduces la cantidad de datos repetidos en la dimensión principal.
- Los filtros por atributos agrupados son más eficientes.
- Mantienes jerarquías limpias, como categoría y subcategoría separadas.
¿Cómo elegir entre modelo estrella y copo de nieve?
No hay una respuesta única. La decisión depende de tu negocio y de la naturaleza de los datos que manejas. Si tus dimensiones son simples y planas, el modelo estrella te va a dar velocidad y claridad. Si tus dimensiones tienen jerarquías profundas o muchos valores repetidos, el copo de nieve te ayuda a normalizar y optimizar.
La clave está en mirar cómo se comportan tus atributos: ¿se repiten mucho?, ¿tienen subniveles?, ¿necesitas filtrar por categorías agrupadas? Esas preguntas te orientan hacia el esquema correcto para tu toma de decisiones.
¿Qué modelo crees que se ajusta mejor a tu proyecto actual? Cuéntame en los comentarios cómo estás estructurando tus datos.