Contenido del curso
Modelos dimensionales
- 6

Data Warehouse, Data Lake y Lakehouse
07:02 min - 7

Modelo estrella vs copo de nieve en datos
05:14 min - 8

Tipos de dimensiones lentamente cambiantes
04:32 min - 9

Dimensión tipo 1: sobrescribir sin guardar historia
07:13 min - 10

Dimensión tipo 2
06:05 min - 11

Dimensión tipo 3: historia en columnas
03:31 min - 12

Tabla de hechos (fact)
09:04 min - 13

Configuración de herramientas para Data Warehouse y ETL
03:22 min - 14

Cómo extraer dimensiones de preguntas de negocio
08:54 min - 15

Diseño de tablas en un modelo dimensional
11:23 min
ETL para inserción en Data Warehouse
- 16

Documento de mapeo en ETL para data warehouse
19:25 min - 17

Creando tablas dimensionales en Redshift
07:09 min - 18

Extracción: querys en SQL
17:28 min - 19

Cruce de fuentes en Pentaho con Stream Lookup
09:25 min - 20

Transformación ETL con Pentaho paso a paso
15:19 min - 21

Carga de datos transformados a Redshift con Pentaho
15:01 min - 22

Cómo cargar la tabla de hechos con Pentaho
12:21 min - 23

Cómo calcular MaxID y MaxDate en Pentaho
17:26 min - 24

Orquestar ETL en Pentaho: job
24:27 min - 25

Solución ETL con dimensiones en paralelo en Redshift
07:27 min
Cierre
Qué es Business Intelligence y Data Warehousing
Resumen
El Business Intelligence (BI) convierte datos dispersos de ayer y hoy en información útil para tomar decisiones conscientes mañana. Si trabajas con datos en una empresa que genera información en múltiples fuentes, entender BI y data warehousing te permite centralizar, transformar y analizar esa información para guiar al negocio.
¿Por qué importa el Business Intelligence en las empresas?
Cada minuto se generan millones de datos en redes sociales, bases internas y sistemas externos. Cruzar esa información no es trivial.
El reto aparece porque los datos viven en lugares distintos y en formatos variados. Eso hace que la operación sea costosa y lenta cuando alguien necesita responder una pregunta de negocio rápida.
- Fuentes de datos descentralizadas alrededor del mundo.
- Formatos diversos como CSV, JSON, archivos planos y bases transaccionales.
- Información dispersa que dificulta cruzarla y validarla.
Ahí entra BI: capturar toda esa información, llevarla a un solo lugar y aplicar reglas de negocio para tomar decisiones [1:05].
¿Qué es Business Intelligence en palabras simples?
Más que memorizar definiciones, conviene interiorizar la idea con las palabras clave que se repiten en los expertos: datos, información, conocimiento y decisiones.
Una lectura útil dice que BI usa datos de ayer y hoy para tomar las mejores decisiones acerca del mañana. Otra lo describe como la habilidad de transformar datos en información, y la información en conocimiento, para optimizar la toma de decisiones [2:30].
¿Qué es Business Intelligence? Es el proceso de tomar datos de ayer y hoy, transformarlos en información, analizarla para generar conocimiento y usar ese conocimiento para tomar decisiones informadas basadas en datos.
No se trata de garantizar las mejores decisiones, sino decisiones conscientes, sustentadas en evidencia y no en intuición.
¿Cómo construir tu propia definición de BI?
Fíjate en las palabras que se repiten: datos, información, conocimiento, decisiones, estrategias, herramientas, análisis. Con ellas puedes armar una definición propia que tenga sentido para tu contexto.
Una versión práctica sería: BI es el conjunto de estrategias y herramientas que permite analizar datos existentes en una organización para crear conocimiento accionable.
¿Qué es data warehousing y para qué sirve?
El data warehousing consiste en tomar la información que vive descentralizada y llevarla a una bodega única, que se convierte en la única fuente de la verdad [3:55].
En ese traslado se aplican técnicas de extracción, transformación y carga, conocidas como ETL, para garantizar la calidad del dato. Sin esa capa, cualquier reporte termina contradiciéndose con otro.
¿Qué es un data warehouse? Es una bodega de datos centralizada donde se consolida información de múltiples fuentes después de aplicar procesos de extracción, transformación y carga, para servir como única fuente de verdad del negocio.
¿Qué vas a construir en este curso de BI?
El objetivo es partir de las preguntas y necesidades del negocio, identificar las métricas a medir y los niveles de granularidad, y traducir todo eso a un modelo de datos analítico.
El flujo de trabajo va así:
- Levantar requerimientos y métricas con el negocio.
- Tomar los datos desde una base PostgreSQL con varios esquemas y tablas.
- Aplicar técnicas de ETL y transformación.
- Cargar la información en una base con modelo dimensional.
Pasarás de una base transaccional con modelo relacional a un modelo dimensional, entendiendo qué es una dimensión, qué es un hecho y por qué importa esa diferencia para la analítica.
¿Qué papel juega Pentaho en el proceso?
Todo el flujo lo vas a orquestar en Pentaho, una herramienta donde construirás la extracción, transformación y carga hacia el modelo dimensional [5:40].
Entre las prácticas que vas a aplicar:
- Iniciar procesos y generar variables para pasar como parámetros entre pasos.
- Cargar dimensiones de negocio.
- Crear una dimensión de tiempo cuando no exista en la fuente.
- Cargar la tabla fact con los indicadores del negocio.
Con ese modelo armado, puedes conectar un visualizador de datos y mostrar métricas y dimensiones de forma clara para quien toma decisiones.
¿Qué sigue después de entender BI y data warehousing?
En la siguiente clase entran los niveles de analítica y la jerarquía de los datos. Esa pieza te ayuda a ubicar dónde encaja BI y qué tipo de analítica aplicar según el objetivo, porque analizar el pasado no es lo mismo que proyectar el futuro.
Cuéntame en los comentarios cuál es tu propia definición de Business Intelligence con las palabras clave que viste aquí.