Introducción a BI y Data Warehouse
¿Qué es BI y Data Warehousing?
Niveles de analítica y jerarquía del conocimiento
Conceptos de BI: Data Warehouse, Data Mart, Dimensiones y Hechos
Base de datos OLTP vs. OLAP
Metodologías de Data Warehouse
Quiz: Introducción a BI y Data Warehouse
Modelos dimensionales
Data Warehouse, Data Lake y Data Lakehouse: ¿Cuál utilizar?
Tipos de esquemas dimensionales
Dimensiones lentamente cambiantes
Dimensión tipo 1
Dimensión tipo 2
Dimensión tipo 3
Tabla de hechos (fact)
Configuración de herramientas para Data Warehouse y ETL
Modelado dimensional: identificación de dimensiones y métricas
Modelado dimensional: diseño de modelo
Quiz: Modelos dimensionales
ETL para inserción en Data Warehouse
Documento de mapeo
Creación del modelo físico
Extracción: querys en SQL
Extracción en Pentaho
Transformación: dimensión de cliente
Carga: dimensión de cliente
Soluciones ETL de las tablas de dimensiones y hechos
Parámetros en ETL
Orquestar ETL en Pentaho: job
Revisión de todo el ETL
Quiz: ETL para inserción en Data Warehouse
Cierre
Reflexiones y cierre
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Inmediatamente al sumergirnos en las herramientas de business intelligence, el proceso de consultar, extraer y transformar datos cobra relevancia. En esta clase, exploramos cómo implementar consultas SQL dentro de Pentaho, una herramienta poderosa para procesar datos de manera eficiente. A continuación, se detalla el procedimiento para trasladar un query desde SQL a Pentaho, comenzando con la creación de una nueva transformación.
Para que Pentaho pueda interactuar con las bases de datos, es fundamental establecer una conexión adecuada:
Establecer conexión a la base de datos:
con_Postgres_AdventureWorks
.Validar la conexión:
Ingresar el query en Pentaho:
Probar la consulta:
Después de asegurar la extracción de datos de una base de datos transaccional, es imprescindible cruzar estos datos con otros provenientes del Data Warehouse:
Configurar una nueva conexión:
Definir consulta a la base de datos dimensional:
Cruzando datos entre tablas:
Con estos pasos, se establece una base sólida para trabajar datos de manera óptima en Pentaho. Este enfoque permite un manejo de datos más robusto y confiable tanto de los datos nuevos como antiguos, preparándonos para la siguiente etapa: aplicar transformaciones y cargar los resultados en la base de datos, un ejercicio a profundizar en futuras clases. Ahí radica la riqueza del aprendizaje continuo en la gestión de datos, ¡así que sigan adelante explorando más!
Aportes 4
Preguntas 0
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?