Contenido del curso
Modelos dimensionales
- 6

Data Warehouse, Data Lake y Lakehouse
07:02 min - 7

Modelo estrella vs copo de nieve en datos
05:14 min - 8

Tipos de dimensiones lentamente cambiantes
04:32 min - 9

Dimensión tipo 1: sobrescribir sin guardar historia
07:13 min - 10

Dimensión tipo 2
06:05 min - 11

Dimensión tipo 3: historia en columnas
03:31 min - 12

Tabla de hechos (fact)
09:04 min - 13

Configuración de herramientas para Data Warehouse y ETL
03:22 min - 14

Cómo extraer dimensiones de preguntas de negocio
08:54 min - 15

Diseño de tablas en un modelo dimensional
11:23 min
ETL para inserción en Data Warehouse
- 16

Documento de mapeo en ETL para data warehouse
19:25 min - 17

Creando tablas dimensionales en Redshift
07:09 min - 18

Extracción: querys en SQL
17:28 min - 19

Cruce de fuentes en Pentaho con Stream Lookup
09:25 min - 20

Transformación ETL con Pentaho paso a paso
15:19 min - 21

Carga de datos transformados a Redshift con Pentaho
15:01 min - 22

Cómo cargar la tabla de hechos con Pentaho
12:21 min - 23

Cómo calcular MaxID y MaxDate en Pentaho
17:26 min - 24

Orquestar ETL en Pentaho: job
24:27 min - 25

Solución ETL con dimensiones en paralelo en Redshift
07:27 min
Cierre
OLTP vs OLAP: diferencias clave
Resumen
¿Tu negocio necesita procesar miles de ventas por minuto o tomar decisiones estratégicas con esos datos? Entender la diferencia entre OLTP y OLAP es el primer paso para diseñar sistemas que respondan a cada propósito sin mezclar peras con manzanas.
Las bases de datos OLTP sostienen la operación diaria, mientras que las OLAP centralizan la información para análisis. Saber cuándo usar cada una te ahorra dolores de cabeza al escalar y al construir reportes.
¿Qué es OLTP y para qué sirve en un negocio?
OLTP (Online Transaction Processing) son las bases de datos que viven en cada punto de venta. Imagina un almacén de cadena con 100 tiendas y 15 computadores por tienda facturando al mismo tiempo: ahí está OLTP trabajando.
Estas bases están diseñadas para soportar alta concurrencia y almacenar información rápido. Funcionan con un modelo entidad relación, donde las tablas se conectan entre sí como un espagueti. Para sacar un dato, debes recorrer tablas de clientes, ciudades, staff y producto haciendo joins largos y poco escalables.
¿Qué es una base de datos transaccional? Es una base optimizada para registrar operaciones del día a día, como ventas o pagos, donde miles de usuarios escriben datos al mismo tiempo y la velocidad de inserción importa más que el análisis.
Ejemplos típicos en este mundo son MySQL, Postgres y Oracle. Responden preguntas operativas como qué cliente compró hoy, cuál es el número de factura o dónde está ubicado un producto con cierto código de barras.
¿Qué es OLAP y por qué centraliza los datos?
OLAP (Online Analytical Processing) es el sistema que toma datos de muchas fuentes (bases transaccionales, archivos Excel, CSV) y los lleva a un solo repositorio llamado data warehouse. La idea es consumir información más fácil, sin recorrer cinco tablas de clientes.
En lugar de ese laberinto, tienes una dimensión de clientes: una sola tabla con todos los atributos. Alrededor de una tabla central de hechos o medidas se conectan dimensiones que enriquecen el análisis.
Las preguntas que resuelve OLAP son distintas:
- Cuál es el producto más vendido por país.
- Cuál es el cliente que más compra.
- Cuántos empleados se contrataron en el último mes.
Las plataformas comunes son Redshift de AWS, Synapse de Azure y BigQuery de Google. Cada una está pensada para consultas analíticas rápidas sobre volúmenes grandes de datos.
¿Qué es un data warehouse? Es un repositorio centralizado que reúne información de múltiples fuentes, modelada para consultas analíticas. No reemplaza las bases transaccionales, las complementa para que el negocio pueda decidir con datos.
¿En qué se diferencian OLTP y OLAP en la práctica?
La diferencia más visible es el propósito: OLTP está orientado a transacciones y OLAP a la toma de decisiones. Pero hay matices que conviene tener claros antes de elegir arquitectura.
¿Cómo manejan la historia de los datos cada uno?
OLTP es volátil: si un cliente actualiza su correo electrónico, el dato anterior se sobrescribe. OLAP, en cambio, busca preservar la historia. Si ese cambio es relevante para el modelo, se crea un registro nuevo con el correo actualizado para no perder la trazabilidad.
Esto importa porque muchas decisiones analíticas dependen de comparar el antes y el después.
¿Qué nivel de detalle guarda cada sistema?
OLTP almacena información detallada, hasta el código de barras del producto. OLAP trabaja con datos sumarizados o precalculados, lo que permite que dashboards y reportes respondan en segundos en lugar de minutos.
Esa precalculación es justo lo que hace eficiente al sistema analítico.
¿Cómo cambia el modelo de datos entre uno y otro?
En OLTP usas un modelo entidad relación, con tablas conectadas en cadenas largas. En OLAP el patrón típico es una tabla central de hechos rodeada de dimensiones, lo que se conoce como modelo en estrella o copo de nieve.
La concurrencia también difiere: OLTP soporta a miles de cajeros y clientes facturando simultáneamente, mientras que OLAP suele atender solo a usuarios de negocio que consultan reportes.
¿Qué bases de datos elegir para OLTP y OLAP?
La elección depende del rol que cumplirán dentro de tu arquitectura de datos. No es lo mismo registrar ventas que construir un dashboard ejecutivo.
Para cargas transaccionales, las opciones más comunes son:
- MySQL: ampliamente usada en aplicaciones web y comercio.
- Postgres: robusta, con soporte avanzado de tipos y extensiones.
- Oracle: estándar en grandes corporaciones y sistemas críticos.
Para cargas analíticas, los nombres que dominan el mercado son:
- Amazon Redshift: data warehouse de AWS, diseñado para consultas masivas.
- Azure Synapse: combina almacenamiento y analítica en el ecosistema Microsoft.
- Google BigQuery: serverless, escalable y orientada a datos a gran escala.
La regla simple es esta: OLTP corre tu negocio, OLAP te ayuda a entenderlo. Si mezclas ambos en la misma base, la operación se vuelve lenta y los análisis quedan limitados.
¿Has trabajado con alguno de estos motores en tu empresa? Cuéntame en los comentarios qué retos encontraste al separar la operación del análisis.