No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Convierte tus certificados en títulos universitarios en USA

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

18 Días
9 Hrs
9 Min
10 Seg

Transformación: dimensión de cliente

20/26
Recursos

Aportes 8

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

De diez el curso, ya voy comprendiendo todo

Hubiera preferido que el curso sea sobre Python y no Pentaho.. hoy en dia esta muy cara su licencia
A mi generaba error en la formula y lo corregi asi (ten en cuenta como definiste tus variables): `IF([id_cliente]=-1; [Max_client_id]; [id_cliente])`
Alguien conoce algún buen tutorial de Pentaho? Porque no me queda para nada claro como el profesor utiliza los diferentes elementos para hacer la transformación
Crear una **dimensión de cliente** en Pentaho implica extraer datos de una fuente, transformarlos según los requisitos del modelo dimensional y cargarlos en una tabla de base de datos de destino. A continuación te muestro cómo puedes crear esta transformación en Pentaho para construir una dimensión de cliente: ### **1. Diseño del esquema de la dimensión de cliente** #### **Estructura típica de la tabla** `dim_cliente` CREATE TABLE dim\_cliente ( id\_cliente INT PRIMARY KEY, codigo\_cliente VARCHAR(50), nombre VARCHAR(50), apellido VARCHAR(50), nombre\_completo VARCHAR(100), telefono\_celular VARCHAR(20), telefono\_casa VARCHAR(20), telefono\_trabajo VARCHAR(20), ciudad VARCHAR(50), estado VARCHAR(50), fecha\_carga TIMESTAMP, fecha\_actualizacion TIMESTAMP ); ### **2. Creación de la transformación en Pentaho** #### **a. Preparación** 1. Abre **Spoon** en Pentaho. 2. Crea una nueva transformación: **File > New > Transformation**. #### **b. Fuentes de datos** 1. **Arrastra un paso de entrada**: * **Input > Table Input**. * Configura la conexión a la base de datos de origen. * Usa una consulta para extraer los datos relevantes:SELECT c.customerid AS id\_cliente, c.customer\_code AS codigo\_cliente, p.firstname AS nombre, p.lastname AS apellido, p.firstname || ' ' || p.lastname AS nombre\_completo, CASE WHEN pp.phonenumbertypeid = 1 THEN pp.phonenumber ELSE NULL END AS telefono\_celular, CASE WHEN pp.phonenumbertypeid = 2 THEN pp.phonenumber ELSE NULL END AS telefono\_casa, CASE WHEN pp.phonenumbertypeid = 3 THEN pp.phonenumber ELSE NULL END AS telefono\_trabajo, a.city AS ciudad, a.state AS estado FROM customer c LEFT JOIN person p ON c.personid = p.businessentityid LEFT JOIN person.personphone pp ON p.businessentityid = pp.businessentityid LEFT JOIN address a ON c.addressid = a.addressid; #### **c. Transformaciones** 1. **Limpieza de datos**: * **Data Cleansing**: * Usa el paso de **Data Validator** para asegurarte de que los datos cumplen con las reglas de negocio, como: * Los nombres no son nulos. * Los códigos de cliente tienen formato válido. * **Replace Values**: * Reemplaza valores inconsistentes, por ejemplo, ciudades mal escritas. 2. **Generar columnas adicionales**: * Usa un paso de **Calculator** para calcular `fecha_carga` y `fecha_actualizacion`: * `fecha_carga`: Fecha actual. * `fecha_actualizacion`: Fecha actual o última modificación. #### **d. Salida de datos** 1. **Configura la salida**: * Arrastra un paso de **Table Output**. * Configura la conexión a la base de datos de destino. * Selecciona la tabla `dim_cliente`. 2. **Mapeo de columnas**: * Asegúrate de mapear correctamente las columnas de la entrada a las columnas de la tabla de destino. #### **e. Manejo de dimensiones tipo 2 (opcional)** Si necesitas realizar un seguimiento de los cambios históricos en los datos de cliente, puedes usar un paso de **Dimension Lookup/Update** para manejar las dimensiones lentamente cambiantes (SCD Type 2). ### **3. Guardar y ejecutar** 1. Guarda la transformación con un nombre descriptivo: `transformacion_dim_cliente.ktr`. 2. Ejecuta la transformación y verifica los resultados en la tabla de destino. ### **4. Validación** 1. Comprueba que los datos en la tabla `dim_cliente` coincidan con los datos esperados. 2. Verifica la integridad referencial con las tablas relacionadas. 3. Si implementaste dimensiones tipo 2, asegúrate de que los registros históricos se gestionen correctamente.
En Pentaho me sale el sigueinte error y no consigo corregirlo: Add sequence.0 - ERROR (version 9.4.0.0-343, build 0.0 from 2022-11-08 07.50.27 by buildguy) : Counter value for start could not be parsed, original value is \[${Max\_Registro\_Id}] which becomes \[]. Error: For input string: "".

Muy muy muy pobre las explicaciones, y enredadas a más no poder.

Hola, el etl me da error en el add sequence. "Step \[add sequence] is invalid as target." Este es el error log