No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

14 Días
7 Hrs
24 Min
54 Seg

Orquestar ETL en Pentaho: job

24/26
Recursos

Aportes 1

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Orquestar un ETL en Pentaho usando un **job** implica estructurar los pasos necesarios para ejecutar transformaciones, manejar flujos condicionales, y realizar tareas como mover archivos, enviar correos, o cargar datos. Aquí tienes una guía práctica para crear un **job** en Pentaho Data Integration (PDI): ### **Pasos para crear un job en Pentaho** #### **1. Crear un nuevo Job** 1. Abre *Spoon*. 2. Ve a `File > New > Job`. 3. Se abrirá un lienzo en blanco específico para un job. #### **2. Definir los elementos básicos del job** Un job puede incluir los siguientes elementos: * **Start**: El paso inicial que activa el flujo del job. * **Transformations**: Los ETL propiamente dichos (cargar, transformar, o exportar datos). * **Tareas adicionales**: * Mover o copiar archivos. * Ejecutar comandos de shell. * Conectar con servicios externos como bases de datos, FTP, o APIs. * Condiciones para decidir qué pasos ejecutar basándose en resultados previos. #### **3. Configurar el paso inicial** 1. Arrastra el icono de **Start** desde la paleta a tu lienzo. 2. Conéctalo al siguiente paso que quieras ejecutar. ### **4. Agregar transformaciones** 1. **Añadir transformaciones al job**: * Arrastra el objeto **Transformation** desde la paleta al lienzo. * Haz doble clic en el objeto y selecciona la transformación (`.ktr`) que deseas ejecutar. 2. **Pasar parámetros entre job y transformación**: * Ve a la pestaña *Parameters* al configurar la transformación. * Define los parámetros necesarios (como nombres de tablas o rutas de archivos). * Vincúlalos con valores desde el job. ### **5. Añadir pasos de control** * **Decisiones condicionales**: * Usa el paso **Evaluate rows number in a table** para verificar condiciones en la base de datos. * Usa **Check if a file exists** para validar la existencia de archivos antes de procesarlos. * **Manejo de errores**: * Configura conexiones condicionales desde un paso hacia otro en caso de éxito o fallo. * Utiliza el paso **Abort job** para detener la ejecución si ocurre un error. ### **6. Trabajar con sistemas externos** 1. **Mover archivos**: * Usa el paso **Copy Files** para mover o copiar archivos entre directorios. * Configura las rutas de origen y destino. 2. **Ejecutar comandos**: * Usa **Shell** para ejecutar scripts o comandos de sistemas operativos. 3. **Enviar correos electrónicos**: * Usa **Mail** para notificar al equipo de resultados o errores. * Configura el servidor SMTP y los detalles del correo. ### **7. Configurar el flujo del job** 1. Conecta los pasos arrastrando líneas entre ellos. 2. Configura las condiciones de flujo: * **Éxito**: Ejecuta el siguiente paso solo si el actual tuvo éxito. * **Error**: Redirige el flujo en caso de fallo. 3. Define condiciones usando los conectores: * Haz clic derecho en una línea de conexión y selecciona una opción (éxito, error, o ambos). ### **8. Probar y depurar el job** 1. Ejecuta el job desde *Spoon*: * Haz clic en el botón de **Run**. * Configura cualquier parámetro necesario. 2. Observa la consola de logs para identificar problemas. 3. Usa opciones como *Breakpoints* y *Step Metrics* para depuración detallada. ### **9. Guardar y documentar** 1. Guarda el job con la extensión `.kjb`. 2. Añade comentarios y documentación en los pasos para que el flujo sea comprensible. ### **10. Implementar en un servidor de ejecución** Si deseas orquestar y ejecutar este job automáticamente: 1. Usa el cliente **Kitchen** para ejecutar el job desde línea de comandos. 2. Agrega el comando a un *cron job* o tarea programada para ejecución periódica. **Ejemplo de comando para ejecutar un job**: kitchen.sh -file=/ruta/del/job.kjb -level=Basic -param:PARAM1=valor1 -param:PARAM2=valor2