Muchas veces nuestros datos no están listos para ser analizados visualmente, por lo que debemos pasarlos por un proceso conocido como ETL.
ETL es un proceso intermedio entre las fuentes de datos originales de donde extraemos información, y el modelado de datos para su posterior análisis. ETL consta de tres pasos:
Paso 1: Extract
Extraer datos desde cualquier fuente, ya sea archivos planos, binarios, bases de datos o servicios cloud. Pueden ser fuentes operacionales internas (es decir, que recopilan información de transacciones en nuestra empresa), o bien fuentes externas. Esto en función de los análisis que se quieran llevar a cabo.
Paso 2: Transform
Transformar, limpiar o enriquecer la información extraída sin modificar la fuente. Es en este paso que se ajustan los datos según el modelo de datos (el cual se diseña previo a la creación del ETL).
Paso 3: Load
Cargar los datos ya transformados al modelo de datos.
Contribución creada con los aportes de: Ciro Villafraz.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?