¿Qué es ETL?

5/25
Recursos

Aportes 5

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

¿Qué es ETL?

Extract (extraer): Desde prácticamente cualquier fuente de datos, desde archivos planos hasta complejos, bases de datos o servicios cloud.
Transform (transformar): Permite modificar o enriquecer la información extraída sin modificar la fuente.
Load (cargar): Una vez realizada la transformación, se encarga de cargar el resultado al modelo de datos.

¿Qué es ETL? (Extract Transform Load)


.

  • Extract (extraer): Procesos para conectar a las fuentes de origen, desde prácticamente cualquier fuente de datos, archivos planos (Ej. csv) hasta complejos, bases de datos o servicios cloud (Ej. Azure, AWS)

  • Transform (transformar): Procesos de validación de información, convertirla en información homogenia y limpiar, filtrar, ordenar, Permite modificar o enriquecer la información extraída sin modificar la fuente

  • Load (carga): Carga de información transformada y válidada en los repositorios de destino, modelo de datos (Data Warehouse, o Data Mart)

.

Luego de realizar todo esto ya podriamos utilizar herramientas de Business Intelligence como Power BI, para generar informes de visualización y entregar a los respectivos usuarios para que realicen el proceso de analisis y toma de desiciones

.
Los procesos de ETL son muy importantes, se considera que suponene el 80% del esfuerzo en todo el proceso involucrado, es decir desde el origen hasta cuando los usuarios toman decisiones

Por lo general las fuentes de información no están listas para su visualización.

Para obtener una estructura de datos correcta, debemos realizar una transformación de datos.

¿Qué es ETL?

parte inicial del flujo de BI (Business Intelligence)

  • Extract (extraer)

    obtener datos desde cualquier fuente.

  • Transform (Transformar)

    modificar o enriquecer la información extraída SIN MODIFICAR LA FUENTE

  • Load (cargar)

    los datos transformados se cargan a un modelo de datos.

ETL stands for :

  • Extract: is related to extract data from basically any source
  • Transform: allows to modify information without modifying the source.
  • Load: this process is done when the data is ready to be handle by any viz sofware to bring conclustions.