Crea una cuenta o inicia sesión

¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera

¿Qué es ETL?

9/30
Recursos

Muchas veces nuestros datos no están listos para ser analizados visualmente, por lo que debemos pasarlos por un proceso conocido como ETL.

ETL es un proceso intermedio entre las fuentes de datos originales de donde extraemos información, y el modelado de datos para su posterior análisis. ETL consta de tres pasos:

Paso 1: Extract

Extraer datos desde cualquier fuente, ya sea archivos planos, binarios, bases de datos o servicios cloud. Pueden ser fuentes operacionales internas (es decir, que recopilan información de transacciones en nuestra empresa), o bien fuentes externas. Esto en función de los análisis que se quieran llevar a cabo.

Paso 2: Transform

Transformar, limpiar o enriquecer la información extraída sin modificar la fuente. Es en este paso que se ajustan los datos según el modelo de datos (el cual se diseña previo a la creación del ETL).

Paso 3: Load

Cargar los datos ya transformados al modelo de datos.

Contribución creada con los aportes de: Ciro Villafraz.

Aportes 31

Preguntas 8

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

¿Qué es ETL?

Extract (extraer): Desde prácticamente cualquier fuente de datos, desde archivos planos hasta complejos, bases de datos o servicios cloud.
Transform (transformar): Permite modificar o enriquecer la información extraída sin modificar la fuente.
Load (cargar): Una vez realizada la transformación, se encarga de cargar el resultado al modelo de datos.

¿Qué es ETL? (Extract Transform Load)


.

  • Extract (extraer): Procesos para conectar a las fuentes de origen, desde prácticamente cualquier fuente de datos, archivos planos (Ej. csv) hasta complejos, bases de datos o servicios cloud (Ej. Azure, AWS)

  • Transform (transformar): Procesos de validación de información, convertirla en información homogenia y limpiar, filtrar, ordenar, Permite modificar o enriquecer la información extraída sin modificar la fuente

  • Load (carga): Carga de información transformada y válidada en los repositorios de destino, modelo de datos (Data Warehouse, o Data Mart)

.

Luego de realizar todo esto ya podriamos utilizar herramientas de Business Intelligence como Power BI, para generar informes de visualización y entregar a los respectivos usuarios para que realicen el proceso de analisis y toma de desiciones

.
Los procesos de ETL son muy importantes, se considera que suponene el 80% del esfuerzo en todo el proceso involucrado, es decir desde el origen hasta cuando los usuarios toman decisiones

Por lo general las fuentes de información no están listas para su visualización.

Para obtener una estructura de datos correcta, debemos realizar una transformación de datos.

¿Qué es ETL?

parte inicial del flujo de BI (Business Intelligence)

  • Extract (extraer)

    obtener datos desde cualquier fuente.

  • Transform (Transformar)

    modificar o enriquecer la información extraída SIN MODIFICAR LA FUENTE

  • Load (cargar)

    los datos transformados se cargan a un modelo de datos.

ETL stands for :

  • Extract: is related to extract data from basically any source
  • Transform: allows to modify information without modifying the source.
  • Load: this process is done when the data is ready to be handle by any viz sofware to bring conclustions.

Una herramienta muy útil para trabajar con ETL es: Pentaho

Preparación de datos. ETL: Extract (extraer): Desde prácticamente cualquier fuente de datos, archivos planos hasta complejos, bases de datos o servicios cloud. Transform (transformar): Permite modificar o enriquecer la información extraída sin modificar la fuente inicial Load (cargar): Una vez realizada la transformación, se encarga de cargar el resultado al modelo de datos. Explotada visualmente.

ETL. Extraer los datos desde diversas fuentes estructuradas, semiestructuradas y no estructuradas. Se transforma para adaptarlas a las necesidades del negocio. Cargarlas a los repositorios o los ficheros, en este caso, el fichero de Power BI con extensión .pbix

hola soy totalmente nuevo en esto …vamos aprendiendo .
gracias

Al escoger las fuentes de datos, es fundamental asegurar la calidad y la disponibilidad de los datos; en el caso particular de este curso, algunas fuentes no están disponibles. Estas situaciones echarían a perder un gran trabajo y la desconfianza de nuestro producto o servicio.

Se me generaron muchas inquietudes que espero se resuelvan en las próximas clases:

  • Cómo podemos hacer que la extracción sea eficiente y no cargue los sistemas de la fuente?
  • Hay técnicas para ETL? tipos de arquitecturas de datos o de fuentes? Algoritmos?
  • Cómo se puede evaluar la calidad y el rendimiento de un proceso ETL?
  • Cómo mejorar la seguridad y eficiencia del proceso?

¿Qué es ETL?Extracción, transformación y carga (Extract Transform Load, ETL) es el proceso que las organizaciones impulsadas por datos utilizan para recopilar datos de distintas fuentes para luego reunirlos a fin de facilitar el descubrimiento, la generación de informes, el análisis y la toma de decisiones.

Pasos ETL

Durante la extracción, ETL identifica los datos y los copia desde sus orígenes, de modo de poder transportar los datos al almacén de datos de destino. Los datos pueden proceder de orígenes estructurados y no estructurados, incluidos documentos, correos electrónicos, aplicaciones de negocios, bases de datos, equipos, sensores y terceros, entre otros.

Transformación
Dado que los datos extraídos no están procesados en su formato original, se deben asignar y transformar a fin de prepararlos para el almacén de datos final. En el proceso de transformación, ETL valida, autentica, desduplica o agrega los datos de manera que los datos resultantes sean fiables y se puedan consultar.

Carga
ETL traslada los datos transformados al almacén de datos de destino. Este paso puede implicar la carga inicial de todos los datos de origen o puede ser la carga de los cambios incrementales en los datos de origen. Puede cargar los datos en tiempo real o en lotes programados.

IV. ¿Qué es ETL?

1. Extract: Extraer de cualquier fuente de información: Archivos planos, bases de datos, servicios cloud
2. Transform: Permite modificar o enriquecer la información extraída sin modificar la fuente

Load: Cargar la información a un repositorios de datos

El ETL es lo mas utilizado actualmente, pero no olvidemos que cada minuto tenemos una mayor cantidad de información y por tal motivo ya existen tecnologías y metodologías de Big Data como el ELT

Conectarse a tablero de gestión de equipos en Azure DevOps

ETL es un paso intermedio en la gestion de nuestros datos y modelado para su análisis. Los pasos que debemos seguir son:
Extraer
Transformar
Cargar

¿Qué es ETL?

ETL es un proceso intermedio entre las fuentes de datos originales de donde extraemos información, y el modelado de datos para su posterior análisis.

La clase de ETL siempre se ve en todos estos cursos jajajaj no falla

ETL proceso intermedio entre las fuentesde datos de origen y el modelo de datos para su posterior analisis Extract extraer datos desde cualquier fuente archivos planos binarios o servicios cluod Transform transforma limpia o enriquece la informacion Load carga los datos ya transformados al modelo de datos

ETL
Es un acrónimo que usamos para
Extract
Transform
Load

Listo

habra una clase usando etl con sql server y visual basic ?

¿Qué es ETL?
Extract (Extraer):
Desde practicamente cualquier fuente de datos, desde archivos planos hasta complejos, base de datos o servicios cloud.

Transform (Transformar):
	Permite modificar o enriquecer la información extraída sin modificar la fuente.

Load (Cargar):
	Una vez realizada la transformación, se encarga de cargar el resultado al modelo de datos.

Hace unos años existía la posibilidad de conectarse a Facebook y extraer la información de seguidores, posts, etc. Luego quitaron esa opción. Creo que todavía es posible utilizando servicios de Supermetrix.

Es primera vez que escucho esa terminación.

en la nueva versión de Platzi no se ven los recursos
Cuando van a actualizar eso para que aparezcan los recursos de las clases?????
Excelente desarrollo, apuntes 🚀
Que emoción iniciar a trabajar con power bi
ower BI permite conectarnos a una gran variedad de fuentes de datos, desde archivos Excel, bases de datos en SQL Server, hasta sitios en la web. **Tipos de conexión:** ● ***Importación:*** Los datos se

Aportes de esta grandisima clase sobre ETL ✨🚀

ETL se centra en

  • Extraer, cualquier fuente de informacion, base de datos servicios de datos issues

  • Transformar, modificar, corregirla, enriquecer la informacion extraida sin modificar la fuente de informacion inicial

  • Cargarla, a un repositorio, donde tenemos una estructura homologada y lista para ser explotada visualmente -> power center

![]()![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202023-09-23%20202457-e98d7d6d-37ed-489d-85b0-6a872c667c4b.jpg)