¿Qué son los procesos ETL?

5815Puntos

4 años

Gracias Carlos, a mi me queda muy claro la explicación de ETL y al no ser técnico mi perfil, cae como anillo al dedo. Hace 1 año me habría caído de perlas para un proyecto que tuve a cargo y el TL me hablaba de la construcción de la ETL y yo… Ni idea hjejejejej Muchas gracias por la explicación.

alarcon7a

15510Puntos

4 años

Que bueno que te haya quedado claro, saludos. 😃

andressan

12004Puntos

4 años

En analíticas del aprendizaje, vemos la escala de esta manera:
Dato–> Información -->Conocimiento --> Sabiduría

Dato: medidas, observaciones, evaluación de eventos, seleccionar, capturar.
Información: categorización, combinación, agrupación, agregar, crear informes.
Conocimiento: Estudio de tendencias, relevancia, basado en métricas, medir, predecir.
Sabiduría: Experiencia, juicio, experiencia, refinar, actuar.

Esta información hace parte del Big Data en educación, de cómo procesar y qué hacer, es un aspecto en construcción, igual solo quería compartirlo.

Piero_Gutierrez

15897Puntos

3 años

Gracias por el aporte, me ayudó bastante.

nattyherrera

21090Puntos

3 años

Qué buen aporte, gracias!!

andresfelipelg

21801Puntos

2 años

Muchas gracias por tu aporte

Piero_Gutierrez

15897Puntos

3 años

¿Qué son los procesos ETL?
Por sus siglas: Extract, Transform, Load.

En resumen, un proceso ETL consiste en extraer los datos crudos desde el origen (Source), transformarlos según nuestra conveniencia para el análisis y finalmente cargarlos a una base de datos orientada a procesos analìticos.

Extracción:
Hay dos maneras de extraer los datos, elegir una u otra dependerá del tipo de datos, su formato y sus características.
- Totales: En cada ejecución se extraen todos los datos. Esto es muy poco eficiente cuando trabajamos con muchos datos de diferentes formatos, pues saturará el motor de base de datos.
- Incrementales: El motor extrae en pequeños lotes varias veces. Un ejemplo de esto puede ser la recolección de datos diariamente, pero de los datos recopilados el día anterior.
Transformación:
Son una serie de procesos que se utilizan para lograr un buen proceso analítico.
Algunos ejemplos pueden ser: eliminar datos, calcular unos nuevos, unir datos de fuentes diversas, entre otras muchos procesos que se realizarán dependiendo de lo que quieras obtener una vez que los datos sean cargados.
Un aspecto importe es que estos procesos se llevan a cabo en repositorio temporal llamado “Staging”, el cual es eliminado una vez que los datos llegan al Target.
Carga:
Una vez que los datos salen del área de staging, deben ser cargados a una base de datos de analítica (usualmente es un datawarehouse) bien estructurada para el análisis de datos.

andresfelipelg

21801Puntos

2 años

Excelente aporte amigo

josefernandojaramilloboon

21883Puntos

4 años

muy bueno, hace poco me llego una oferta para un cargo en el que debía implementar ETL, ahora creo que estoy preparado por si la oferta resulta

alarcon7a

15510Puntos

4 años

vamos con toda :mus

iacostaco

28325Puntos

4 años

Me queda la duda si un ETL es funcional para un ambiente de análisis en datos en ambientes Cloud. Qué opinan?. Gracias a todos.

alarcon7a

15510Puntos

4 años

Si, y la demanda aumenta constantemente, ambientes cloud como GCP y AWS tienen muchas herramientas propias para esto, como data flow o Glue … y tambien analisis en tiempo real, sistemas de archivos y bases de datos.

iacostaco

28325Puntos

4 años

Gracias por tu respuesta @alarcon7a. Crees que a futuro estos procesos de ETL desaparezca?

alarcon7a

15510Puntos

4 años

No lo creo, al menos no en uno cercano, incluso tecnologias como AirFLow o Kafka tienen mucho peso actualemente.

frankel2021

11086Puntos

3 años

Pero que herramienta sugieren utilizar de etl para extraer datos de SQL server , Oracle, MySQL, MongoDB, Twitter?

henry0_4

6267Puntos

4 años

Tengo que hacer una investigación para mi Universidad sobre uno de los siguientes :
-Excel-SQL Server
-SSIS-SQL Server
-POWE BI-SQL Server
-TABLEU-SQL Server

¿Cual seria mas beneficioso de aprender? ya que no quiero aprender algo desfasado.

alarcon7a

15510Puntos

4 años

Veo que manejan muchos productos de Microsoft… son buenos pero existen muchas otras soluciones, TABLEU es muy robusto para la visualizacion y analisis de datos, me gusta como herramienta, por otro lado SSIS es muy bueno pero esta muy ligado a Microsoft y su ecositema.

neapi666

10875Puntos

4 años

Qlikview es una excelente herramienta, ETL, visualización y analítica. Hoy en día el producto es más moderno y se llama Qlik Sense. PoweBI es de Microsoft.

henry0_4

6267Puntos

4 años

Muchas gracias, por su respuesta.
¿Cuales son las opciones mas utilizadas hoy en día en el tema ETL?

andresfelipelg

21801Puntos

2 años

Gracias a tu pregunta, aprendi las diferencias gracias

jorcanha

6979Puntos

4 años

Trabajé un tiempo con la suite para ETL de Microsoft SSIS (SQL Server Integration Services), tiene elementos muy potentes y ayuda para crear las ETL con una interfaz grafica desde Visual Studio.
Pero pienso que restringe un poco a los equipos ya que requiere todo un stack de tecnologías de Microsoft y exige que todos en el grupo de trabajo usen Windows.
Considero esta nueva carrera de Platzi muy interesante

Davidre0795

33149Puntos

4 años

Encontraste alguna alternativa? yo también utilizo SSIS, pero siento que hay mejores opciones.

DiegoADaza

3592Puntos

4 años

Yo amo SSIS y si hay mas herramientas en el mercado, eso depende del dinero que quiera meterle la empresa a este tema.

alarcon7a

15510Puntos

4 años

Si, a mi me gusto mucho trabajar con Datastage de IBM y ODI de Oracle, pero soluciones como Pentaho me han funcionado bastante, son libres y faciles de implementar

jorcanha

6979Puntos

4 años

Gracias por las respuestas !
No tuve que buscar mas opciones, fue para un proyecto muy puntual en el que el cliente ya tenía todo en SSIS.
Aparte de crear algunas ETL, tambien creamos servicios REST para conectar algunas aplicaciones.

andresfelipelg

21801Puntos

2 años

Lo voy a tener presente

artus88

8622Puntos

4 años

Gracias por la breve explicacion, desde hace unos meses estoy en un proyecto de ETL y a sido todo una lucha entender las conversiones que hay en el ramo, por eso estoy aqui. Usamos Teradata como DW y nos ayudamos de datastage, shell scripts y btq scripts para esta actividad, hasta la fecha no entiendo varias cosas, por eso apenas empiezo en la escuela de data science para no perderme nada.

alarcon7a

15510Puntos

4 años

datastage es un muy buen motor de ETL, la Infosphere de IBM es magica, y si… hay mucho por aprender pero aca te ayudaremos en ese proceso.

luismalagon1212842

24Puntos

3 años

Excelente post, que completamente claro que es un proceso de ETL

juansacdev

26994Puntos

4 años

Que grande me hace mas ganas de las que ya tengo de enfocarme en ser un backend, con experticia en base de datos!!!
Me encanta!

ingluisparrap

8305Puntos

4 años

Adelante!!!

alarcon7a

15510Puntos

4 años

Genial, yo fui backend en un comienzo, pero luego pase a ser ingeniero de datos, arquitecto, DBA y data scientist… se complementa todo muy bien

acrfinance

35993Puntos

4 años

Whoa!!! hace mucho quería saber de esto (después de la clases de fundamentos de bases de datos), estoy terminando mi path en Fundamentos de programación para meterme de lleno en la escuela de Data science, Estos cursos que recomiendas los puedo encontrar en ese path?

alarcon7a

15510Puntos

4 años

Estan en rutas separadas, pero puedes agregar el path de la escuela de data science.

nestorserrano

5039Puntos

3 años

Hola, para un ETL eficiente se deben tener 3 motores de base de datos o solo 3 instancias? Es decir si deseo extraer de PostgreSQL y Excel puedo combinar los datos transformados en otra base de Datos PostgreSQL para el Staging y finalizar en esa misma base de datos con los valores normalizados o debo aislar los 3 procesos. Gracias. Excelente explicación.

alarcon7a

15510Puntos

3 años

Es posible, aunque hay otros lenguajes un poco mas eficiones para el manejo de datos en staging como lo es python pero lo que planteras es totalmetne posible

jmbuelvas

3422Puntos

4 años

Hola, para iniciar en el mundo de data science, adicional a esta escuela que ofrece Platzi que otra formación se requiere para complementar, o si con todos estos cursos puede uno iniciar esta carrera, agradezco por la respuesta y orientación que me pueda brindar

alarcon7a

15510Puntos

3 años

Estamos formando la escuela para que tengas todo lo necesario para iniciar tu vida como un data scientist, data engenieer o data analyst!! :mus

josmyescorcia

68Puntos

3 años

Que importante es conocer esto, apenas estoy empezando en este mundo, soy ingeniero industrial, y ya excel se me queda pequeño, al conocer Power BI quiero dar el siguiente paso en el analisis de datos, y me enteré de que existe este mundo gigante del data. Creo que llegue para quedarme.

Saludos

carlosdla26

15137Puntos

3 años

Recién estoy entrando al mundo de la ciencia de datos y no me cabe duda que con explicaciones como esta voy a aprender bastante rápido todos los conceptos. Muchas gracias por el contenido ha sido de gran utilidad.

Alexander_Roman938

9484Puntos

4 años

Los cientificos de datos necesitamos saber hacer ETLS ?

alarcon7a

15510Puntos

3 años

usualmente ese proceso es responsabilidad de ingenieros de datos, pero la verdad que sepas como funciona y puedas implementarlo te da muchas ventajas.

rafa-romero

4027Puntos

4 años

Interesante esta información,me motivo a tomarlo,muchas gracias

Henrytamp

10087Puntos

4 años

Excelente explicación

dcontador14

2554Puntos

4 años

Que magistral la explicación del proceso, quedo super claro y aun mas motiva a indagar mucho mas para generar mas y mejores practicas para la extracción exitosa de datos en diversos ámbitos y tener un mejor desempeño en el análisis de estos 😃

orlandoaltamiranda

23041Puntos

3 años

Excelente articulo, entré sin saber que era ETL y terminé sabiendo hasta todo su proceso. Gracias Carlos, muy buen trabajo 😃

crlsrmo

3843Puntos

3 años

Gracias Carlos Andrés, increíble la información de este Post! Muy buena información y fácil de digerir para quienas apenas empezamos en este mundo del Big Data!

Celemin

6557Puntos

3 años

Gracias por la explicación

Jpavel

3739Puntos

4 años

Interesante!

david-aguirre

15379Puntos

4 años

Me sentí como regresar a mis clases de Base de Datos en la Universidad, gracias por la contribución

jhonjbautistab

13577Puntos

4 años

Gracias Carlos por esa grandiosa explicación, realmente sigo convencido que tome la mejor desición para cambiar mi carrera y ser data science

DonTapas88

8034Puntos

4 años

Super este post. La verdad hacia este proceso de ETL (Pentaho Data Integration) desde hace rato y no sabia que tuviera mucha salida y campo de accion. Gracias!!!

alarcon7a

15510Puntos

4 años

Si, es muy importante en todo proceso de analitica

carlos_esp_50

51316Puntos

4 años

Muy buen post. Me queda por aprender, pero son cosas que me sirven para llegar con más conceptos claros
Gracias

alarcon7a

15510Puntos

4 años

que bueno que te haya gustado, saludos.

bernardoaguayoortega

24901Puntos

4 años

Increíble, muchas gracias.

JossX7

3048Puntos

4 años

nice

neapi666

10875Puntos

4 años

Qlikview es una excelente herramienta, ETL, visualización y analítica. Hoy en día el producto es más moderno y se llama Qlik Sense. Aquí el trabajo es diferente, no utiliza DW, utiliza archivos propios binarios y análisis en memoria. Muy bueno, revisarlo.

JFacplay

1753Puntos

4 años

Gracias Carlos, ya he trabajado un poco con ETLs y es bastante interesante.

AdrianGutiR

26117Puntos

4 años

Gracias Carlos, por fin una explicación puntual de una ETL. a seguir aprendiendo.

alarcon7a

15510Puntos

4 años

me alegra te haya sido útil… :musc

cristhian7293

2691Puntos

4 años

Quedo clarísimo que es ETL. Muchas gracias Carlos
Saludos.

alarcon7a

15510Puntos

4 años

Que bueno que te haya sido útil 😃

jguillenbarrios

4331Puntos

4 años

Buen post, explicado de manera sencilla. Siempre será una parte importante del proceso de análisis. Herramientas para este proceso que he manejado en algún momento: SSIS, Informatica PC, Pentaho Data Integrator, Talend… eh incluso SQL directo. Creo que la herramienta dependeré del requerimiento. Saludos!

alarcon7a

15510Puntos

4 años

asi es, depende mucho del requerimiento, el presupuesto y la integracion con otros sistemas.

_juancarlosortega

8012Puntos

4 años

Excelente Blog!!

luisnava

3213Puntos

4 años

Inetresante, muchas gracias por compartir y dar una idea de como se hace esto. Muy bien explicado.

esteban_messerliano_

290Puntos

4 meses

"si basura entra, basura sale"
Un pequeño error en los datos puede hacer cambiar el rumbo de las decisiones de forma exponencial. En mi opinión, es la parte más interesante de la ciencia de datos.

neicervasquez12

9260Puntos

8 meses

Excelente artículo @alarcon7a, me ayudaste a entender un poco mejor el tipo de pipeline ETL.

sjlo

22865Puntos

un año

Gracias Carlos! Me parece precisa y clara la explicación sobre qué es un ETL. Especialmente porque me estoy iniciando en la via de Ciencia de Datos y me resultaba confuso este proceso.

darwinjosuepacheco

622Puntos

2 años

Gracias por este material de estudio

HenryPeraltaDev

18014Puntos

2 años

Gracias muy buena informacion

calozano8

6115Puntos

2 años

Los procesos ETL (Extract, Transform, Load) son un conjunto de tareas que se utilizan para mover datos de un lugar a otro. ETL es una sigla que se refiere a las tres operaciones principales que se realizan en un pipeline ETL:

Extract (Extracción): Esta tarea consiste en extraer datos de diferentes fuentes, como bases de datos, archivos de datos, sensores o APIs de terceros.
Transform (Transformación): Esta tarea consiste en modificar los datos de alguna manera, como limpiarlos, formatearlos, calcular nuevos valores o agregar información adicional.
Load (Carga): Esta tarea consiste en cargar los datos transformados en un destino final, como una base de datos o un almacenamiento de datos.

Los procesos ETL se utilizan a menudo para integrar datos de diferentes fuentes y prepararlos para su análisis o uso en otras aplicaciones. Por ejemplo, una empresa podría utilizar un pipeline ETL para extraer datos de diversas bases de datos, transformarlos en un formato común y cargarlos en un almacenamiento de datos para su análisis posterior.

leonel.grisalena

5568Puntos

2 años

Buenisimo el posteo. Un resumen de algo fundamental en cualquier proceso de Data Science

andresfelipelg

21801Puntos

2 años

Muchas gracias me quedo muy claro

andresfelipelg

21801Puntos

2 años

Excelente explicacion, tenia dudas y aca las resolvi

RAlphaEl

3826Puntos

2 años

Creo que quedo claro y hasta este momento no hay duda.

madison-eduardo

53305Puntos

2 años

Excelente explicación!

cata-galindo

2048Puntos

4 años

Excelenteeeeeeeeeeee … muchas gracias 😄

Alexander_Roman938

9484Puntos

4 años

Excelente contenido , muchas gracias!

resparzasoto

14016Puntos

4 años

En mi trabajo el uso de ETL con MSSQL es el pan de cada día, es muy importante en el manejo de la información.

También es importante tener en cuenta que existen enfoques diferentes en el manejo de la información, como el TTL (Time To Live) , en dónde la información expira y es más adecuado para un enfoque de monitoreo o de paso.

Muy buen post 💚

ingluisparrap

8305Puntos

4 años

Gracias por el post, buen contenido!

nicolas.chamorro

5045Puntos

2 años

super bueno Carlos, la información es muy clara y me deja con buenas bases para seguir aprendiendo, muchas gracias.

dmeikeru01

2042Puntos

2 años

https://www.juanbarrios.com/wp-content/uploads/2022/03/1-6tNymvTTqGIWJlzQHwBaw.png

Hay que tener en cuenta también que existen estos dos conceptos y no debemos confundirlos.

jrenerojasb

2732Puntos

2 años

Gracias Carlos. Muy práctico y especifico.

josemontes.martinez1

7633Puntos

2 años

Más nutritivo que cualquier sitio de consulta, Gracias master!!!

sarismejiasanchez

18109Puntos

2 años

Excelente artículo, en este mundo de la tecnología nunca dejamos de aprender cosas nuevas o profundizar las que ya “sabemos”.
Mil gracias Carlos, chévere encontrar contenidos tan claros y completos como este.

Karlita2m

25025Puntos

2 años

Increíble, estoy comezando a explotar todo el tema de los datos y este articulo fue tan bien explicado que lo entendí perfecto.
Agradecida con este aporte.

mtatiana115

11406Puntos

2 años

Hola Carlos, Hasta el momento soy muy novata con toda la terminología, pero gracias a tu post me ha quedado mas clara esta nueva información.

andreadema14

2646Puntos

2 años

Hola! una duda, que herramientas suelen utilizar para ETL?

cota_br

3998Puntos

3 años

Este tipo de lecturas ayudan mucho a la comprensión de los temás y son un gran complemento a los cursos o retos que se lleguen a tomar. Felicidades.

sebastianmarmanillo18

1225Puntos

3 años

Gracias Carlos!
Soy totalmente nuevo en el mundo de análisis de datos y logré entender el proceso e importancia que tiene el hecho de saber que data va a entrar para extraerla , transformarla y analizarla.

eskorbutincol

4360Puntos

3 años

Muchas gracias, me queda muy claro el proceso.

traviezolgustavoj751

3150Puntos

3 años

Siempre intenté crear una secuencia por mi propia cuenta, pero esto resume todo de la mejor forma. Gracias!!

DannySan

1871Puntos

3 años

Que genial!
Siempre me han apacionado los datos, he trabajado con ellos y me encanta ayudar con la generación de información de valor a partir de datos :3

Sueño con especializame y trabajar en este campo, logrando grandes cosas para mi comunidad. Espero que Platzi me ayude con esto 😄

arabeiq

5819Puntos

3 años

Excelente informacion, gracias por este blog me esta ayudando en mi aprendizaje en el Data Analytics

PaulaJaramillo

24388Puntos

3 años

Gracias Carlos, este tipo de documentos me ayudan mucho para alimentar léxico y entender conceptos requeridos en este campo. Saludos.

jairho-tc

4587Puntos

3 años

Veo muy interesante este tema, espero ver donde lo puedo aplicar mas adelaten!

arcesblas

18957Puntos

3 años

Excelente información, muchas gracias por el aporte. 💯

tronos

2957Puntos

3 años

Gracias por el aporte, lo había escuchado pero no tenia claro cual era su fin

nattyherrera

21090Puntos

3 años

Soy nueva en este tema de análisis de datos, realmente me ha encantado toda la info qué he estudiado hasta el momento!! también me he dado cuenta que desde hace tiempo vengo realizando labores con grandes bases de datos y no había logrado entender la dimensión e importancia de este perfil en los próximos años!! de mucha utilidad el articulo, gracias!!

elvisballadaresbravo

3382Puntos

3 años

Excelente explicación del proceso de extracción, transformación y carga.

Adrian_Campos

19223Puntos

4 años

¿Platzi utiliza un ETL? ¿Si lo hace, como es? ¿Y de igual forma cuales serian algunos ejemplos en el ambiente laboral respecto a este tema?

alarcon7a

15510Puntos

4 años

Si, tenemos varios procesos de ETL, muchos de ellos se ejecutan a traves de lambdas en AWS mediante python.

DiegoADaza

3592Puntos

4 años

Si alguien necesita asesoría sobre ETLs tengo 5 años de experiencia jejeje cualquier duda con gusto 😃 😄

bcalero0797

13992Puntos

4 años

Hola, yo estuve escrapeando una pagina la cual queria extraer el texto, pero al extraerlo salen simbolos como \r\ no es el encode ya que esta en español y las palabras que sustituye por ese simbolo son diferentes, ningun simbolo especial aveces son vocale. Sabes a que se puede deber?

alarcon7a

15510Puntos

4 años

quiza el encode en algun punto cambia, es posible que san los acentos? … la mejor manera de trabajar estos textos son con expresiones regulares

bcalero0797

13992Puntos

4 años

Muchas gracias @alarcon7a , estoy llevando ese curos para poder scrapear ahi, Imprimiento las etiquetas completas no se ve ese error, solo al seleccionarlas una por una.

DiegoADaza

3592Puntos

3 años

Revise por favor que el archivo este en formato ANSI y que la configuración del codepage este en 1252 Latin 1

catalinacastillo_11

1940Puntos

3 años

Muy buena la explicación, especialmente para personas como yo que estamos empezando

paulmanobanda

15022Puntos

4 años

Excelente información!!! Muy claro.

alarcon7a

15510Puntos

4 años

Gracias! 😃

kqh93

1990Puntos

4 años

Lo he utilizado mucho en mi experiencia laboral ya que me permite crear tareas automáticas para la transformación de datos o generación de backups. Aunque siempre he querido implementarlo para migrar grandes cantidades de datos en repositorios DWH tal vez en cloud, tengo entendido que es el principal uso que le dan esta herramienta, muy interesante.

gonzalo986

30169Puntos

4 años

Muy buen post! Gracias por compartir!

alarcon7a

15510Puntos

4 años

a ti por leerlo 😃

Osw16

9560Puntos

4 años

Excelente, gracias por el aporte. Justo esos cursos los tengo en mi lista.

alarcon7a

15510Puntos

4 años

Excelente te ayudaran bastante

artu-baduna

11391Puntos

4 años

I like to have more blog in English
i am not know. me want know
I do not if there is more blog in English, but I would like there
yo no si hay mas blog en ingles, pero me gustaría que haya

alarcon7a

15510Puntos

4 años

Trabajaremos en ello 😃

PedroHincapie

11026Puntos

4 años

Que blog tan descriptivo y curioso.
Muchas gracias por el aporte.

Super

alarcon7a

15510Puntos

4 años

Me alegra que te haya gustado.

joseluisquisan

17359Puntos

4 años

Me recuerda mucho a Splunk! 👩‍🚀

jsebastiandq

9044Puntos

4 años

Muy interesante, Muchas gracias @alarcon7a

alarcon7a

15510Puntos

4 años

Me alegra que ta haya gustado.

ju4nd3r

6764Puntos

4 años

Gracias por la información.
En mi empresa se trabaja con una herramienta llamada Tableau la cual hace extracciones incrementales de distintas bases de datos todos los días, esta información extraída la guarda en un archivo .hyper, ¿este archivo sería el data warehouse?

alarcon7a

15510Puntos

4 años

hay muchas arquitecturas de trabajo con datawarehouse, en big data es comun ver que los archivos de consulta esten en un file system como hdfs y luego son consumidos por otras herramientas, o si no la data se envia a bases de datos columnares como redshift o big query o Hbase para consultarlas, no se como sea la arquitectura que tienen en la empresa, pero puede ser posible.

jkp286

1017Puntos

4 años

Hola, muy buena la explicación, solo hay algo que no entiendo respecto a la extracción de los datos, espero hacerme entender en mi pregunta porque no está tan fácil jaja: la distinción entre una extracción total e incremental de los datos se debe a su generación?; es decir, solo cuando ya se tiene una base con todos los datos, se extraen de manera total, y cuando los datos se generan por periodos (según el ejemplo, diariamente) es que se extraen de manera incremental? O, incluso, cuando se tiene la base de datos completa la extracción se puede hacer de manera incremental?

alarcon7a

15510Puntos

4 años

Depende mucho del problema que tengas y del origen de datos, digamos si quieres llevarte las ventas al target, lo mas probable es que no te las lleves todas… si no solo las ventas del dia, puesto que lo mas probable es que tengas miles de registros de tus ventas historicas, de modo que al llevar solo las del ultimo dia, son extracciones incrementales, pero si es data de sigamos proveedores, posiblemente siempre te llevas todos los proveedores en una sola extraccion, pues no creo superen los cientos de registros… y de eso modo borras la data en el target y la insertas de nuevo siempre.

espero haber sido un poco mas claro

LuisdaLoaiza

2301Puntos

4 años

Gracias por la explicación. En mi experiencia profesional he tenido que hacer un proceso similar, no para tener al final un análisis de datos, pero si sacar la información de una base de datos, transformarla acorde de las necesidades de un nuevo software y por ultimo hacer la carga a una nueva base de datos. Esto ha despertado en mi mucha curiosidad por estos temas.