Necesito un sistema para generar, de manera rápida y eficiente, un mapeo de datos. Además, necesito que esa herramienta me ayude a generar el ETL y este puede ser que lo haga en Python o en Pentaho (PDI).
He cogido el resultado que obtuve en Pentaho en un proyecto anterior y he intentado hacer ingeniería inversa.
Para ello he especificado en lenguaje natural lo que quiero obtener (especificaciones).
Le he pedido a ChatGPT-3.5 que genere:
- Documento de mapeo
- ETL en Python
- ETL (pasos) en Pentaho
El resultado es que, habiendo hecho un análisis exploratorio de los datos, viendo como se relacionan las fuentes (raw) de datos y sabiendo lo que queremos en la salida, el resultado es muy muy bueno y en total he tardado unos minutos.
Obviamente, Edison propone un método que es óptimo a nivel didáctico. Yo necesito, mañana lunes a las 8 de la mañana, aplicar un método muy muy eficiente y rápido.
Ah, si no me convence el resultado, repito el proceso hasta que me convenza.
El resultado de esta prueba la podéis encontrar en mi repositorio del curso en GitHub y en el proyecto del mismo (PROWPI003).
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?