No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Documento de mapeo

16/26
Recursos

Aportes 4

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

profesor buenas tardes, de donde puedo descargar la base de datos para poderlo realizar.
Un **documento de mapeo** es una herramienta clave en procesos de ETL y modelado de datos, ya que especifica cómo se deben transformar y mover los datos desde las fuentes hacia los destinos, como un Data Warehouse. A continuación, se detallan los pasos para crearlo y cómo realizarlo: ### **1. Definir el objetivo del documento** * **¿Qué se necesita lograr?** * Consolidar datos en un Data Warehouse. * Transformar datos para un reporte específico. * Cargar datos en una tabla destino con un esquema definido. * **¿Quiénes son los usuarios principales?** * Equipo de ETL, analistas de datos, o desarrolladores. ### **2. Identificar las fuentes de datos** * **Pasos:** * Listar las bases de datos, archivos, o APIs que contienen la información necesaria. * Especificar detalles técnicos: * Nombre de la base de datos o archivo. * Tablas, columnas, o endpoints relevantes. * Tipos de datos en cada columna. * Reglas de acceso o autenticación. * **Ejemplo:**FuenteTabla/ArchivoColumnaTipo de DatoDetallesCRMClientesID\_ClienteINTClave primariaERPVentasFecha\_VentaDATEFecha de venta ### **3. Definir el destino** * **Pasos:** * Establecer las tablas destino y sus esquemas. * Documentar las relaciones entre tablas si es un modelo dimensional. * Identificar restricciones (índices, claves foráneas, etc.). * **Ejemplo:**Tabla DestinoColumnaTipo de DatoRestriccióndwh.dim\_clientesid\_clienteINTClave primariadwh.fact\_ventastotal\_ventaDECIMAL(10,2)No nulo ### **4. Mapear las transformaciones** * **Pasos:** * Especificar cómo se transformarán los datos: * Cambios de formato (fechas, números). * Unión de datos de múltiples fuentes. * Limpieza de datos (eliminar duplicados, manejar nulos). * Incluir reglas de negocio que afecten las transformaciones. * Definir validaciones requeridas. * **Ejemplo:**FuenteColumna OrigenTransformaciónColumna DestinoCRM.ClientesNombre, ApellidoCONCAT(Nombre, ' ', Apellido)Nombre\_CompletoERP.VentasFecha\_VentaFORMAT(Fecha\_Venta, 'yyyy-MM-dd')FechaERP.Ventas, CRM.ClientesID\_Venta, ID\_ClienteJOIN por ID\_ClienteCliente\_Venta ### **5. Especificar los controles de calidad** * **Pasos:** * Definir qué verificaciones asegurarán la calidad de los datos. * Validar valores nulos o atípicos. * Verificar que las claves primarias son únicas. * Comparar totales entre origen y destino. * Documentar los procedimientos de remediación para errores. * **Ejemplo:**ValidaciónReglaAcción en Caso de ErrorDuplicadosID\_Cliente debe ser únicoEliminar duplicadosRango de FechasFecha\_Venta > '2000-01-01'Ignorar registros fuera del rangoTipos de DatosTotal\_Venta es DECIMAL(10,2)Notificar error al desarrollador ### **6. Diseñar el flujo ETL** * **Pasos:** * Dibujar un diagrama que muestre: * Extracción de fuentes. * Transformaciones aplicadas. * Carga en destino. * Incluir herramientas o scripts utilizados. ### **7. Crear un cronograma** * **Pasos:** * Establecer el orden de ejecución de las tareas. * Definir dependencias y tiempos estimados. ### **8. Documentar excepciones y reglas adicionales** * **Pasos:** * Incluir notas sobre: * Reglas de negocio específicas. * Limitaciones conocidas de las fuentes de datos. * Manejo de errores (logs, alertas, etc.). ### **9. Validar el documento** * **Pasos:** * Revisar el documento con los equipos involucrados (negocio, desarrollo, QA). * Ajustar según sea necesario antes de iniciar el proceso ETL. ### **10. Ejemplo Completo de Mapeo** FuenteTabla DestinoColumna OrigenTransformaciónColumna DestinoReglas/NotasCRM.Clientesdwh.dim\_clientesNombre, ApellidoCONCAT(Nombre, ' ', Apellido)Nombre\_CompletoAplicar trim() para espacios extras.ERP.Ventasdwh.fact\_ventasFecha\_VentaFORMAT(Fecha\_Venta, 'yyyy-MM-dd')FechaFechas en formato ISO 8601.ERP.Ventasdwh.fact\_ventasTotal\_VentaRedondear a 2 decimalesTotal\_VentaIgnorar ventas negativas. Este documento detallado servirá como guía durante la implementación del proceso de ETL y ayudará a todos los equipos a mantenerse alineados.
veo que el curso incluye en el título modelado OLAP, pero no se llega a OLAP, solo a un modelo dimensional, entiendo que OLAP es cuando se hacen agregaciones o cubos como tal. **¿Cómo hago para elaborar el CUBO?**

Para la línea 4 es incorrecto el valor “customerid” la información debe venir desde “sales.customer.personid”, y tampoco es PK. Por favor corregir.