Documento de mapeo

Clase 16 de 26Curso de Data Warehousing y Modelado OLAP

Resumen

¿Cómo mapear documentos para el proceso ETL?

El mapeo de documentos es un paso crucial en el proceso ETL (Extracción, Transformación y Carga), ya que permite documentar todas las fuentes de datos y el destino de nuestro modelo. El objetivo es diseñar un documento que identifique de qué tabla y campo provendrá la información y cómo se almacenará en nuestro Data Warehouse.

¿Qué es un documento de mapeo y cómo se estructura?

Un documento de mapeo es una herramienta esencial para documentar el proceso de ETL. En él, se detalla tanto el origen como el destino de los datos:

  • Target (Destino): Indica la tabla y el campo de destino en el modelo dimensional del Data Warehouse.
  • Source (Origen): Incluye información sobre la tabla y columna de origen, si es una clave primaria, la transformación a aplicar, y cualquier observación relevante.
  • Estructura Sugerida:
    • Tabla de destino (Target)
    • Atributos y tipo de dato del destino
    • Observaciones y transformaciones necesarias
    • Tabla de origen (Source) y columna

¿Cómo se mapea una dimensión del modelo dimensional?

Para el modelo dimensional, se detalla cada dimensión, como 'clientes', y se identifica el origen de cada campo necesario para la dimensión. Se utiliza la base de datos creada previamente, como AdventureWorks, para rastrear las tablas y columnas que llenarán estos campos.

## Ejemplo de mapeo para la dimensión Cliente

- **ID de Cliente:** Proviene del campo `CustomerID` en la tabla `Customer` de AdventureWorks.
- **Nombre y Apellido:** Se obtienen de la tabla `Person`, de los campos `FirstName` y `LastName`.
- **Nombre Completo:** Se genera mediante la concatenación de `FirstName` y `LastName`, requerirá una transformación.
- **Números de Teléfono:** Requiere extracción y transformación de la tabla `PersonPhone`, diferenciando el tipo de teléfono (celular, casa, trabajo).
- **Ciudad de Resiencia:** Usando el campo `AddressID` en la tabla `Address` relacionada con `Person`.

¿Cómo se identifican transformaciones y condiciones en el mapeo?

En el mapeo, las transformaciones son necesarias cuando los datos no están en el formato exacto que se necesita o cuando requieren un cambio de estructura:

  • Transformaciones comunes:
    • Concatenación de campos (por ejemplo, Nombre Completo).
    • Diferenciación por tipo de teléfono usando códigos de tipo.
    • Formateo de fechas a un formato estándar.
  • Condiciones: Se pueden aplicar condicionales para separar datos en columnas específicas basadas en su tipo o atributo.

¿Qué retos se pueden encontrar en el mapeo ETL?

  • Identificación de Relaciones: Es esencial entender cómo las tablas se relacionan dentro de la base de datos, lo que puede requerir examinar diagramas de relaciones de tablas.
  • Homologación de Valores: Cuando diferentes campos en distintas tablas expresan conceptos similares, es crucial aplicar estándares y transformar los valores para que sean uniformes en la base de datos.
  • Optimización de Modelos: El objetivo último es asegurar que el modelo dimensional permita consultar los datos de manera sencilla, evitando complicaciones que puedan surgir por relaciones complejas o datos dispersos.

Anímate a continuar practicando y perfeccionando tus habilidades de mapeo y transforma datos de forma eficiente. Recuerda que la práctica constante ayuda a dominar el proceso y, con el tiempo, facilitará la toma de decisiones basada en datos. ¡Buen aprendizaje!