No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Dimensión tipo 3

11/26
Recursos

¿Qué es una dimensión lentamente cambiante tipo 3?

Las dimensiones lentamente cambiantes son herramientas valiosas en el mundo del análisis de datos, permitiendo almacenar historia y capturar la evolución de los datos a lo largo del tiempo. La dimensión lentamente cambiante tipo 3, en particular, ofrece una forma innovadora de preservar la historia de los cambios sin duplicar registros. En lugar de crear un registro nuevo al modificar un atributo, se añaden nuevas columnas al registro existente. Veamos cómo funciona mediante el siguiente ejemplo.

¿Cómo se representa el cambio de atributo en una dimensión tipo 3?

Imaginemos a Pepito Pérez, un estudiante inicialmente inscrito en la facultad de Mercadeo. Cuando Pepito cambia a la facultad de Ingeniería, no se crea un nuevo registro en la base de datos. En su lugar, se añaden dos columnas en su registro actual: "facultad nueva" y "facultad vieja". Este enfoque permite visualizar tanto su nueva afiliación como su anterior sin duplicar su entrada en el sistema.

Ejemplo práctico de implementación con Pepito Pérez

  1. Primera Carga de Datos:

    • Iniciamos con Pepito Pérez asignado a la facultad de Salud.
    • Dado que este es su primer registro en la dimensión, el ID asignado es '1', calculado como el máximo ID actual.
    • Las nuevas columnas registran: "facultad old" como NULL (ya que es su primera carga) y "facultad new" como "Salud".
    • La fecha de inserción se registra como 24 de febrero del 2030.
  2. Actualización del Registro:

    • En marzo, Pepito es transferido a la facultad de Ingeniería.
    • La dimensión tipo 3 actualiza las columnas sin crear un nuevo registro.
    • "facultad nueva" se actualiza a "Ingeniería" y "facultad vieja" a "Salud".
    • La fecha de carga se actualiza para reflejar el cambio en marzo.

¿Qué ventajas ofrece este enfoque?

Este método no solo permite almacenar la historia de cambios de manera eficiente, sino que también ofrece beneficios puntuales:

  • Reducción del volumen de datos: Al no duplicar registros, economiza espacio y simplifica la gestión de la base de datos.
  • Facilidad en las consultas: Permite consultar los cambios históricos con precisión y rapidez al mantener la traza de las modificaciones en columnas específicas.
  • Simplicidad en la actualización: El proceso para actualizar un atributo es directo, evitando la complejidad de gestionar múltiples registros.

Reflexión y desafíos futuros

La dimensión tipo 3 proporciona una estructura útil para registrar cambios limitados en los datos. Sin embargo, un desafío interesante es imaginar una combinación de dimensiones tipo 2 y tipo 3, que registre tanto cambios a nivel de registros como a nivel de columnas. Esto podría ofrecer un enfoque híbrido, aprovechando lo mejor de ambos mundos para una gestión de datos más completa.

Te invito a reflexionar sobre cómo podrías implementar dicha combinación en tus proyectos y a compartir tus ideas sobre su funcionalidad. Continuemos explorando el apasionante mundo del análisis de datos y su evolución constante. ¡Nos vemos en la próxima clase!

Aportes 5

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

A mi criterio, la dimensión de tipo 2 es la que puede darnos trazabilidad de manera más legible; dado que cada registro es una captura en el tiempo donde el id dicta la secuencia de los cambios; la desventaja que la dimensión puede llenarse rápido con muchos registros relacionados a los cambios de la misma persona/objeto.

La dimensión tipo 3 es aquella que trata los cambios en los atributos de las dimensiones lentamente cambiantes añadiendo una nueva columna con el valor nuevo y manteniendo el valor antiguo en la columna original. Se guarda un nivel de historial de cambios, pero se limita el número de cambios que se pueden almacenar.

Un ejemplo práctico de dimensión tipo 3 podría ser el siguiente:

Supongamos que tenemos una dimensión de productos con los atributos código, nombre, precio y categoría.

Si un producto cambia de categoría, añadimos una nueva columna con la categoría nueva y dejamos la categoría antigua en la columna original. De esta forma, podemos tener un solo registro por producto, con dos columnas de categoría: la actual y la anterior.

Esto nos permite comparar los datos según la categoría nueva o la antigua, pero solo podemos guardar un cambio por producto. Si el producto cambia de categoría más de una vez, tendremos que elegir qué valor guardar y cuál descartar.

Profe para mi según lo explicado y combinandos las dos tipologias me quedaria de la siguiente manera , agradeceria feedback

\### \*\*Comparación con otras dimensiones:\*\*| Tipo       | Historial Completo | Nuevas Filas | Nuevas Columnas | Complejidad ||------------|--------------------|--------------|-----------------|-------------|| Tipo 1     | No                 | No           | No              | Baja        || Tipo 2     | Sí                 | Sí           | No              | Alta        || \*\*Tipo 3\*\* | Limitado           | No           | Sí              | Media       | \---

como conclusión entonces… al usar el SCD 3, conoceríamos los cambios a nivel de columna y si agregamos los campos start_date y end_date, tendríamos las fechas de cambios a nivel de fila