Tabla de dimensiones
Es una tabla en un esquema de estrella de un almacén de datos. Los almacenes de datos se construyen utilizando modelos de datos dimensionales que consisten en tablas de hechos y de dimensiones. Estas últimas se utilizan para describir las dimensiones. Contienen claves de dimensión, valores y atributos.
También puede ver el siguiente vídeo en el que nuestro experto en formación de Data Warehousing está discutiendo cada & cada matiz de la tecnología en detalle.
Tipos de Dimensiones
Dimensiones de cambio lento- Los atributos de las dimensiones que cambian lentamente durante un período de tiempo en lugar de cambiar regularmente se agrupan como SCDs. Atributos como el nombre, la dirección pueden cambiar pero no muy a menudo.
Estos atributos pueden cambiar durante un período de tiempo y eso se combinará como una dimensión que cambia lentamente. Considere un ejemplo en el que una persona está cambiando de una ciudad a otra. Ahora hay 3 formas de cambiar la dirección;
El tipo 1 es sobreescribir el valor antiguo, el tipo 2 es añadir una nueva fila y el tipo 3 es crear una nueva columna.
Tipo 1
La ventaja del tipo 1 es que es muy fácil de seguir y resulta en un gran ahorro de espacio y por lo tanto de costes. La desventaja es que no se mantiene ningún historial.
Tipo 2
La ventaja del tipo 2 es que se mantiene el historial completo. La única desventaja radica en la enorme asignación de espacio porque hay que mantener todo el historial desde el principio.
Tipo 3
El mejor enfoque podría ser añadir una nueva columna donde se añaden dos nuevas columnas. En este caso, mantener un seguimiento de la historia se vuelve muy fácil.
Dimensión conformada- Se utiliza en múltiples lugares. Ayuda a crear consistencia para que la misma pueda ser mantenida a través de las tablas de hechos. Diferentes tablas pueden utilizar la tabla a través de la tabla de hechos y puede ayudar en la creación de diferentes informes.
Por ejemplo, hay dos tablas de hechos. La tabla de hechos 1 es para determinar el número de productos vendidos por geografía. Esta tabla calculará sólo el número de productos por geografía y la tabla de hechos 2 determinará los ingresos generados por cliente. Ambas dependen del producto que contiene el Id del producto, el nombre y la fuente.
Hay la dimensión geografía y la dimensión cliente que están siendo compartidas por dos tablas de hechos. El hecho de los ingresos da los ingresos generados tanto por la geografía como por el cliente, mientras que el hecho de las unidades del producto da el número de unidades vendidas en la geografía a un cliente.
Dimensión degenerada- Una dimensión degenerada es cuando el atributo de la dimensión se almacena como parte de la tabla de hechos y no en una tabla separada. El ID del producto proviene de la tabla de dimensión del producto. El número de factura es un atributo independiente y no tiene otros atributos asociados. Un número de factura puede ser crucial ya que el negocio querría saber la cantidad de los productos.
Dimensión de la basura- Es una sola tabla con una combinación de atributos diferentes y no relacionados para evitar tener un gran número de claves foráneas en la tabla de hechos. Suelen crearse para gestionar las claves foráneas creadas por dimensiones que cambian rápidamente.
Dimensión de juego de roles- Es una tabla que tiene múltiples relaciones válidas con una tabla de hechos. Por ejemplo, una tabla de hechos puede incluir claves foráneas tanto para la fecha de envío como para la fecha de entrega. Pero los mismos atributos se aplican a cada clave foránea, por lo que las mismas tablas pueden unirse a las claves foráneas.