Dimensionstabelle
Dies ist eine Tabelle in einem Sternschema eines Data Warehouses. Data Warehouses werden mit dimensionalen Datenmodellen aufgebaut, die aus Fakten- und Dimensionstabellen bestehen. Letztere werden zur Beschreibung von Dimensionen verwendet. Sie enthalten Dimensionsschlüssel, -werte und -attribute.
Sie können sich auch das folgende Video ansehen, in dem unser Data Warehousing-Schulungsexperte jede & Nuance der Technologie im Detail bespricht.
Typen von Dimensionen
Slowly Changing Dimensions- Dimensionsattribute, die sich über einen bestimmten Zeitraum langsam ändern und nicht regelmäßig wechseln, werden als SCDs gruppiert. Attribute wie Name, Adresse können sich ändern, aber nicht zu oft.
Diese Attribute können sich über einen bestimmten Zeitraum ändern und werden als langsam ändernde Dimension zusammengefasst. Nehmen wir ein Beispiel, bei dem eine Person von einer Stadt in eine andere wechselt. Nun gibt es 3 Möglichkeiten, die Adresse zu ändern;
Typ 1 ist das Überschreiben des alten Wertes, Typ 2 ist das Hinzufügen einer neuen Zeile und Typ 3 ist das Anlegen einer neuen Spalte.
Typ 1
Der Vorteil von Typ 1 ist, dass er sehr einfach zu verfolgen ist und zu einer enormen Platz- und damit Kostenersparnis führt. Der Nachteil ist, dass keine Historie gepflegt wird.
Typ 2
Der Vorteil von Typ 2 ist, dass die komplette Historie gepflegt wird. Der einzige Nachteil liegt in der enormen Platzbelegung, da die gesamte Historie von Anfang an gepflegt werden muss.
Typ 3
Der beste Ansatz könnte sein, eine neue Spalte hinzuzufügen, in der Sie zwei neue Spalten hinzufügen. In diesem Fall wird die Nachverfolgung der Historie sehr einfach.
Konforme Dimension- Diese wird an mehreren Stellen verwendet. Sie hilft bei der Schaffung von Konsistenz, so dass dieselbe in den Faktentabellen beibehalten werden kann. Verschiedene Tabellen können die Tabelle über die Faktentabelle verwenden und sie kann bei der Erstellung verschiedener Berichte helfen.
Zum Beispiel gibt es zwei Faktentabellen. Faktentabelle 1 soll die Anzahl der verkauften Produkte nach Geografie ermitteln. Diese Tabelle berechnet nur die Anzahl der Produkte nach Geografie und Faktentabelle 2 soll den Umsatz pro Kunde ermitteln. Beide sind abhängig vom Produkt, das Produkt-ID, Name und Quelle enthält.
Es gibt die geografische Dimension und die Kundendimension, die von zwei Faktentabellen gemeinsam genutzt werden. Der Fakt „Umsatz“ gibt den Umsatz an, der sowohl von der Region als auch vom Kunden generiert wurde, während der Fakt „Produkteinheiten“ die Anzahl der Einheiten angibt, die in der Region an einen Kunden verkauft wurden.
Degenerierte Dimension – Eine degenerierte Dimension liegt vor, wenn das Dimensionsattribut als Teil der Faktentabelle und nicht in einer separaten Tabelle gespeichert ist. Die Produkt-ID stammt aus der Produkt-Dimensionstabelle. Die Rechnungsnummer ist ein eigenständiges Attribut und hat keine anderen Attribute, die mit ihr verbunden sind. Eine Rechnungsnummer kann von entscheidender Bedeutung sein, da das Unternehmen die Menge der Produkte wissen möchte.
Junk Dimension- Es handelt sich um eine einzelne Tabelle mit einer Kombination aus verschiedenen und nicht verwandten Attributen, um eine große Anzahl von Fremdschlüsseln in der Faktentabelle zu vermeiden. Sie werden oft erstellt, um die Fremdschlüssel zu verwalten, die durch sich schnell ändernde Dimensionen entstehen.
Rollenspiel-Dimension- Es ist eine Tabelle, die mehrere gültige Beziehungen mit einer Faktentabelle hat. Zum Beispiel kann eine Faktentabelle Fremdschlüssel sowohl für das Versanddatum als auch für das Lieferdatum enthalten. Aber für jeden Fremdschlüssel gelten dieselben Attribute, sodass dieselben Tabellen mit den Fremdschlüsseln verbunden werden können.