Dimension Table
Dit is een tabel in een ster schema van een data warehouse. Datawarehouses worden gebouwd met behulp van dimensionele gegevensmodellen die bestaan uit feit- en dimensietabellen. De laatste wordt gebruikt om dimensies te beschrijven. Ze bevatten dimensiesleutels, waarden en attributen.
U kunt ook de onderstaande video bekijken waarin onze Data Warehousing Training expert elke & nuance van de technologie in detail bespreekt.
Types van dimensies
Slowly Changing Dimensions- Dimension attributen die langzaam veranderen over een periode van tijd in plaats van regelmatig te veranderen worden gegroepeerd als SCDs. Attributen als naam en adres kunnen veranderen, maar niet te vaak.
Deze attributen kunnen in de loop van de tijd veranderen en dat wordt dan gecombineerd als een langzaam veranderende dimensie. Neem een voorbeeld van een persoon die van de ene stad naar de andere verhuist. Er zijn 3 manieren om het adres te wijzigen;
Type 1 is de oude waarde overschrijven, Type 2 is een nieuwe rij toevoegen en Type 3 is een nieuwe kolom aanmaken.
Type 1
Het voordeel van type 1 is dat het zeer eenvoudig te volgen is en het levert een enorme ruimte- en dus kostenbesparing op. Het nadeel is dat er geen historie wordt bijgehouden.
Type 2
Het voordeel van type 2 is dat de complete historie wordt bijgehouden. Het enige nadeel is dat er enorm veel ruimte nodig is omdat de hele historie vanaf het begin moet worden bijgehouden.
Type 3
De beste aanpak zou kunnen zijn om een nieuwe kolom toe te voegen waarbij je twee nieuwe kolommen toevoegt. In dit geval wordt het bijhouden van de geschiedenis heel eenvoudig.
Gevormde dimensie- Deze wordt op meerdere plaatsen gebruikt. Het helpt bij het creëren van consistentie, zodat hetzelfde kan worden gehandhaafd over de feit tabellen. Verschillende tabellen kunnen gebruik maken van de tabel over de feitentabel en het kan helpen bij het maken van verschillende rapporten.
Voorbeeld, er zijn twee feitentabellen. Fact tabel 1 is om het aantal verkochte producten per geografie te bepalen. Deze tabel berekent alleen het aantal producten per geografie en feitentabel 2 bepaalt de gegenereerde omzet per klant. Beide zijn afhankelijk van het product, dat product-id, naam en bron bevat.
Er is de geografiedimensie en klantdimensie die worden gedeeld door twee feitentabellen. De omzetfactor geeft de omzet die door zowel de geografie als de klant wordt gegenereerd, terwijl de producteenhedenfactor het aantal eenheden geeft dat in de geografie aan een klant is verkocht.
Gedegenereerde dimensie- Een gedegenereerde dimensie is wanneer het dimensie-attribuut wordt opgeslagen als onderdeel van de feitentabel en niet in een aparte tabel. Product id komt uit product dimensie tabel. Factuurnummer is een op zichzelf staand attribuut en heeft geen andere attributen die ermee geassocieerd zijn. Een factuurnummer kan van cruciaal belang zijn omdat het bedrijf de hoeveelheid van de producten wil weten.
Junk-dimensie- Het is een enkele tabel met een combinatie van verschillende en niet-gerelateerde attributen om te voorkomen dat er een groot aantal foreign keys in de feitentabel komen. Ze worden vaak gemaakt om de foreign keys te beheren die ontstaan door snel veranderende dimensies.
Role play dimensie- Het is een tabel die meerdere geldige relaties heeft met een feitentabel. Bijvoorbeeld, een feitentabel kan foreign keys bevatten voor zowel de verzenddatum als de leveringsdatum. Maar dezelfde attributen zijn van toepassing op elke foreign key, zodat dezelfde tabellen kunnen worden gekoppeld aan de foreign keys.