Tabela wymiarowa
Jest to tabela w schemacie gwiaździstym hurtowni danych. Hurtownie danych budowane są z wykorzystaniem modeli danych wymiarowych, które składają się z tabel faktów i tabel wymiarów. Te ostatnie służą do opisu wymiarów. Zawierają one klucze wymiarów, wartości i atrybuty.
Możesz również obejrzeć poniższy film, w którym nasz ekspert omawia każdy & każdy niuans technologii w szczegółach.
Typy wymiarów
Powoli zmieniające się wymiary – Atrybuty wymiarów, które zmieniają się powoli w okresie czasu, a nie zmieniają się regularnie, są określane jako SCD. Atrybuty takie jak imię, nazwisko, adres mogą się zmieniać, ale nie za często.
Te atrybuty mogą się zmieniać przez pewien okres czasu i to zostanie połączone jako wolno zmieniający się wymiar. Rozważmy przykład, w którym osoba zmienia się z jednego miasta do drugiego. Teraz są 3 sposoby na zmianę adresu;
Typ 1 to nadpisanie starej wartości, Typ 2 to dodanie nowego wiersza i Typ 3 to stworzenie nowej kolumny.
Typ 1
Zaletą typu 1 jest to, że jest bardzo łatwy do naśladowania i powoduje ogromną oszczędność miejsca, a co za tym idzie oszczędność kosztów. Wadą jest to, że nie jest zachowywana historia.
Typ 2
Zaletą typu 2 jest to, że zachowywana jest pełna historia. Jedyną wadą jest ogromny przydział miejsca, ponieważ cała historia od samego początku musi być zachowana.
Typ 3
Najlepszym podejściem może być dodanie nowej kolumny, gdzie dodaje się dwie nowe kolumny. W tym przypadku śledzenie historii staje się bardzo proste.
Conformed Dimension- Jest to używane w wielu miejscach. Pomaga w tworzeniu spójności, dzięki czemu to samo może być utrzymywane w tabelach faktów. Różne tabele mogą korzystać z tabeli w poprzek tabeli faktów i może to pomóc w tworzeniu różnych raportów.
Na przykład, istnieją dwie tabele faktów. Tabela faktów 1 służy do określenia liczby sprzedanych produktów według geografii. Tabela ta będzie obliczać tylko liczbę produktów według geografii, a tabela faktów 2 będzie określać przychód wygenerowany przez klienta. Obie są zależne od produktu, który zawiera Id produktu, nazwę i źródło.
Istnieje wymiar geograficzny i wymiar klienta, które są współdzielone przez dwie tabele faktów. Wymiar przychodu podaje przychód wygenerowany zarówno przez geografię jak i klienta, podczas gdy wymiar jednostek produktu podaje liczbę jednostek sprzedanych w geografii klientowi.
Wymiar zdegenerowany – wymiar zdegenerowany jest wtedy, gdy atrybut wymiaru jest przechowywany jako część tabeli faktów, a nie w oddzielnej tabeli. Id produktu pochodzi z tabeli wymiarowej produktu. Numer faktury jest samodzielnym atrybutem i nie ma żadnych innych atrybutów z nim związanych. Numer faktury może być kluczowy, ponieważ firma chciałaby znać ilość produktów.
Junk Dimension- Jest to pojedyncza tabela z kombinacją różnych i niepowiązanych atrybutów, aby uniknąć posiadania dużej liczby kluczy obcych w tabeli faktów. Są one często tworzone w celu zarządzania kluczami obcymi tworzonymi przez szybko zmieniające się wymiary.
Wymiar odgrywania ról – Jest to tabela, która ma wiele ważnych relacji z tabelą faktów. Na przykład, tabela faktów może zawierać klucze obce zarówno dla daty wysyłki jak i daty dostawy. Ale te same atrybuty mają zastosowanie do każdego klucza obcego, więc te same tabele mogą być dołączone do kluczy obcych.