Tabella di dimensione
Questa è una tabella in uno schema a stella di un data warehouse. I magazzini di dati sono costruiti usando modelli di dati dimensionali che consistono di tabelle di fatti e di dimensioni. Quest’ultima è usata per descrivere le dimensioni. Esse contengono chiavi di dimensione, valori e attributi.
Puoi anche guardare il video qui sotto dove il nostro esperto di Data Warehousing Training sta discutendo ogni & sfumatura della tecnologia in dettaglio.
Tipi di dimensioni
Dimensioni che cambiano lentamente – Gli attributi delle dimensioni che cambiano lentamente in un periodo di tempo piuttosto che cambiare regolarmente sono raggruppati come SCD. Attributi come il nome, l’indirizzo possono cambiare ma non troppo spesso.
Questi attributi possono cambiare per un periodo di tempo e vengono combinati come una dimensione che cambia lentamente. Consideriamo un esempio in cui una persona cambia da una città all’altra. Ora ci sono 3 modi per cambiare l’indirizzo;
Tipo 1 è sovrascrivere il vecchio valore, il tipo 2 è aggiungere una nuova riga e il tipo 3 è creare una nuova colonna.
Tipo 1
Il vantaggio del tipo 1 è che è molto facile da seguire e risulta in un enorme risparmio di spazio e quindi di costi. Lo svantaggio è che non viene mantenuta alcuna cronologia.
Tipo 2
Il vantaggio del tipo 2 è che viene mantenuta la cronologia completa. L’unico svantaggio sta nell’enorme allocazione di spazio perché deve essere mantenuta l’intera storia fin dall’inizio.
Tipo 3
L’approccio migliore potrebbe essere quello di aggiungere una nuova colonna dove si aggiungono due nuove colonne. In questo caso tenere traccia della storia diventa molto facile.
Conformed Dimension- Questa è usata in più posizioni. Aiuta a creare coerenza in modo che la stessa possa essere mantenuta attraverso le tabelle di fatto. Diverse tabelle possono usare la tabella attraverso la tabella dei fatti e può aiutare nella creazione di diversi report.
Per esempio, ci sono due tabelle dei fatti. La tabella dei fatti 1 serve a determinare il numero di prodotti venduti in base alla geografia. Questa tabella calcolerà solo il numero di prodotti per geografia e la tabella fatti 2 determinerà le entrate generate per cliente. Entrambi dipendono dal prodotto che contiene l’id del prodotto, il nome e la fonte.
C’è la dimensione geografia e la dimensione cliente che sono condivise da due tabelle di fatti. Il fatto delle entrate fornisce le entrate generate sia dalla geografia che dal cliente, mentre il fatto delle unità di prodotto fornisce il numero di unità vendute nella geografia ad un cliente.
Degenerate Dimension- Una dimensione degenerata è quando l’attributo della dimensione è memorizzato come parte della tabella dei fatti e non in una tabella separata. L’id del prodotto proviene dalla tabella delle dimensioni del prodotto. Il numero di fattura è un attributo indipendente e non ha altri attributi associati ad esso. Un numero di fattura può essere cruciale perché l’azienda vuole conoscere la quantità dei prodotti.
Dimensione spazzatura- È una singola tabella con una combinazione di attributi diversi e non correlati per evitare di avere un gran numero di chiavi esterne nella tabella dei fatti. Sono spesso create per gestire le chiavi esterne create da dimensioni che cambiano rapidamente.
Dimensione di ruolo- È una tabella che ha più relazioni valide con una tabella dei fatti. Per esempio, una tabella dei fatti può includere chiavi esterne sia per la data di spedizione che per la data di consegna. Ma gli stessi attributi si applicano ad ogni chiave esterna, così le stesse tabelle possono essere unite alle chiavi esterne.