Dimensiune care se schimbă încet

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Dimensiune este un termen utilizat în gestionarea datelor și stocarea datelor pentru a se referi la grupările logice din date, cum ar fi locația geografică, informațiile despre clienți sau despre produs. Dimensiunile care se schimbă încet sunt dimensiuni ale căror atribute au valori care pot varia lent în timp.

Să presupunem o dimensiune în baza de date care stochează înregistrările de vânzări ale funcționarilor dvs. Crearea rapoartelor de vânzări este simplă atâta timp cât un agent de vânzări nu este transferat de la un magazin la altul. Cum este înregistrată această modificare a mărimii dumneavoastră? Comparația dintre performanțele diferiților grefieri poate da rezultate false, de exemplu, deoarece grefierul ar putea merge de la un magazin care face multe vânzări la unul unde acestea sunt rare. În comparație cu noii săi colegi, grefierul ar fi incorect cel mai bun.

Pentru a rezolva problemele de acest tip, sunt utilizate metode pentru gestionarea dimensiunilor care se modifică lent, denumite tip 0, 1, 2, 3, 4 și 6. SCD-urile de tip 6 sunt, de asemenea, numite hibride.

Tastați 0

Tipul 0 este o metodă de abordare pasivă pentru gestionarea modificărilor valorilor dimensiunii în care nu se iau măsuri. Valorile rămân așa cum erau atunci când a fost introdusă prima dată înregistrarea dimensiunii. Deși în unele circumstanțe se poate întâmpla să se utilizeze tipul 0 pentru istoricizare, tipurile SCD de ordin superior sunt utilizate mai des, deoarece tipul 0 oferă un control redus sau deloc asupra manipulării dimensiunilor care se schimbă încet.

Cele mai frecvente tipuri de dimensiuni care se schimbă lent sunt tipul 1, 2 și 3.

Tipul 1

Metoda de tip 1 suprascrie datele vechi cu cele noi și, prin urmare, nu ține deloc evidența datelor istorice. Aceasta este cea mai potrivită metodă de corectare a unor tipuri de erori de date (de exemplu erori de ortografie, caz în care nu este necesar să se urmărească modul în care datele erau incorecte anterior).

Mai jos este un exemplu de tabel de baze de date care conține informații despre furnizori:

ID FURNIZOR CODUL FURNIZORULUI NUMELE FURNIZORULUI SUPPLIER_STATE
123 ABC Acme Supply Co. CA

În acest exemplu, PROVIDER_CODE este cheia naturală și PROVIDER_ID este o cheie surogat . La nivel tehnic, cheia surogat nu este necesară, deoarece cheia naturală este deja unică în sine (SUPPLIER_CODE). {Cu toate acestea, asocierile vor funcționa mai bine dacă sunt efectuate pe un câmp numeric, mai degrabă decât pe un șir | fără sursă}

Acum imaginați-vă că acest furnizor își mută sediul în Illinois. Actualizarea tabelului ar suprascrie pur și simplu rândul:

ID FURNIZOR CODUL FURNIZORULUI NUMELE FURNIZORULUI SUPPLIER_STATE
123 ABC Acme Supply Co. THE

Dezavantajul evident al acestei metode este că nu există nicio urmă de date istorice în depozitul de date. De exemplu, nu veți putea spune dacă furnizorii dvs. tind să se mute în Midwest. Avantajul tipului 1 este însă că este foarte ușor de manevrat.

Dacă aveți tabele agregate care însumează măsurătorile faptelor în funcție de statutul furnizorului, acestea vor trebui recalculate la fiecare modificare a câmpului SUPPLIER_STATE.

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT