Model de stea

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Structura stelară este o schemă de bază utilizată în analiza dimensională.

Schema stelelor (numită și schemă stelară unire sau schemă multidimensională ) este cel mai simplu stil de schemă pentru depozitul de date . Structura de bază constă dintr-un tabel de date care face referire la un număr (două sau mai multe) de tabele de dimensiuni.

Acest tip de schemă este de obicei utilizat pentru reprezentarea martelor de date , adică un subset de date corporative sau departamentale cu un domeniu de analiză specific și bine definit.

Șablon

Schema stelară clasifică atributele unui eveniment ca fapte (valori numerice sau temporale) și atributele descriptive ale dimensiunilor (identificatorul produsului, numele clientului, data vânzării) care definesc contextul faptelor. O înregistrare , de fapt, este legătura dintre valorile unei dimensiuni specifice și faptele înregistrate. Toate faptele sunt stocate la un nivel uniform de detalii (sau cereale) în tabelul de informații . Atributele dimensiunii, pe de altă parte, sunt organizate în grupuri de afinitate și păstrate cu un număr minim de tabele de dimensiuni .

O diagramă stelară pentru analiza datelor meteorologice poate avea ca fapte valorile: temperatura, presiunea atmosferică, viteza vântului, precipitațiile, acoperirea norilor etc. în timp ce ca dimensiuni, datele referitoare la: locul, data / ora, vorbitorul etc.

Schemele stelare sunt concepute pentru a maximiza ușurința în utilizare și performanța pentru recuperarea datelor, minimizând numărul de tabele care sunt alăturate pentru a obține datele căutate.

Numele modelului de stea se datorează reprezentării grafice a relațiilor dintre masa centrală a faptelor (steaua strălucitoare) înconjurată de dimensiuni (planetele). Într-un depozit de date, setul diferitelor marturi de date seamănă astfel cu o constelație de stele.

  • Tabelul de date conține valorile măsurabile înregistrate pentru un anumit eveniment. Pentru a păstra datele la nivel atomic, există de obicei un număr foarte mare de înregistrări (miliarde) în aceste tabele. Prin urmare, se acordă o atenție deosebită pentru a minimiza numărul și dimensiunea atributelor, pentru a limita dimensiunea generală a tabelului și pentru a menține performanțe ridicate. Tabelele de informații sunt în general de 3 tipuri - tranzacții (de exemplu, date despre un anumit eveniment de vânzare), instantaneu (date înregistrate la un anumit moment, de exemplu, înregistrarea comenzilor la sfârșitul lunii) și acumularea tabelelor de instantanee ( de exemplu, date lunare de vânzări pentru produse).
  • Tabelele de cote au de obicei mai puține înregistrări decât tabelele de date, cu toate acestea pot avea un număr foarte mare de atribute care pot fi folosite pentru a căuta date de fapt legate.

Există adesea mii de atribute care descriu diferitele fațete ale unui singur fapt. Acestea sunt colectate în tabelele de dimensiuni în funcție de un nivel mai mult sau mai puțin ridicat de afinitate între ele. De exemplu, atributele culorii, stilului, dimensiunii și texturii pot descrie un produs și ar trebui incluse într-un tabel de dimensiuni al produsului. Tabelele de dimensiuni includ atribute care de obicei ar trebui normalizate în diferite tabele ( diagrama fulgului de zăpadă ). De exemplu, o localitate poate fi identificată de municipalitatea care aparține unei provincii , unei regiuni și unui stat ; toate aceste atribute ar trebui incluse într-un singur tabel pentru dimensiunea „Locație”.

Tabelele de dimensiuni conțin de obicei date redundante și sunt doar în a doua formă normală , în timp ce tabelele de date sunt în a treia formă normală .

Beneficii

Principalul beneficiu al unei scheme de stele este simplitatea cu care un utilizator poate căuta valorile dorite: interogările sunt scrise cu câteva îmbinări interioare simple între tabelul de fapt și un număr mic de dimensiuni. Îmbinările sunt mai simple decât posibil în modelul fulg de zăpadă. În plus, condițiile trebuie să filtreze numai atributele dorite, iar agregările sunt rapide.

Schema stelară este o modalitate de a implementa funcționalitatea bazei de date multi-dimensionale utilizând o bază de date relațională: deoarece multe companii utilizează deja baze de date relaționale, un SGBD multi-dimensional specializat ar fi ieftin și costisitor.

Elemente conexe

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT