Cub OLAP

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Cub OLAP

Un cub OLAP (procesare analitică on-line) este o structură pentru stocarea datelor care vă permite să efectuați analize rapid, depășind o limitare a bazelor de date relaționale .

Bazele de date relaționale nu sunt potrivite pentru procesarea instantanee și afișarea unei cantități mari de date. În schimb, acestea sunt potrivite pentru procesarea înregistrărilor rezultate din executarea tranzacțiilor cunoscute sub numele de OLTP .

Cubul OLAP poate fi gândit ca o extensie a foii de lucru bidimensionale. Cubul OLAP are trei până la un număr arbitrar de caracteristici sau dimensiuni de analiză.

De exemplu, o companie ar putea fi interesată să analizeze anumite date financiare în funcție de produs, perioadă de timp, oraș și tipuri de venituri din costuri și să compare aceste date cu o prognoză bugetară. Aceste metode de analiză a datelor sunt cunoscute ca dimensiuni. Deoarece pot exista mai mult de trei dimensiuni într-un cub OLAP în general, termenul mai potrivit este hipercub .

Funcționalitate

Cubul OLAP este alcătuit din date numerice, numite măsuri, care sunt clasificate în dimensiuni.

Vă permite să creați un raport ca un tabel pivot, inserarea de elemente și câmpuri calculate care să prelucreze datele de pornire și operații de roll-up și drill-down , dacă dimensiunile sunt organizate într-o ierarhie.

Schema de metadate OLAP Cube poate fi creată dintr-o schemă stelară sau dintr-un set de tabele dintr-o bază de date relațională. Măsurătorile sunt luate din înregistrările individuale prezente în tabelul de date al schemei stelare, iar dimensiunile sunt deduse din dimensiunile tabelelor individuale.

De exemplu, datele financiare pot fi agregate în funcție de produs, locație, dată, tip de cost și venituri, estimare / date finale. Schema stea va avea un tabel pentru fiecare dimensiune de analiză care conține valorile admisibile (domeniul variabilei): un tabel cu toate produsele, unul cu toate tipurile de cost sau venituri etc.

Dimensiunile analizei sunt independente una de cealaltă, deci într-o bază de date relațională tabelele legate de dimensiunile analizei sunt legate de relații multe-la-multe. Datele numerice sunt un atribut al relației dintre aceste tabele.

În cele din urmă, în diagrama stelară, una centrală, cunoscută sub numele de fapte, este adăugată tabelelor referitoare la dimensiunile analizei. Cubul OLAP este alcătuit dintr-un singur tabel de n + 1 coloane, unde fiecare număr este identificat printr-o valoare pentru fiecare dimensiune de analiză.

În exemplu, datele despre costuri / venituri în euro vor fi identificate de codul unui produs, de numele unei locații, de o dată, de un tip, de o abreviere care indică dacă este bugetară sau finală. Cubul OLAP va fi un tabel imens cu 5 dimensiuni de analiză + 1 coloană pentru stocarea datelor numerice.

În mod clar, baza de date relațională poate conține mai multe date numerice, iar trecerea la o schemă stelară poate fi netivială.

Ierarhie

Fiecare dintre elementele unei anumite dimensiuni poate fi clasificat într-o ierarhie. O ierarhie este o serie de relații dintre părinți și copii, în care de obicei părintele reprezintă consolidarea elementelor care îi sunt copii. La rândul lor, părinții pot fi agregați ca copii ai unui alt părinte.

De exemplu, mai 2005 poate aparține ierarhiei trimestrului II 2005, care la rândul său este cuprinsă în ierarhia anului 2005.

Tabele pivot

Tabelul pivot este raportarea care rezultă dintr-o interogare OLAP procesată pe date organizate în cadrul unui hipercub OLAP.

Sursa de date a tabelului pivot este doar una, tabelul de fapt care conține datele numerice prezente în tabelul pivot și dimensiunile de analiză care îl identifică.

Definiție tehnică

Pentru teoria bazelor de date, un cub OLAP este o reprezentare abstractă a proiecției unei baze de date relaționale. Având în vedere o relație de cardinalitate N, considerați proiecția variabilelor X, Y și Z ca cheie primară și a lui W ca un atribut rezidual. Le caracterizăm ca o funcție

f : ( X , Y , Z ) → W ,

unde atributele X , Y și Z corespund axelor cubului, în timp ce atributul W din triplu (X, Y, Z) corespunde datelor unice care populează fiecare celulă a cubului.

Deoarece o ieșire bidimensională (rând și coloană) nu poate reprezenta un vector tridimensional, este mai practic să reduceți dimensiunile cubului și să proiectați pur și simplu „tăieturi” ale cubului, fixate ca constante una sau mai multe valori de cel puțin unele dimensiuni ale acestuia sau un număr de dimensiuni egal cu n-2. Prin urmare, obținem:

g : ( X , Y ) → W ,

care șterge una dintre cheile primare, dar păstrează aceleași informații și semnificație, deși oferă reprezentarea pentru o valoare dată a variabilei Z.

Elemente conexe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT