OLAP

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

OLAP , acronim al expresiei O n- L ine A Nalytical P rocessing, desemnează un set de tehnici software pentru analiza interactivă și rapidă a unor cantități mari de date, care pot fi examinate în moduri destul de complexe. Aceasta este componenta tehnologică de bază a depozitului de date și, de exemplu, este utilizată de companii pentru a analiza rezultatele vânzărilor, tendința costului achiziționării de bunuri, la marketing pentru a măsura succesul unei campanii publicitare, la o universitate pentru a organiza datele sondajului și alte cazuri similare. Instrumentele OLAP diferă de OLTP prin faptul că primele au ca obiectiv performanța în cercetare și realizarea celor mai articulate interogări posibile; acestea din urmă, pe de altă parte, vizează garantarea integrității și securității tranzacțiilor.

Aplicația tipică a OLAP se află în instrumentele de business intelligence (BI).

Descriere

Funcționalitate

Crearea unei baze de date OLAP constă în realizarea unui instantaneu de informații (de exemplu, cel al unei baze de date relaționale ) la un moment dat și transformarea acestor informații unice în date multidimensionale.

Executând ulterior interogări cu privire la date, structurate în acest mod, este posibil să se obțină răspunsuri în perioade de timp decisiv mai scurte decât aceleași operațiuni efectuate pe alte tipuri de baze de date, de asemenea, deoarece baza de date a unui sistem OLTP nu a fost concepută pentru a permite articulații articulate. analize.

Exemplu de cub OLAP tridimensional: produse, oraș, timp
Exemplu de model stelar

O structură OLAP creată în acest scop se numește cub multidimensional. Există mai multe moduri de a crea un cub, dar cea mai cunoscută este cea care folosește un model de stea ; în centru se află tabelul de fapte majore care listează principalele elemente pe care va fi construită interogarea, și legate de acesta sunt diferite tabele de dimensiuni care specifică modul în care datele vor fi agregate.

De exemplu, o bază de date de clienți poate fi grupată după oraș, provincie, regiune; acești clienți pot fi legați de produse și fiecare produs poate fi grupat pe categorii.

Calculul combinațiilor posibile ale acestor agregări formează o structură OLAP care, potențial, ar putea conține toate răspunsurile pentru fiecare combinație. În realitate, este stocat doar un număr predeterminat de combinații, în timp ce restul sunt recalculate numai în momentul în care cererea este realizată fizic.

Un sistem OLAP vă permite să:

  • studiați o cantitate mare de date
  • analizați datele din diferite perspective
  • susține procesele decizionale .

Tipuri de sisteme OLAP

Plecând de la conceptele de bază tocmai descrise, se poate specifica că există trei tipuri de sisteme OLAP: multidimensional ( MOLAP : Multidimensional OLAP ), relațional ( ROLAP : Relational OLAP ) și hibrid ( HOLAP : Hybrid OLAP ). Fiecare dintre aceste tipuri are propriile beneficii, deși nu există un acord complet cu privire la acestea.

  • MOLAP este cel mai utilizat tip și este denumit în mod obișnuit OLAP. Folosește o bază de date sumară cu un motor specific pentru analize multidimensionale și creează dimensiuni cu un amestec de detalii și agregări. Este cea mai bună alegere pentru cantități mici de date, deoarece este rapidă în calcularea agregărilor și returnarea rezultatelor; cu toate acestea, creează cantități uriașe de date intermediare.
  • ROLAP lucrează direct cu baze de date relaționale ; datele de dimensiune și tabelele sunt stocate ca tabele relaționale și sunt create tabele noi pentru a stoca informații de agregare. Este considerat mai scalabil și are cerințe mai mici de stocare și memorie; cu toate acestea, este lent în crearea tabelelor și generarea raportului de interogare.
  • HOLAP folosește tabele relaționale pentru a stoca date și tabele multidimensionale pentru agregări „speculative”. După cum sugerează și numele, acest sistem este un hibrid, deoarece este creat mai rapid decât un sistem ROLAP și este în același timp mai scalabil decât MOLAP.

Dificultatea în implementarea unei baze de date OLAP începe cu ipoteza posibilelor interogări ale utilizatorilor; alegerea tipului de OLAP, schema și crearea unei baze de date complete și consistente este o operațiune complexă, decisă complicată pentru o bază de utilizatori mare și eterogenă.

Pentru a satisface nevoile utilizatorilor, multe produse moderne oferă o cantitate imensă de modele și interogări prestabilite.

Caracteristicile unui OLAP

Funcțiile de bază ale unui instrument OLAP sunt:

  • Pivotare : este operația de rotație a dimensiunilor de analiză. Este o operație fundamentală de a analiza totalele obținute pe baza diferitelor dimensiuni sau dacă doriți să analizați agregări transversale;
  • Slicing : este operația de extragere a unui subset de informații din agregatul analizat. Operația de feliere se realizează prin setarea unei valori specifice pentru una dintre dimensiunile „cubului”, extragând astfel o „felie” și obținându-se un cub nou cu o dimensiune mai mică decât cea de pornire;
  • Dicing : este operația de extragere a unui subset de informații din agregatul analizat. Operația de decupare se efectuează atunci când analiza se concentrează pe un subset al „cubului” de interes special pentru analist. În unele cazuri, operația de tăiere poate fi „fizică” în sensul că nu constă doar în filtrarea informațiilor de interes, ci și în extragerea acesteia din agregatul general pentru a distribui conținutul acesteia;
  • Drill-down : este operațiunea de „explozie” a datelor din factorii săi determinanți. Operațiunea de descărcare în jos poate fi realizată urmând două căi diferite: ierarhia construită pe dimensiunea de analiză (de exemplu: trecerea de la familia de produse la setul de produse care fac parte din aceasta) sau relația matematică care leagă o dată calculată de determinanți (de exemplu: trecerea de la marjă la venituri și costuri care îl generează). Importanța acestei operațiuni în scopuri analitice este de înțeles în ceea ce privește înțelegerea factorilor determinanți ai unei date;
  • Drill-across : este operația prin care se navighează prin același nivel într-o ierarhie. După cum sa văzut anterior, trecerea de la familia de produse la lista de produse este o operațiune de drill-down, trecerea de la o familie la o altă familie este o operațiune de drill-across;
  • Drill-through : similar din punct de vedere conceptual cu drill-down, este operația prin care se trece de la un nivel agregat la nivelul de detaliu aparținând bazei de date normalizate. Mulți furnizori susțin că produsele lor au capacitatea, prin intermediul operațiunii drill-through, de a trece de la depozitul de date la alimentarea sistemelor tranzacționale. Această operațiune, chiar dacă este fezabilă din punct de vedere tehnic într-o serie de condiții destul de relevante, nu are prea mult sens pentru problemele de securitate și performanță induse de sistemele tranzacționale în sine.

Puncte slabe

Punctele slabe ale instrumentelor OLAP sunt:

  • Inaccesibilitate / dificultate în accesarea nivelului atomic al datelor: instrumentele OLAP funcționează foarte bine pe datele rezumative, nu este convenabil să le utilizați pe datele analitice;
  • Sisteme de backup , restaurare, securitate, rollback care nu sunt foarte sofisticate sau inexistente: deși în multe cazuri sunt motoare de baze de date, instrumentele OLAP nu au atins încă nivelul de completitudine al bazelor de date relaționale, în principal pentru că, spre deosebire de acestea din urmă, nu au o paradigmă conceptuală de referință, cum ar fi teoria lui Codd , ci sunt supuse interpretărilor diferiților producători de software;
  • Este nevoie de o structură denormalizată pentru a funcționa eficient: motoarele OLAP generează mase mari de date pentru simplul fapt că pentru a îmbunătăți performanța de acces sunt obligați să stocheze chei și rezumări redundante;
  • Posibilă proliferare a codului SQL : în cazul în care baza de date pe care se efectuează analizele OLAP nu este multidimensională (MOLAP), ci este relațională (ROLAP), fiecare dintre operațiunile descrise mai sus ( feliere , decupare , găurire ) determină generarea și executarea interogări SQL extrem de complexe, care necesită o mulțime de resurse de procesare.

Produse

Primul produs care a permis interogările OLAP a fost lansat de Edgar F. Codd în 1970 (și achiziționat de Oracle în 1995 ). Cu toate acestea, termenul OLAP nu a fost folosit decât în 1993 , când a fost inventat de Codd, care este, de asemenea, considerat „tatăl bazelor de date relaționale”. Cercetările lui Codd au fost însă finanțate de Arbor, care a lansat produsul OLAP Essbase (cunoscut mai târziu sub numele de Hyperion , software achiziționat de Oracle din martie 2007) cu un an mai devreme.

Alte produse bine cunoscute sunt platforma de informații pentru întreprinderi SAS, IBM DB2 OLAP Server (o versiune OEM a Essbase), SAP BW, Business Objects , DataTime, Cognos , MicroStrategy, Lilith (Hicare), Sybase IQ, Microsoft Analysis Services (numit anterior OLAP) Services) care face parte din Microsoft SQL Server , Oracle Business Intelligence Suite, Brio, DssMUSA de IG Consulting, BIExplore de Sediin, Information Builders, QlikView și multe altele.

Elemente conexe

linkuri externe

Controlul autorității LCCN (EN) sh99002794 · GND (DE) 4481345-4 · BNF (FR) cb15711780x (data)
Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT