Coordonate paralele

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Clasificarea unui set de mașini cu diagramă de coordonate paralele.

Coordonatele paralele sunt un sistem utilizat în mod obișnuit pentru vizualizarea spațiilor n-dimensionale și analiza datelor multivariate. Pentru a arăta un set de puncte în spațiul n-dimensional, sunt trasate n linii paralele, de obicei verticale și plasate la distanțe egale între ele. Un punct din spațiul n-dimensional este reprezentat ca o linie întreruptă cu vârfuri pe axe paralele. Poziția vârfului pe axa i corespunde coordonatei i a punctului.

Istorie

Coordonatele paralele au fost inventate de Maurice d'Ocagne în 1885 [1] și ulterior redescoperite și diseminate de Al Inselberg [2] în 1959. Ulterior au fost dezvoltate sistematic și utilizate ca sistem de coordonate începând cu 1977. Unele aplicații importante sunt, de exemplu de exemplu, în algoritmii de evitare a coliziunilor pentru traficul aerian, în Data Mining și mai recent în sistemele de detectare a intruziunilor. Este important să ne amintim câte dintre aceste aplicații de coordonate paralele și succesul lor se datorează articolului „Analiza datelor hiperdimensionale folosind coordonatele paralele” (Wegman 1990).

Considerații statistice

În cazurile în care coordonatele paralele sunt utilizate pentru vizualizarea datelor statistice, trebuie acordată o importanță deosebită celor trei factori: ordinea axelor, rotația acestora și scala utilizată.

Ordinea axelor este fundamentală pentru a identifica principalele caracteristici ale datelor și, de obicei, în analiza datelor, sunt încercate mai multe soluții înainte de a ajunge la un rezultat optim. Unii autori au descris unele euristici pentru ordonarea axelor, capabile să îndeplinească această sarcină [3] .

Necesitatea redimensionării axelor apare din faptul că graficul se bazează pe interpolare (combinație liniară) a perechilor consecutive de variabile [4] . Prin urmare, variabilele trebuie să fie la o scară comună și există multe abordări diferite pentru găsirea reprezentării ideale, care sunt considerate ca parte a procesului de pregătire a datelor și pot dezvălui puncte de vedere informative diferite.

Generalizarea coordonatelor paralele

O generalizare a coordonatelor paralele (GPCP) a fost propusă de (Moustafa și Wegman 2002) [5] . Urmând această abordare, datele sunt transformate înainte de a fi reprezentate pe grafic. Dacă funcția de interpolare este un Lagrangian definit de cazuri, obținem un grafic tradițional de coordonate paralele , în caz contrar, dacă spline sunt utilizate ca funcție de interpolare, obținem graficul de coordonate paralele netede (SPCP). În acest grafic, fiecare observație este reprezentată ca o curbă parametrică, continuă și ortogonală pentru fiecare axă paralelă [4] .

Notă

  1. ^ d'Ocagne, Maurice, Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles , Paris: Gauthier-Villars, 1885.
  2. ^ Alfred Inselberg, Planul cu coordonate paralele , în Visual Computer , vol. 1, nr. 4, 1985, pp. paginile 69–91, DOI : 10.1007 / BF01898350 .
  3. ^ Dimensiunea ierarhică interactivă Ordinarea spațierii și filtrarea pentru explorarea seturilor de date de dimensiuni ridicate (paginile 3-4)
  4. ^ a b . R. Moustafa, E. Wegman, Multivariate continue data - Parallel Coordinates , în In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer , 2006, pp. . 143–156.
  5. ^ R. Moustafa, E. Wegman, On Some Generalization to Parallel Coordinate Plot , în Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germania , 2002.

linkuri externe