Reprezentarea grafică a datelor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Reprezentarea grafică a datelor sau Vizualizarea datelor este activitatea de comunicare desfășurată prin proiecția datelor într-o formă grafică structurată. Această proiecție este unul dintre instrumentele de analiză a datelor și știința datelor și este utilizată pentru a crește gradul de utilizare a datelor, făcându-le mai accesibile, mai ușor de înțeles și mai ușor de utilizat.

Reprezentarea grafică a datelor folosește diverse elemente vizuale, cum ar fi grafice statistice , diagrame , tabele și hărți. Din acest motiv, este adesea atât o disciplină creativă, cât și o practică tehnică. [1]

Prezentare generală

Reprezentarea grafică a datelor este una dintre fazele analizei și prezentării datelor către utilizatori.

Termenul „reprezentare grafică a datelor” se referă la tehnicile și abilitățile utilizate pentru comunicarea datelor prin codificarea lor ca obiecte grafice (de exemplu, puncte, linii sau bare), cu scopul de a le prezenta utilizatorilor într-un mod clar și eficient.

În reprezentarea grafică, estetica și funcționalitatea trebuie integrate, evidențiind ideile, relațiile și aspectele cheie într-un mod intuitiv. Estetica are funcția de a îmbunătăți percepția mesajului fără a compromite vreodată aspectele funcționale. [2]

Fernanda Viegas și Martin M. Wattenberg au sugerat că o reprezentare ideală nu numai că ar trebui să comunice clar, ci să stimuleze implicarea și atenția spectatorilor. [3]

Există aplicații de date grafice, chiar direcționate și unice pentru utilizări și audiențe specifice și limbaje de programare precum D3 , Python și JavaScript care ajută la vizualizarea grafică a datelor procesate.

La nivelul școlii, există programe care să răspundă cererii de reprezentare grafică a datelor în scopuri de învățare și biblioteci de programare asociate, inclusiv programe gratuite precum Incubatorul de date sau programe plătite precum Adunarea Generală.

Domenii conexe

Reprezentarea grafică a datelor se găsește la intersecția diferitelor câmpuri de activitate.

Câmpuri utilizate sau incluse

Reprezentarea grafică a datelor se bazează pe concepte și metode dezvoltate pentru alte domenii de activitate, inclusiv:

  • Știința datelor și statisticile : metodele și activitățile, în special statisticile, de analiză a datelor, sunt adesea sursa datelor reprezentate.
  • Psihologia cognitivă : permite prezicerea și planificarea fluxului interpretativ al datelor reprezentate.
  • Statistici descriptive : tratează modalități de reprezentare a datelor numerice / statistice, în principal prin intermediul graficelor.
  • Arhitectura reprezentării datelor: Proiectarea reprezentării grafice a datelor pentru a le integra în mod eficient într-o comunicare mai complexă și mai intenționată.
  • Vizualizarea informațiilor : se concentrează pe reprezentarea datelor categorice, a relațiilor și a informațiilor complexe.

Câmpuri care utilizează reprezentarea grafică a datelor

Reprezentarea grafică a datelor este exploatată în diferite domenii de activitate. De exemplu:

  • Analiza modelului de afaceri : activități precum stabilirea obiectivelor de afaceri, colectarea cerințelor și maparea proceselor pot profita de filtrarea, evidențierea și rezumarea caracteristicilor reprezentărilor grafice ale datelor.
  • Optimizarea procesului: reprezentări grafice adecvate ale datelor pot fi exploatate pentru a optimiza fluxurile de acțiuni și decizii care vizează obiectivele de afaceri.
  • Proiectare software : utilizarea codificării grafice a informațiilor pentru a specifica părți ale sistemului, cum ar fi fluxurile de informații / luarea deciziilor, utilizatorii, interfețele grafice, schemele de date etc. este obișnuit în domeniul software, unde există metode reprezentative standard (de exemplu scheme UML , ER ) și pot fi exploatate și metode adaptate nevoilor.
  • Jurnalism vizual și telegiornalismo : Însoțește adesea povestea narată cu reprezentări grafice ale datelor pentru a facilita comunicarea sau evidențierea informațiilor în formă condensată și ușor de înțeles.
  • Divulgarea științifică : datele reprezentate și simplificate grafic pot fi mai ușor de înțeles de către public.

Câmpuri afine

Reprezentarea grafică a datelor are aspecte comune cu multe alte domenii de activitate, inclusiv:

  • Arhitectura informațională : au în comun organizarea și recombinarea datelor, pentru a le face mai utilizabile și mai adecvate.
  • Proiectare interacțiune și utilizare : Multe dintre principiile de fructificare sunt împărtășite între cele două discipline.
  • Design grafic : arta de a comunica și a impresiona prin intermediul graficii, simbolurilor și formelor estetice este comună.

Istorie

Nu există o discuție cuprinzătoare despre reprezentarea grafică a datelor și nici nu există conturi care să cuprindă întreaga dezvoltare a gândirii vizuale și reprezentarea grafică a datelor. [4]

Istoria antica

Graficarea datelor nu este o afacere modernă. Datele sau informațiile stelare, cum ar fi poziția stelelor, au fost reprezentate pe pereții peșterii (cum ar fi cele găsite în Peșterile Lascaux din sudul Franței) încă din Pleistocen . [5]

Diverse artefacte tridimensionale istorice, cum ar fi substituenții cantitativi ai argilei din Mesopotamia (5500 î.Hr.) sau quipu- ul incașilor sunt reprezentări concrete ale datelor. Aceste tipuri de reprezentări nedocumentare au fost, de asemenea, utilizate până în vremuri mai recente sau sunt încă în uz: de exemplu, abacuri (reprezentări cantitative), hărți stick ale Insulelor Marshall (hărți tematice) sau hărți tactile ale inuților (hărți tridimensionale) ).

Primele forme documentare de reprezentare grafică a datelor au fost hărți, ideograme și diferite hieroglife care au oferit și au permis interpretarea informațiilor ilustrate.

Una dintre cele mai vechi reprezentări grafice a datelor este Papirusul Minei de Aur , realizat în Egipt în 1160 î.Hr., care ilustrează distribuția resurselor geologice și oferă informații despre extragerea lor. O hartă de acest tip poate fi considerată o hartă tematică, care este un tip de reprezentare grafică a datelor care prezintă și comunică date și informații specifice printr-o ilustrație geografică concepută pentru a arăta date ale unei anumite teme conectate la anumite zone geografice.

Evul Mediu

Reprezentare antică a mișcărilor planetare, sub forma unui grafic liniar

Reprezentarea grafică a datelor în Europa, Africa de Nord și Est a evoluat odată cu inventarea pergamentului mai întâi și apoi a lucrării, care a facilitat dezvoltarea și diseminarea reprezentărilor bidimensionale ale datelor în decursul istoriei mai puțin antice. [6]

Graficul de la München

Cea mai veche încercare cunoscută de a reprezenta modificările valorilor de-a lungul timpului într-un mod comparabil cu cea a graficii moderne se găsește într-un manuscris realizat în secolul al X-lea sau al XI-lea păstrat în Bayerische Staatsbibliothek din München și posibil făcut pentru a fi folosit în școlile monahale. Manuscrisul include un scurt apendice intitulat De cursu per zodiacum („Despre mișcările din zodiac”) care descrie mișcările aparente ale Soarelui , Lunii și planetelor din centura zodiacului . În interior există un grafic care, chiar dacă astăzi nu este de înțeles în toate aspectele sale, probabil că a intenționat să reprezinte abaterile stelelor de la ecliptică în funcție de timp.

De-a lungul axei orizontale, graficul este împărțit în 30 de sectoare consecutive; astfel de sectoare reprezintă probabil timpul și valoarea lor trebuie să fie diferită pentru asatri individuali. Banda zodiacului este reprezentată de-a lungul axei verticale: o linie orizontală centrală reprezintă ecliptica, în timp ce șase cutii superioare și șase inferioare reprezintă extinderea intervalului de deviere. Prin urmare, graficul arată, chiar dacă numai într-un mod imprecis și schematic, modul în care diferitele stele se îndepărtează de ecliptică în timpul mișcărilor lor. [7]

Epoca modernă

În secolul al XVI-lea, tehnicile și instrumentele de observare, măsurarea precisă a mărimilor fizice, pozițiile geografice și cerești au fost bine dezvoltate. O importanță deosebită au fost dezvoltarea triangulației și a altor metode pentru determinarea exactă a pozițiilor în mapări.

René Descartes și Pierre de Fermat au dezvoltat geometria analitică și două sisteme de coordonate tridimensionale care au influențat puternic metodele practice de reprezentare și calcul al valorilor

Munca lui Fermat și Blaise Pascal despre statistică și teoria probabilității a pus bazele conceptualizării moderne a datelor.

Potrivit Interaction Design Foundation, aceste evoluții l-au ajutat pe William Playfair , care a dezvoltat potențialul comunicării grafice pentru date cantitative, prin generarea și dezvoltarea metodelor grafice pentru statistici. [8]

Epoca contemporană

Diagrama lui Charles Joseph Minard din 1869 a invaziei Rusiei , un exemplu timpuriu de grafic informațional

Pe parcursul secolului al XIX-lea, tehnicile de vizualizare au devenit și mai sofisticate.

O diagramă istorică a lui Charles Joseph Minard arată numărul de victime pe care armata lui Napoleon le-a suferit în perioada 1812–1813.

Sunt urmărite șase variabile, într-un mod sintetic și perceptibil: dimensiunea armatei, numele unor poziții geografice, drumul parcurs, timpul, direcția de mișcare și temperatura.

Diagrama permite o comparație vizuală imediată între dimensiunea armatei, direcția, temperaturile și etapele traseului.

Această reprezentare pe o suprafață bidimensională prezintă multiple aspecte ale unei povești, care pot fi înțelese imediat, creând credibilitate asupra relațiilor cauzale.

Revoluția digitală

După revoluția digitală , reprezentarea grafică a datelor a devenit o zonă activă de cercetare, predare și dezvoltare. Introducerea procesoarelor digitale de date a adus noi posibilități, printre care:

  • analizați cantități de date mult mai mari decât oricând, într-o fracțiune din timpul necesar anterior
  • creați cu ușurință vizualizări animate, care vă permit să vizualizați evoluțiile temporale ale datelor
  • genera vizualizări în timp real, care permit reprezentarea automată a unor noi date actualizate fără intervenția utilizatorului (monitorizare), aprofundarea unui subset de date (zoom) sau vizualizarea unui set alternativ (filtre, mișcări etc.)
  • gestionați reprezentări multimedia, care permit utilizarea potențială a interacțiunilor audio sau a altor interacțiuni computerizate pentru a sublinia sau reprezenta datele pentru publicul cu dizabilități
  • transmite reprezentări imediat la distanță și la scară largă

Procesarea, analiza și reprezentarea Big Data găsesc sprijin în reprezentarea grafică a datelor, în special digitale, pentru a reprezenta rezultatele analizelor științei datelor. [9]

În general, tehnologiile digitale măresc posibilitățile de reprezentare grafică a datelor. Cu toate acestea, aceste posibilități nu sunt în mod necesar exploatate și faptul că dispun de prea multe date disponibile poate avea efecte contraproductive .

Principii generale

Graficarea utilizatorilor în mod conștient sau inconștient efectuează sarcini analitice, cum ar fi efectuarea de comparații și extrapolarea relațiilor, astfel încât o reprezentare eficientă îi ajută pe utilizatori să înțeleagă și să se gândească mai bine la date.

Prin urmare, „principiul de proiectare” al oricărei grafice informaționale ar trebui să susțină activitatea analitică.

O reprezentare poate avea mai multe sarcini, evidențiind de exemplu valori specifice, relații, dimensiuni, cauzalitate sau alte caracteristici ale datelor; proiectarea reprezentării grafice a datelor ar trebui să îndeplinească aceste sarcini cât mai bine posibil.

Pornind de la aceleași date și scopuri, diferite tipuri și stiluri de grafice pot fi mai mult sau mai puțin eficiente. [10]

Eppler și Lengler au dezvoltat un „ tabel periodic de reprezentare a datelor ”, o reprezentare grafică care rezumă diverse metode de reprezentare grafică a datelor clasificându-le cu diverse criterii precum tipul de date, scopul, modul de reprezentare, nivelul de detaliere etc. Acest „tabel periodic” vă permite să alegeți rapid o reprezentare grafică eficientă a datelor în funcție de tipurile de date, scopurile și audiența.

Percepția umană, cunoașterea și reprezentarea grafică a datelor

Aproape toate vizualizările de date sunt create pentru consumul uman. Cunoașterea și exploatarea caracteristicilor percepției și cunoașterii umane sunt necesare pentru a proiecta vizualizări eficiente și intuitive. [8]

De exemplu, știind că oamenii pot procesa mai ușor diferențele de lungime decât o variație a suprafeței ne invită să reprezentăm diferențe cantitative printr-o diagramă cu bare (care utilizează lungimea liniei pentru a arăta comparația) mai degrabă decât o plăcintă (care utilizează suprafața pentru arată comparația) [11] .

Procesarea vizuală umană este cea mai eficientă la detectarea modificărilor și la comparații între lungimi, zone, forme, culori și variații de grosime. Când proprietățile simbolice ale datelor sunt asociate cu proprietățile vizuale, oamenii pot naviga în mod eficient prin cantități mari de date, utilizând mai bine resursele mentale.

Reprezentarea corectă oferă o abordare diferită pentru a arăta potențiale conexiuni, relații etc. care nu sunt atât de evidente în datele cantitative care nu sunt afișate.

Atribute Preactive

O ființă umană poate distinge cu ușurință diferențele de lungime, formă, orientare și culoare într-un mod imediat și cu puțin efort cognitiv, cu un mod instinctiv de percepție care apare înainte de a avea atenție și conștientizare concentrate, care poate fi definit ca „percepție pre-atentă . "; elementele reprezentative percepibile în acest mod pot fi definite ca „atribute pre-reactive”. [12]

Să vedem un exemplu de exploatare a atributelor preactive: Distingerea tuturor aparițiilor cifrei „5” într-o serie de numere ar necesita timp semnificativ și efort mental (percepție atentă); dar dacă aparițiile acelei cifre ar fi de mărime, grosime și / sau culoare diferite, instanțele cifrei ar putea fi înțelese rapid prin percepție pre-atentă și fără mult efort cognitiv. [11]

O reprezentare grafică eficientă ar trebui să ia în considerare și să exploateze mecanismele procesării mentale, atributele preactive și puterea relativă a acestor atribute.

Clasificare

Clasificările reprezentărilor grafice ale datelor sunt numeroase și se bazează pe criterii diferite.

Pe baza sarcinii

Edward Tufte a enumerat șase sarcini care ar trebui îndeplinite prin reprezentări grafice ale datelor [13] :

  • Document : Explicați sursele și caracteristicile datelor
  • Comparați : forțați în mod repetat compararea datelor
  • Demonstrați cauzalitatea : demonstrați mecanisme de cauză și efect între diferitele date reprezentate
  • Cuantificare : Cuantificați relațiile cauză-efect
  • Evidențierea multivarianțelor : recunoașterea aspectelor multivariate intrinseci ale problemelor, adică efecte cu cauze multiple
  • Explicați cu scepticism : Explorați și evaluați explicații alternative

Se poate observa că Tufte insistă asupra reprezentării diferitelor aspecte ale relațiilor de cauză și efect, cu rezultate care afectează raționamentul și deciziile destinatarilor.

Pe baza tipului de date

Prin clasificarea variabilelor în funcție de furnizarea sau nu a datelor numerice, se obțin două categorii de date reprezentabile:

  • Cantitate : o cantitate este o variabilă ale cărei valori sunt date cantitative , adică măsuri numerice, cum ar fi „25” pentru a reprezenta o vârstă, a cărei natură este numerică și ale cărei valori pot fi întotdeauna înțelese exprimate ca numere. Valorile numerice pot fi codate în diferite moduri, adesea bazate pe poziția, zona sau gradarea culorii, cum ar fi punctele, liniile sau barele, pentru a comunica vizual informații cantitative.
  • Categorie : O categorie este o variabilă calitativă , deci o variabilă nenumerică sau o variabilă numerică utilizată cu o funcție de clasificare și nu una de măsurare, ale cărei valori se numesc date categorice , de exemplu culoare, nume, tip, interval de vârstă (valoare potențial numerică utilizată ca categorie), sau forme mai complexe, cum ar fi relația cu un alt element, de ex. tată etc. Categoriile nu se pretează bine reprezentărilor canonice ale mărimilor, tocmai pentru că este posibil să nu fie cantități.

Combinând tipuri de date și scopuri reprezentative, Stephen Few a identificat opt ​​tipuri de macro:

  1. Cronologie sau tendință : dacă doriți să ilustrați evoluția valorilor variabilelor cantitative dobândite în mod repetat în timp.
  2. Clasament : Când doriți să sortați datele cantitative sau frecvențele categorice, în ordine crescătoare sau descendentă.
  3. Comparație între părți și total : atunci când doriți să relaționați o variabilă cantitativă sau o valoare categorică cu totalul (100%).
  4. Abaterea : Când doriți să comparați abaterea unor valori față de o valoare de referință
  5. Distribuția frecvenței : Pentru a arăta numărul de observații ale unei anumite variabile pentru un anumit interval. Diagramele liniare și etichetele descriptive suprapuse sau plasate în diagramă pot adăuga date statistice complementare pentru a înțelege mai bine distribuțiile, de ex. mediană, quartile, valori exterioare etc.
  6. Corelație : dacă doriți să comparați intersecția valorilor a două variabile cantitative (X, Y) pentru a evidenția dacă au corelații, cum ar fi proporționalitatea directă sau inversă, cauza-efect etc.
  7. Comparație nominală : dacă doriți să vizualizați date categorice care nu au o anumită ordine
  8. Poziționare geografică sau geospațială : dacă doriți să comparați sau să proiectați o variabilă în ceea ce privește coordonatele spațiale.

Pe baza metodologiei grafice

Clasificând în funcție de metodologia grafică putem împărți reprezentările datelor în două tipuri principale, și anume tabele și reprezentări vizuale:

  • Un tabel listează datele în rânduri clasificându-le pe coloane și este potrivit pentru a conține atât date cantitative cât și categorice, cu titluri categorice în principal și conținut de celule categorice sau cantitative. Este folosit în principal pentru a vă permite să găsiți valori specifice. De exemplu, într-un tabel fiecare rând poate conține date de la o altă persoană ( eșantion experimental ) cu titluri de coloane categorice reprezentând numele ( variabila de clasificare calitativă ), copilul ( variabila relație calitativă ) și vârsta ( variabila cantitativă ).
  • O reprezentare vizuală prezintă valorile codificate ca obiecte vizuale (de exemplu, linii, bare, puncte sau forme) și evidențiază relațiile dintre una sau mai multe variabile. Valorile sunt reprezentate într-o zonă, care poate fi proiectată în una sau mai multe axe. Orice axe oferă „scale” (cantitative și / sau categorice) utilizate pentru etichetarea și atribuirea valorilor vizuale. Principalele tipuri de reprezentări vizuale sunt grafice, hărți și grafice. [14]

Tipuri de reprezentări vizuale

La rândul său, reprezentările vizuale pot fi împărțite în două categorii macro, care diferă în ceea ce privește granularitatea și adecvarea pentru un studiu aprofundat: [15]

  • Afișaje grafice , potrivite pentru mesaje generice și transmiterea de informații simple și imediate, inclusiv infografice , ideograme , pictograme și diagrame. Un exemplu minim cu două variabile este simbolul unidirecțional care reprezintă variabila cantitativă a direcției simplificate într-o singură valoare booleană codificată pe partea în care se află vârful săgeții (eliminând toate alternativele, cu excepția „direcției corecte” și „sens contrar”), împreună cu variabila categorică a obligației , codificată în combinația specifică de culori, forme și proporții a desenului.
  • Grafice și diagrame mai detaliate, utilizate pentru susținerea proiectelor, elaborări tehnice și strict legate de valorile numerice.

Bun antrenament

Caracteristicile unei bune reprezentări

O bună reprezentare grafică a datelor ar trebui să fie:

  • Eficace : afișarea datelor într-un mod ușor de înțeles
  • Concentrat : Inducerea privitorului să se gândească la substanță și date, mai degrabă decât să le distragă atenția cu metodologii de reprezentare, grafică, tehnologii grafice sau altele
  • Adevărat : evitarea denaturării datelor reprezentate
  • Concis : rezumând o mulțime de date într-un spațiu mic
  • Uniformă : realizarea unor seturi de date mari consistente și uniforme
  • Perspicace : încurajarea ochiului să compare date, subseturi de date, relații etc.
  • Multinivel : date revelatoare la diferite niveluri de abstractizare și detaliu, de la o imagine de ansamblu largă la o structură fină
  • Scop : Fiind proiectat și construit cu un scop rezonabil de clar: Descrieți, explorați, enumerați sau decorați
  • Semnificativ : având o semnificație statistică sau descriptivă a setului de date

Evident, realizarea reprezentărilor de date care respectă toate aceste caracteristici bune nu este o activitate banală, dar reprezentările grafice bine realizate pot fi, în funcție de caz, mai concentrate și mai revelatoare decât analizele statistice și reprezentările numerice și textuale.

„Cea mai mare valoare a unui desen este atunci când ne obligă să observăm ceea ce nu ne așteptam să vedem”.

( John Tukey "Analiza datelor exploratorii" ISBN 0201076160 )

Biroul de buget al Congresului din Statele Unite a rezumat într-o prezentare în iunie 2014 a mai multor „ bune practici ” pentru reprezentarea grafică a datelor.

Acestea au inclus:

  1. Contextualizează : cunoaște-ți publicul
  2. Utilizați simboluri universale : proiectați elemente grafice care pot sta singure în afara contextului reprezentării
  3. Utilizați simboluri eficiente : proiectați graficele care comunică mesajele cheie din raport

Practici nerecomandate

Nerespectarea celor mai bune practici poate duce la grafică înșelătoare, care denaturează mesajul sau susține o concluzie incorectă.

În multe cazuri, aceste obiceiuri proaste sunt aplicate fără ca autorul să observe. De exemplu, separarea etichetelor de imagine din motive pur estetice, cum ar fi atunci când puneți o etichetă în legendă și nu pe diagramă, necesită ca ochiul să se deplaseze înainte și înapoi de la imagine la etichetă pentru ao înțelege, așa că ar trebui să se facă numai în caz de nevoie care vizează o mai bună lizibilitate, în timp ce tindem să o facem în mod obișnuit.

Relația dintre „date și grafică” ar trebui maximizată în favoarea datelor, eliminând acolo unde este posibil graficele care nu acceptă datele și / sau care penalizează înțelegerea.

«Variațiile tridimensionale ale reprezentărilor graficelor cu bare nu adaugă nimic informațiilor transmise și, uneori, complică citirea acestora; utilizarea lor este justificabilă dacă doriți să faceți grafica în volume destinate non-specialiștilor mai atractivă din punct de vedere estetic. [16] "

( Gerardo Massimi )

Exemple de selectare a diagramelor pentru diferite reprezentări

Pictogramă lupă mgx2.svg Același subiect în detaliu: Diagrama .

Multe reprezentări grafice vizuale ale datelor se bazează pe utilizarea diagramelor , posibil multiple și / sau însoțite de texte și grafică, ca în cazul infograficelor .

Analiștii care examinează un set de date evaluează dacă și care dintre tipurile de diagrame sunt aplicabile sarcinii, mesajului și publicului lor. Procesul, care include încercări și erori, pentru a identifica relații și reprezentări semnificative ale datelor face parte din analiza exploratorie a datelor .

Există nenumărate diagrame standard , potrivite pentru diferite situații și pot fi create altele infinite, fiecare cu puncte tari, puncte slabe, ținte etc. Câteva exemple sunt prezentate mai jos:

Nume Variabile reprezentabile Aspect de evidențiat Exemple
Histograma prețului casei
Histogramă
  • X cantitate
  • Y cantitate
  • Grosimea barei (cantitate, opțional)
  • culoare (cantitate sau categorie, opțional)
  • Vizualizați evoluția unei valori, de exemplu cantitatea de precipitații în diferite luni ale anului.
  • Vizualizați modele ale căror vânzări totale se încadrează într-un anumit interval, cum ar fi 10000-20000, 20000-30000
Diagrama cu bare a clicurilor în funcție de ziua săptămânii
Diagramă cu bare
  • Categoria X
  • Y cantitate
  • culoare (cantitate sau categorie, opțional)
  • Clasament : Sortarea barelor prin creșterea sau scăderea cantității
  • Comparație între părți și total
  • Abaterea : pentru variabilele categorice
  • Comparație nominală
  • Vânzări de diferite modele de mașini într-o anumită perioadă
  • Vânzări de diferite modele de mașini într-o anumită perioadă, sortate în funcție de cantitate pentru a obține un clasament
  • Compararea vânzărilor în diferite regiuni comparativ cu vânzările medii preconizate
  • Compararea vânzărilor unui anumit model cu toate modelele din aceeași industrie
William Playfair Diagramă pentru pie
William Playfair Pie Chart
Graficul proporțiilor
  • categoria sectorului
  • cantitatea unghiului / suprafeței
  • culoare (cantitate sau categorie, opțional)
  • Comparație între părți și total
  • Compararea vânzărilor unui anumit model cu vânzările totale din sector
Grafic cu două linii care ilustrează tendința cheltuielilor și veniturilor federale din SUA
Diagramă liniară
  • X cantitate (de obicei timp)
  • Y cantitate
  • grosimea liniei (cantitate, opțional)
  • culoare (categorie, opțională dacă există mai multe linii)
În general, este potrivit pentru toate reprezentările histogramei
  • Vizualizați evoluția unei valori sau comparați evoluția mai multor valori, cum ar fi cantitatea de precipitații în diferite luni ale anului pentru diferite regiuni.
  • Spuneți vânzările anuale pentru o perioadă de 10 ani.
  • Arătați tendința cheltuielilor publice și a veniturilor publice în timp
Grafic de împrăștiere cu două variabile
Grafic de împrăștiere
  • X cantitate
  • Y cantitate
  • simbol (categorie, opțional)
  • culoare (cantitate sau categorie, opțional)
  • dimensiune (cantitate, opțional)

  • Evidențiați relația dintre vârstă și salariul mediu
  • Ilustrați o corelație negativă între cele două variabile inflație și șomaj după X luni, măsurate în diferite momente din timp
Diagrama dispersiei în 3 variabile plus culoare
Grafic de împrăștiere 3D
  • X cantitate
  • Y cantitate
  • Z Cantitate
  • culoare (cantitate sau categorie, opțional)
  • evidențiere clustering (cantitate sau categorie, opțional)
La fel ca graficul scatter, dar acceptă o variabilă suplimentară
  • Evidențiați relația dintre vârstă, salariul mediu și numărul de ore lucrate pe zi
Network Analysis
rappresentazione a grafo della homepage di http://it.wikipedia.org
Grafo
  • dimensione nodo (quantità, opzionale)
  • colore nodo (quantità o categoria, opzionale)
  • spessore arco (quantità, opzionale)
  • colore arco (quantità o categoria, opzionale)
  • X nodo (quantità o categoria, opzionale)
  • Y nodo (quantità o categoria, opzionale)
  • clustering (quantità o categoria, opzionale)
  • Struttura delle interrelazioni tra insiemi di dati intercorrelati
    • Cluster in un network
    • Punti di connessione tra sottoreti
    • Nodi più interconnessi
    • Nodi più isolati
    • Percorsi o flussi in un network
  • Evidenziare gruppi di amici in un social network
  • Evidenziare persone che uniscono due gruppi di amici altrimenti distinti
  • Visualizzare le persone con più follower attivi
  • Identificare persone solitarie, non in relazione o con poche relazioni con il resto del network
Grafico ad area impilato
Grafico ad area impilato
  • altezza area (quantità)
  • colore (quantità o categoria, opzionale)
  • X (quantità, tipicamente il tempo)
  • Alternativa al grafico a linea, dove le linee sono impilate verticalmente e non sovrapposte
  • Comparare l'uso di diverse sorgenti energetiche nazionali (es. carbone, gas, eolico) nel corso del tempo
Mappa ad albero
Mappa ad albero
  • dimensione area (quantità)
  • colore (quantità o categoria, opzionale)
  • clustering (categoria, opzionale)
  • Confronto tra le parti e il totale : In particolare quando le parti possono essere raggruppate in cluster
  • Evidenziare quali file occupano più spazio, raggruppandoli in cartelle tramite clustering
Diagramma di Gantt
Diagramma di Gantt
  • colore (categoria, opzionale)
  • tempo (quantità)
  • percentuale di completamento (quantità, opzionale)
  • dipendenza da altri elementi (categoria)
  • annidamento in altri elementi (categoria, opzionale)
  • Pianificazione delle attività di un dato progetto prima del lancio, finalizzata alla distribuzione dei compiti e previsione dei tempi di realizzazione
Mappa di calore
Mappa di calore
  • X (quantità)
  • Y (quantità)
  • cluster (quantità o categoria, opzionale)
  • colore (quantità o categoria)
  • Confronto tra una classificazione (spaziale o categoriale) e un valore
  • Proiezione del rischio per una certa malattia, in funzione del settore e sottosettore lavorativo
Media annuale della salinità superficiale del mare
Cartogramma
  • X (quantità)
  • Y (quantità)
  • cluster (quantità o categoria, opzionale)
  • colore (quantità o categoria)
  • Posizionamento geografico o geospaziale
  • Proiezione del rischio per una certa malattia, proiettato sul colore, in funzione della zona geografica
  • Nnumero di vendite per città, un cartogramma è tipicamente il grafico più appropriato
Grafico a strisce
Grafico a strisce
  • X (quantità o categoria)
  • colore (quantità)
È una versione alternativa al grafico a linea e all'istogramma, dove Y si sostituisce con una gradazione di colore.

Può essere più efficace nei casi in cui il colore sia associabile facilmente alla casistica relativa al range di valori rappresentati da quel colore (es. rosso incendi, blu pioggia, verde guadagni, ecc..)

  • re.
  • Rappresentazione della quantità di pioggia caduta nel corso dei mesi degli anni, usando il blu per più precipitazioni e il rosso per meno precipitazioni.uel
Grafico a spirale animato
Grafico a spirale animato
  • distanza dal centro (quantità)
  • tempo come angolo di rotazione (quantità)
  • colore (quantità, opzionale)
  • Sequenza temporale : Può essere usato per rappresentare una serie temporale, come un grafico a linea singola avvolto su se stesso.
  • Rappresentazione dell'evoluzione della temperatura media del pianeta nel corso degli anni,

Architettura della presentazione dei dati (DPA)

Rappresentazione grafica di dati tratti da un social media

L'architettura della presentazione dei dati ( Data Presentation Architecture - DPA) è un insieme di attività e competenze che cercano di identificare, localizzare, filtrare, manipolare, formattare e presentare i dati in modo tale da comunicare in modo ottimale significati e conoscenza, rispetto ad un contesto decisionale. [8]

Ogni rappresentazione grafica dei dati si può vedere come una fase di un processo di messa in opera di una architettura della rappresentazione dei dati, anche se spesso le altre fasi vengono ignorate o ridotte al minimo indispensabile, oppure ogni DPA si può vedere come una estensione dell'attività di rappresentazione grafica dei dati. Spesso in effetti si svolge un'attività di DPA pensando di svolgere semplicemente una progettazione di una rappresentazione grafica dei dati.

L'architettura della presentazione dei dati può essere usata in modo costruttivo per chi decide, facilitando e rendendo migliori le decisioni, o viceversa anche per manipolarlo, ad esempio evidenziando pregi minimi o secondari e minimizzando o nascondendo difetti ed effetti collaterali, come nel caso della propaganda o del marketing finalizzato alla creazione di bisogni indotti .

Obiettivi della DPA

Gli obiettivi principali dell'architettura della presentazione dei dati sono simili a quelli della rappresentazione grafica dei dati:

  1. Efficienza : Usare i dati per fornire conoscenza nella maniera più efficiente possibile (minimizzare il rumore di fondo, la complessità ei dati o dettagli non necessari per i bisogni ei ruoli di specifici utenti)
  2. Efficacia : Usare i dati per fornire conoscenza nella maniera più efficace possibile (fornire dati rilevanti e completi al momento opportuno, che siano per tutti gli utenti chiari e comprensibili, portino i significati rilevanti, siano elaborabili e possano influire su comportamenti, interpretazioni e decisioni)

Attività della DPA

Per raggiungere gli obiettivi della DPA si lavora su:

  • Mezzi : Creare meccanismi di fruizione efficaci per ogni utente destinatario, in funzione del suo ruolo, dei suoi obiettivi, della sua localizzazione e del suo accesso alla tecnologia.
  • Rilevanza : Definire quali significati e conoscenze sono da evidenziare per ogni utente e contesto.
  • Freschezza : Determinare la periodicità necessaria per gli aggiornamenti dei dati modificati.
  • Temporalità : Determinare il momento giusto per presentare i dati o ripeterli.
  • Approfondimenti : Trovare gli argomenti, la storia, la durata, il livello di dettaglio, ecc. appropriati.
  • Rappresentazione : Determinare ed eseguire le più appropriate analisi, raggruppamenti, visualizzazioni ed altre azioni finalizzate alla rappresentazione.

Note

  1. ^ Manuela Aparicio and Carlos J. Costa, Data visualization , in Communication Design Quarterly Review , vol. 3, n. 1, November 2014, pp. 7–11, DOI : 10.1145/2721882.2721883 .
  2. ^ Vitaly Friedman, Data Visualization and Infographics , su smashingmagazine.com .
  3. ^ Fernanda Viegas e Martin Wattenberg, How To Make Data Look Sexy , su articles.cnn.com . URL consultato l'8 febbraio 2020 (archiviato dall' url originale il 6 maggio 2011) .
  4. ^ A Brief History of Data Visualization , su citeseerx.ist.psu.edu ( archiviato il 1º dicembre 2017) .
  5. ^ Ice Age star map discovered , su news.bbc.co.uk (archiviato dall' url originale il 6 gennaio 2018) .
  6. ^ NI Fisher, Statistical Analysis of Circular Data .
  7. ^ Howard Gray Funkhouser, A Note on a Tenth Century Graph , in Osiris , vol. 1, gennaio 1936, pp. 260–262, DOI : 10.1086/368425 , JSTOR 301609 . URL consultato il 9 marzo 2020 .
  8. ^ a b c Data Representation Architecture: Visualization Design Methods, Theory and Technology Applied to Anesthesiology
  9. ^ Gil Press, A Very Short History Of Data Science , su forbes.com . URL consultato il 26 agosto 2017 ( archiviato l'11 settembre 2017) .
  10. ^ Graphical Perception and Graphical Methods for Analyzing Scientific Data ( PDF ), su pdfs.semanticscholar.org . URL consultato il 20 ottobre 2018 ( archiviato il 20 ottobre 2018) .
  11. ^ a b Tapping the Power of Visual Perception ( PDF ), su perceptualedge.com (archiviato dall' url originale il 23 agosto 2019) .
  12. ^ VISUALIZZARE EFFICACEMENTE: COME SFRUTTARE GLI ATTRIBUTI PREATTENTIVI , su data-storytelling.it .
  13. ^ Michael Shermer, The Feynman-Tufte Principle , su scientificamerican.com .
  14. ^ Steven Few-Selecting the Right Graph for Your Message-September 2004 ( PDF ), su perceptualedge.com . URL consultato l'8 settembre 2014 ( archiviato il 5 ottobre 2014) .
  15. ^ Rappresentazione grafica dei dati , su researchgate.net .
  16. ^ Gerardo Massimi, Ambiti e sistemi territoriali Un approccio esplorativo alle tematiche geospaziali Cenni sulle più diffuse rappresentazioni grafiche ( PDF ), su geolab.unich.it .
Controllo di autorità LCCN ( EN ) sh2002000243