Știința datelor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Schița unui proces de analiză în știința datelor

Știința datelor este ansamblul principiilor metodologice (bazate pe metoda științifică ) și a tehnicilor multidisciplinare care vizează interpretarea și extragerea cunoștințelor din date prin faza relativă de analiză de către un expert ( Data Scientist ) [1] [2] .

Metodele științei datelor (adesea asociate cu conceptul de extragere a datelor ) se bazează pe tehnici din diverse discipline, în principal din matematică , statistică , știința informației , informatică și științe sociale , în special în următoarele subdomenii: baze de date și vizualizare date sau afaceri inteligență , inteligență artificială sau învățare automată (vezi și Big data ). Rolul cercetătorului în date a fost definit de „ Harvard Business Review ” drept „cea mai atractivă profesie din secolul 21[3] și este considerat unul dintre cele patru roluri cheie responsabile pentru utilizarea sistematică a Big Data în companii [4] ] .

Istorie

Termenul „Știința datelor” a fost introdus pentru prima dată în 1974 de informaticianul danez Peter Naur în cartea sa Concise Survey of Computer Methods ca o evoluție a conceptului de datalogie folosit de însuși Naur cu câțiva ani mai devreme [5] pentru a-l contrasta cu concept mai limitativ decât informatica . În această primă definiție, Naur înțelege știința datelor ca o disciplină legată de gestionarea și manipularea datelor pe măsură ce apare [6] , punând puțin accent pe posibilitatea extragerii de informații valoroase din datele în sine.

A fost recunoscută ca disciplină de sine stătătoare (deci nu mai este o ramură a informaticii și statisticii) abia în 2001 , când William Cleveland și-a prezentat domeniile de expertiză, enumerând șase domenii diferite: cercetare multidisciplinară, modele, prelucrarea datelor, pedagogie, evaluarea instrumentelor și a teoriei [7] .

Odată cu apariția Big Data și ideea de „valoare a datelor” tipică acestei paradigme, însăși conceptul de știință a datelor a evoluat, devenind astfel un știință holistică [ fără sursă ] , al cărei principiu fondator nu este simpla gestionare a datelor, ci o îmbunătățire mai largă a cantității mari eterogene de date provenite din diferite surse ( depozit de date , senzori, web etc.). Știința datelor în zilele noastre trebuie, așadar, înțeleasă ca o disciplină transversală, care include atât sfera informaticii, statisticii și matematicii, ca în sensul original, cât și un set de abilități manageriale, legate de cea mai recentă nevoie de a ști cum să citească , interpretează și valorifică datele în scopuri comerciale.

„Observatorul Big Data Analytics & Business intelligence Observatory” al Politecnico di Milano în 2018 a efectuat o analiză a ofertelor de locuri de muncă publicate pe Linkedin, identificând cifrele profesionale cele mai solicitate de companiile din sectorul științelor datelor. Din această analiză a fost posibil să se identifice cel puțin trei tipuri distincte de profiluri profesionale: cercetătorul de date, inginerul de date și analistul de date . [8]

Notă

  1. ^(EN) Foster Provost și Tom Fawcett, Știința datelor și relația sa cu Big Data și luarea deciziilor bazate pe date în Big Data, vol. 1, nr. 1, 13 februarie 2013, pp. 51–59, DOI : 10.1089 / mare.2013.1508 . Adus pe 27 august 2017 .
  2. ^ Vasant Dhar, Data Science and Prediction , în Commun. ACM , voi. 56, nr. 12, decembrie 2013, pp. 64–73, DOI : 10.1145 / 2500499 . Adus pe 27 august 2017 .
  3. ^ Data Scientist: The Sexiest Job of the 21st Century , în Harvard Business Review . Adus pe 27 august 2017 .
  4. ^ Andrea De Mauro, Marco Greco și Michele Grimaldi, Resurse umane pentru profesiile Big Data: O clasificare sistematică a rolurilor de muncă și a seturilor de competențe necesare , în Procesarea și gestionarea informațiilor , DOI : 10.1016 / j.ipm.2017.05.004 . Adus pe 27 august 2017 .
  5. ^ Peter Naur, Știința datalogiei , în Communications of the ACM , vol. 9, nr. 7, 1966.
  6. ^ Peter Naur, Concise Survey of Computer Methods , Studentlitteratur, 1974.
  7. ^ William S. Cleveland, Știința datelor: Un plan de acțiune pentru extinderea domeniilor tehnice din domeniul statisticii , în Revista Statistică Internațională , 2001.
  8. ^ Știința datelor: necesitatea pentru gestionarea Big Data , pe blog . Osservatori.net .

Elemente conexe

Alte proiecte

Statistici Portal de statistici : accesați intrările Wikipedia care se ocupă de statistici