Analize de date mari

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
BDA

Analiza datelor mari este procesul de colectare și analiză a volumelor mari de date ( date mari ) pentru a extrage informații ascunse. Asociat cu o analiză sofisticată a afacerii, big data are potențialul de a oferi companiilor informații despre condițiile pieței [1] , comportamentul clienților, luând deciziile mai eficiente și mai rapide decât concurența [2] , îndepărtându-se de soluțiile tradiționale de business intelligence deoarece funcționează pe volume mari de date și, prin urmare, necesită o prelucrare mai lentă și mai puțin eficientă. Astăzi, sunt oferite diverse tehnologii și tehnici de analiză pentru a descoperi tipare ascunse și conexiuni între date.

Acest proces de analiză permite să acționeze o analiză predictivă , adică permite să știm în avans ce se va întâmpla: acest lucru devine posibil deoarece, dacă avem un model și avem suficiente date istorice, putem determina ce se va întâmpla în viitorul apropiat (un trend) cu baze sau fundații. statisticieni . Pe baza acestor prognoze, este posibil să se intervină asupra viitorului printr-o analiză prescriptivă, adică sunt căutate condițiile pentru ca un anumit eveniment să se întâmple.

Deci, datele mari reprezintă noul instrument care face societatea „măsurabilă”: ele împing spre o nouă știință a datelor , capabilă să măsoare și, în perspectivă, să prezică crizele economice, epidemiile, difuzarea opiniilor, distribuirea resurselor economice, nevoile de mobilitate. [3]

Istorie

De mulți ani s-a vorbit despre Big Data, dar abia recent multe organizații și-au dat seama de importanța lor. Captarea cantității nenumărate de date, care sunt partajate în fiecare zi în activitatea sa, permite unei companii să analizeze și să extragă informații semnificative și uneori vitale pentru deciziile sale.

Inițial, chiar înainte de a fi folosit termenul „Big Data”, activitățile comerciale se bazau pe analize numerice simple pentru a descoperi informații ascunse și tendințe. Astăzi, cu toate acestea, informațiile sunt preluate din volume enorme de date, unde analiza, care a devenit acum rapidă, ne permite să anticipăm alegerile viitoare mai precis. În acest din urmă, utilizarea Big Data Analytics oferă proiecte și metodologii din ce în ce mai complexe și avansate ( analize predictive și în timp real , utilizarea lacurilor de date sau modele integrate de stocare a datelor , echipe dedicate managementului științei datelor ) capabile să aibă impact asupra tuturor proceselor de o organizație: comunicații personalizate, optimizarea proceselor de producție, gestionarea situațiilor de urgență, etc ... [4]

Descriere

Definiție și caracteristici

Este un proces de Business Intelligence adaptat Big Data. Prin urmare, sunt necesare instrumente automate care pot ajuta managerii și managerii companiei să ia deciziile corecte pentru a maximiza profiturile și a evita risipa din cauza alegerilor rele, mai ales în ultimii ani când criza economică lasă și mai puțin spațiu pentru greșeli.

Prezența datelor nestructurate necesită o abordare diferită în analiză care diferă de sistemele tradiționale de gestionare a bazelor de date. În acest context, este necesar să existe arhitecturi software pregătite pentru gestionarea volumelor mari de date, capabile de procesare paralelă pe sisteme de cluster . Tehnologii emergente precum Hadoop , MapReduce și baze de date NoSQL .

Principalele obiective ale analizei Big Data [5] sunt:

  • Reduceți costurile : sunt introduse noi tehnologii pentru a reduce costurile de gestionare și analiză a volumelor mari de date.
  • Viteza : analizele efectuate trebuie să poată produce un rezultat într-un timp scurt, astăzi există din ce în ce mai multe referiri la analize în timp real.
  • Precizie : având la dispoziție cantități mari de date, pot fi efectuate analize mai precise.

Prin aceste obiective este posibil să anticipăm viitorul cu cunoștințele datelor colectate în trecut și să identificăm noi oportunități de câștig.

Diferențe cu business intelligence

Maturitatea crescândă a conceptului de Big Data evidențiază diferențele cu Business Intelligence , în ceea ce privește datele și utilizarea acestora:

  • Business Intelligence folosește statistici descriptive cu date cu densitate ridicată a informațiilor pentru a măsura lucrurile, a detecta tendințele etc., adică folosește seturi de date limitate, date curate și modele simple pentru a afla ce s-a întâmplat și de ce s-a întâmplat; [6]
  • Big Data folosește statistici inferențiale și concepte de identificare a sistemelor neliniare [7] pentru a deduce legi ( regresii , relații neliniare și efecte cauzale ) din seturi mari de date [8] și pentru a dezvălui relații și dependențe și pentru a face predicții ale rezultatelor și comportamentelor [7] [ 9] , cu alte cuvinte, utilizează seturi de date eterogene ( fără legătură ), date brute și modele predictive complexe. [6] [10]

Notă

  1. ^ (EN) Claudio Vitari și Elizabeth Dubrovnik, Big data analytics business value and firm performance: linking with context context , în International Journal of Production Research, 9 septembrie 2019, pp. 1–21, DOI : 10.1080 / 00207543.2019.1660822 . Adus pe 23 octombrie 2019 .
  2. ^ (EN) Elizabeth Dubrovnik și Claudio Vitari, Investiții în analiza datelor mari și performanța firmelor: o investigație empirică a efectelor directe și mediante în International Journal of Production Research, vol. 56, nr. 15, 3 august 2018, pp. 5206–5221, DOI : 10.1080 / 00207543.2018.1427900 . Adus pe 23 octombrie 2019 .
  3. ^ (EN) Dino Pedreschi, Toți suntem digitali Pollicini , 2012. Accesat la 30 iunie 2017.
  4. ^ Big Data Analytics: proiecte, metodologii și aplicații , pe blog . Osservatori.net .
  5. ^ (EN) Elizabeth Dubrovnik, Big Data technologies: O anchetă empirică privind adoptarea, beneficiile și riscurile lor pentru companii , în Jurnalul internațional de gestionare a informațiilor, vol. 38, nr. 1, 2018-2, pp. 187–195, DOI :10.1016 / j.ijinfomgt.2017.07.008 . Adus pe 23 octombrie 2019 .
  6. ^ a b Big Data îți vorbește. Îi asculți? ( PDF ), EMC Corporation , 2012. Accesat la 17 iulie 2017 .
  7. ^ a b ( EN ) Stephen A. Billings, Identificare neliniară a sistemelor: metode NARMAX în timp, frecvență și domenii spațio-temporale , New York, Wiley, 23 septembrie 2013, ISBN 978-1119943594 .
  8. ^ ( FR ) Pierre Delort, Big data Paris 2013 , pe andsi.fr . Adus la 25 iunie 2017 .
  9. ^ ( FR ) Pierre Delort, Big Data car Low-Density Data? La faible densité en information comme facteur discriminant , pe lecercle.lesechos.fr . Adus la 25 iunie 2017 .
  10. ^ Mario Rasetti și Emanuela Merelli, The Topological Field Theory of Data: un program către o nouă strategie pentru mineritul datelor prin limbajul datelor , în Journal of Physics: Conference Series , vol. 626, Torino, IOP Publishing Ltd, 2015, DOI : 10.1088 / 1742-6596 / 626/1/012005 . Adus la 25 iunie 2017 .

Bibliografie

  • Andrea De Mauro, Big Data Analytics. Analiza și interpretarea datelor cu învățarea automată , ISBN 978-8850334780 , Apogeo, 2019
  • Viktor Mayer-Schonberger, Kenneth Cukier, Big Data: O revoluție care va transforma modul în care trăim, lucrăm și gândim , John Murray Publishers Ltd, 2013; Date mare. O revoluție care ne va transforma modul de viață și ne amenință deja libertatea , Garzanti, 2013, ISBN 978-8811682479
  • Arshdeep Bahga, Vijay Madisetti, Big Data Science & Analytics: A Hands-On Approach , ISBN 978-0996025539 , VPT, 2016
  • Alessandro Rezzani, Big Data Analytics. The Data Scientist's Handbook , ISBN 978-8891621856 , Apogeo Education, 2017

Elemente conexe