Date lizibile de mașină

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Datele care pot fi citite automat sunt date (sau metadate ) afișate într-un format care le face interpretabile de către un computer .

Pe de o parte, există date care pot fi interpretate de oameni și care sunt procesate și de computere, în special prin intermediul markerilor sau expresiilor codificate, cum ar fi microformatele sau extensiile RDFa . Pe de altă parte, există formate de fișiere de date destinate în mod expres procesate de computere, cum ar fi RDF , XML , JSON .

Citirea mașinii nu este sinonimă cu accesul digital . Un document poate fi accesibil digital online, ceea ce facilitează accesul oamenilor prin intermediul computerelor; cu toate acestea, dacă datele conținute în document nu pot fi citite automat, va fi mult mai dificil să folosiți un computer pentru a-l extrage, transforma și procesa. [1] Pentru a clarifica această distincție, gândiți-vă, de exemplu, la un document PDF , care este accesibil digital, cu toate acestea informațiile conținute în acesta sunt greu de citit automat.

Office of Management and Budget (OMB) al SUA definește expresia anglo-saxonă echivalentă „Date lizibile de mașină” după cum urmează: „Format într-o limbă standard pentru computer (nu text în limba engleză) care poate fi citită automat de un browser web sau de un sistem informatic . (De exemplu, xml). Documentele tradiționale de procesare a textului, limbajul de marcare hipertext (HTML) și fișierele în format de document portabil (PDF) sunt ușor de citit de oameni, dar de obicei sunt greu de interpretat de mașini. Alte formate, cum ar fi limbajul de marcare extensibil (XML) , (JSON) sau foi de calcul cu coloane de antet care pot fi exportate ca valori separate prin virgulă (CSV) sunt formate care pot fi citite automat. Este posibil ca documentele tradiționale de procesare a textelor și alte formate să fie citite automat, dar documentele trebuie să includă elemente structurale îmbunătățite . " [2]

Publicarea datelor din sectorul public într-un mod deschis , standard și citibil de mașină este o practică încurajată în temeiul legislației europene privind informațiile din sectorul public .

Notă

  1. ^ A Primer on Machine Readability for Online Documents and Data , on Data.gov , 24 septembrie 2012. Accesat la 27 februarie 2015 .
  2. ^ Circulara OMB A-11, Partea 6 Arhivat 7 decembrie 2013 la Internet Archive ., Pregătirea și depunerea planurilor strategice, a planurilor anuale de performanță și a rapoartelor anuale de performanță ale programului

Elemente conexe