Date legate

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Datele legate și datele legate, în informatică , sunt un mijloc de publicare a datelor structurate care vă permite să legați datele între ele. Publicarea datelor conectate se bazează pe tehnologii web deschise și standarde precum HTTP , RDF ( Resource Description Framework ) și URI . Scopul acestei structurări a datelor este de a permite computerelor să citească și să interpreteze direct informațiile de pe web. Prezența linkurilor face posibilă extragerea datelor din diverse surse prin interogări semantice. [1]

Când datele legate conectează datele deschise sau data de deschidere, vorbim despre date deschise legate (LOD) [2]

Criterii

Tim Berners-Lee a prezentat date legate la conferința TED din 2009 [3], definind următoarele bune practici de proiectare [4] :

  1. Utilizați URI-uri pentru a identifica obiecte.
  2. Utilizați URI-uri HTTP, astfel încât aceste obiecte să poată fi referite și căutate de către oameni și agenți de utilizator .
  3. Furnizați informații utile despre obiect atunci când URI - ul său este dereferențiat, utilizând formate standard precum RDF .
  4. Includeți linkuri către alte URI-uri legate de datele expuse pentru a îmbunătăți căutarea altor informații conexe de pe web .

Componente

Web semantic

Datele legate sunt esențiale pentru construirea rețelei semantice , cunoscută și sub denumirea de rețea web de date [5] , o extensie a rețelei web curente în care datele sunt descrise semantic prin metadate pentru a face posibilă interogarea și prelucrarea automată a informațiilor din diferite surse .

În web-ul semantic, o ontologie (computerizată) este descrierea formală care permite să reprezinte cunoașterea unui domeniu de cunoaștere. Poate fi văzut ca o structură de date compusă dintr-un set de elemente precum vocabularul și interconectările dintre obiecte [6] . Ontologiile permit interpretarea corectă a informațiilor.

Date deschise legate

Datele deschise conectate (LOD) sunt date legate care sunt eliberate sub o licență Open și, prin urmare, pot fi reutilizate. [7]

DBpedia și Wikidata sunt exemple de proiecte Open Linked Data

În 2010, Tim Berners-Lee a definit schema de 5 stele pentru Linked Open Data [8] :

Disponibil pe web (în orice format) lansat sub o licență deschisă,
★★ Disponibil ca date structurate și procesate automat (de exemplu, tabel Excel în loc de imaginea unui tabel)
★★★ cum ar fi (2), dar cu utilizarea unui format de date neproprietar (de exemplu, CSV sau XML)
★★★★ Toate proprietățile de mai sus, utilizarea formatelor standard W3C (RDF și SPARQL) pentru identificarea obiectelor
★★★★★ Toate proprietățile anterioare. Adăugarea de linkuri către alte seturi de date

Avantajele datelor deschise legate

Unele dintre avantajele Linked Open Data sunt [9] :

  • Utilizarea eficientă a resurselor : datele deschise legate reduc redundanța, permițând reutilizarea.
  • Calitatea informațiilor : Data deschisă legată promovează utilizarea formatelor standard pentru date și metadate, ceea ce face datele mai controlate și mai fiabile.
  • Valoare adăugată : conexiunea dintre date oferă utilizatorului posibilități mai mari de a descoperi și reutiliza informații.
  • Corectarea erorilor : Data deschisă legată vă permite să identificați erorile și să le corectați.
  • Transparență : datele deschise legate sunt un instrument disponibil cetățenilor pentru a accesa datele instituțiilor publice și private.

Conectarea proiectului Open Data

legături între arhive de date deschise conectate

Scopul proiectului W3C Linking Open Data [10] este extinderea Webului prin publicarea mai multor seturi de date deschise, cum ar fi RDF pe Web și prin stabilirea legăturilor RDF între datele din diferite resurse. În octombrie 2007 , seturile de date conțineau mai mult de două miliarde de tripluri RDF, legate de mai mult de două milioane de legături RDF. Din mai 2009, acestea au crescut la 4,2 miliarde de tripluri RDF, conectate prin aproximativ 142 milioane de legături RDF.

Diagramele cloud LODi oferă o prezentare generală a seturilor de date legate disponibile pe web [11] .

Proiectele Uniunii Europene

Există o serie de proiecte UE care implică date legate. Acestea includ proiectul Linked Data 24/7 (LATC) [12] , proiectul PlanetData [13] , proiectul DaPaaS (Data-and-Platform-as-a-Service) și Linked Open Data 2 (LOD2) [ 14] [15] [16] . Conectarea datelor este unul dintre obiectivele principale ale Portalului de date deschise al UE, care oferă mii de seturi de date pe care oricine le poate reutiliza și lega.

Ontologii

Ontologiile sunt descrieri formale ale structurilor de date. Unele dintre cele mai cunoscute ontologii sunt:

  • FOAF - o ontologie care descrie oamenii, proprietățile și relațiile lor
  • UMBEL - o structură ușoară de referință de 20.000 de clase de subiecte și relațiile lor derivate din OpenCyc, care pot acționa ca clase obligatorii la date externe; are, de asemenea, conexiuni cu 1,5 milioane de entități nominalizate de DBpedia și YAGO

Set de date

  • DBpedia - un set de date care conține date extrase din Wikipedia ; conține aproximativ 3,4 milioane de concepte descrise de 1 miliard de triple, inclusiv rezumate în 11 limbi diferite
  • GeoNames - Oferă descrieri RDF a peste 7.500.000 de elemente geografice din întreaga lume.
  • Wikidata : un set de date conectat creat în colaborare, care servește ca un depozit central pentru date structurate din proiectele sale surori ale Fundației Wikimedia
  • Global Research Identifier Database ( GRID ) - o bază de date internațională de 89.506 instituții implicate în cercetări academice, cu 14.401 de relații, modelează două tipuri de relații: o relație părinte-copil care definește o asociație subordonată și o relație conexă care descrie alte asociații [17] [18]

Instanța setului de date și relațiile dintre clase

Sunt disponibile diagrame cu clicuri care arată seturi de date individuale și relațiile lor în cloud LOD generat de DBpedia [19] [20] .

Galerie de imagini

Notă

  1. ^ Christian Bizer, Tom Heath și Tim Berners-Lee , Linked Data - The Story So Far ( PDF ), în International Journal on Semantic Web and Information Systems , vol. 5, nr. 3, 2009, pp. 1–22, DOI : 10.4018 / jswis.2009081901 , ISSN 15526283 ( WC ACNP ) . Adus la 18 decembrie 2010 .
  2. ^ ( RO ) Ce sunt datele legate și datele deschise legate? , pe Ontotext . Adus pe 23 iunie 2020 .
  3. ^ Prezentare Tim Berners-Lee la conferința TED
  4. ^ Probleme de proiectare Tim Berners-Lee
  5. ^ ( RO ) Ce sunt datele legate și datele deschise legate? , pe Ontotext . Adus pe 23 iunie 2020 .
  6. ^ Thomas R. Gruber, Către principii pentru proiectarea ontologiilor utilizate pentru schimbul de cunoștințe? , în Revista Internațională de Studii Umano-Calculatoare , vol. 43, nr. 5-6, 1995-11, pp. 907–928, DOI : 10.1006 / ijhc.1995.1081 . Adus pe 23 iunie 2020 .
  7. ^ (RO) Ce este Data deschisă legată? , pe Portalul funciar . Adus pe 23 iunie 2020 .
  8. ^ (EN) Date deschise de 5 stele pe 5stardata.info. Adus pe 23 iunie 2020 .
  9. ^ (RO) Ce este Data deschisă legată? , pe Portalul funciar , 21 martie 2018. Adus pe 23 iunie 2020 .
  10. ^ Conectarea datelor deschise
  11. ^ LinkedData - W3C Wiki , la www.w3.org . Adus pe 27 iunie 2020 .
  12. ^ Date deschise legate în permanență (LATC) , pe latc-project.eu . Adus la 22 martie 2018 (Arhivat din original la 19 septembrie 2018) .
  13. ^ Bine ați venit la PlanetData! - PlanetData , pe planet-data.eu . Adus la 22 martie 2018 .
  14. ^ DaPaaS , pe project.dapaas.eu . Adus la 22 martie 2018 .
  15. ^ Conectarea datelor deschise 2 (LOD2)
  16. ^ Foaie informativă a proiectului LOD2 - Rezumatul proiectului ( PDF ), pe static.lod2.eu , 1 septembrie 2010. Accesat la 18 decembrie 2010 (arhivat din original la 20 iulie 2011) .
  17. ^ (EN) Statistici GRID , pe grid.ac/stats. Adus la 26 octombrie 2018 .
  18. ^ (EN) Politici GRID pe grid.ac. Adus la 26 octombrie 2018 .
  19. ^ Relații de instanță între seturile de date , la fu-berlin.de . Adus la 22 martie 2018 .
  20. ^ Relații de clasă între seturile de date , la umbel.org . Arhivat din original la 28 august 2011. Adus la 22 martie 2018 .

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității LCCN ( EN ) sh2013002090