Gellish

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Gellish este un limbaj natural controlat în care informațiile și cunoștințele pot fi exprimate într-o formă care poate fi interpretată de un computer, dar independent de sistemul utilizat. Gellish este un subset structurat de limbaj natural adecvat pentru reprezentarea informațiilor și cunoștințelor, precum și un succesor al EDI (schimb de date electronice). Din perspectiva modelării datelor, este un model de date generic care include cunoștințe specifice domeniului și semantică.

Din punct de vedere etimologic , „Gellish derivă inițial din„ Limbajul de inginerie generic ”, totuși a fost dezvoltat în continuare într-un limbaj aplicabil chiar și în afara disciplinei de inginerie” (Van Renssen 2006).

Prezentare generală

Gellish a fost conceput pentru exprimarea specificațiilor complete și neechivoce ale produselor, plantelor și proceselor, precum și pentru informații despre achiziționarea acestora, despre fabricarea, instalarea, funcționarea și întreținerea acestora, precum și pentru schimbul de astfel de informații între sisteme, în sistem independent și interpretabil pe computer. Gellish este menit și pentru exprimarea cunoașterii acestor lucruri.

Definiția lui Gellish este furnizată în Dicționarul Gellish, un mare „dicționar inteligent” de concepte și relații între aceste concepte (numit inițial STEPlib). Dicționarul este numit „dicționar inteligent”, deoarece conceptele sunt organizate într-o ierarhie tip-subtip, făcându-l o taxonomie care susține moștenirea proprietății între tipuri și subtipuri. Mai mult, deoarece, împreună cu alte relații între concepte, dicționarul inteligent se extinde într-o ontologie . Gellish are o structură obiect-relație-obiect și, în consecință, include definiția unui număr mare de tipuri de relații standard (peste 650) care determină capacitatea bogată de exprimare semantică a limbajului.

În principiu, pentru fiecare limbaj natural există o variantă Gellish specifică limbii respective. De exemplu, Gellish Dutch (Nederlands Gellish), Gellish German (Gellish Deutsch), Gellish English etc. Gellish nu introduce o terminologie proprie, precum Esperanto, ci folosește termenii proprii limbilor naturale. De exemplu, dicționarul englez Gellish este un dicționar normal extins, cu concepte suplimentare și relații între concepte.

De exemplu, dicționarul Gellish conține definiții ale conceptelor precum „pompă” și „masă” și definiții ale tipurilor de relații. Acest dicționar definește, de exemplu, tipurile de relații care pot fi exprimate cu propoziții standard în engleză Gellish, cum ar fi <este un subtip de> („este un subtip de”), <este clasificat ca un> („este clasificat ca un '), <are ca aspect> (' are ca aspect '), și <este cuantificat ca> (' se măsoară în '). Astfel de tipuri de relații standard și definiții ale conceptelor permit software-ului Gellish să interpreteze corect expresiile Gellish, mai ales atunci când acestea sunt exprimate într-un tabel de baze de date Gellish după cum urmează:

Se termină pe partea stângă Tipul de relație Termen pe partea dreaptă
pompa centrifuga este un subtip de pompa
P-123 este clasificat ca a pompa centrifuga
P-123 are ca aspect masa lui P-123
masa lui P-123 este clasificat ca a masa
masa lui P-123 este calificat ca 50 kg

Full Gellish necesită coloane suplimentare pentru identificatori unici, limbaj de expresie, context de validitate, stare, data creării etc. Gellish Light, pe de altă parte, necesită doar cele trei coloane indicate mai sus și, prin urmare, nu acceptă, de exemplu, distincția dintre omonime, traducerea automată și gestionarea versiunilor, care sunt acceptate de Full Gellish.

Colecția de tipuri de relații standard definește tipurile de fapte care pot fi exprimate în Gellish. Există în principal trei grupuri de tipuri de relații:

  • Tipuri de relații între tipuri de lucruri (clase). Ele sunt destinate exprimării cunoașterii. De exemplu, relația de specializare din primul rând al exemplului anterior,
  • Tipuri pentru relațiile dintre lucruri individuale (indivizi, instanțe de clase). Sunt tipuri dedicate exprimării informațiilor despre lucruri individuale. De exemplu, posesia unui aspect exprimat de relația din a treia linie a exemplului.
  • Tipuri pentru relațiile dintre indivizi și clase. Acestea sunt utile pentru legături între indivizi și concepte generale din dicționar (sau pentru extensii de dicționar privat). De exemplu, relațiile de clasificare și calificare de mai sus.

Oricine poate extinde dicționarul Gellish și tipurile de relații cu concepte auto-definite.

O bază de cunoștințe de bază despre inginerie este integrată în Dicționarul Gellish. Aceste cunoștințe sunt exprimate la rândul lor în Gellish. De obicei, dicționarul Gellish este utilizat pentru a selecta clase pentru o clasificare sau ca terminologie standard ( metadate ) sau pentru a armoniza date în diferite sisteme de calculatoare sau ca instrument într-un motor de căutare.

Gellish folosește un identificator numeric pentru fiecare concept. De exemplu, 130206 (pompă) și 1225 (este clasificat ca a). Acest lucru face ca conceptele să fie identificate independent de limbajul natural. O consecință a acestui fapt este că informațiile și cunoștințele exprimate în Gellish într-o anumită variantă lingvistică pot fi traduse automat și prezentate în orice altă variantă lingvistică pentru care există un dicționar Gellish. De exemplu, un computer poate exprima automat a doua expresie Gellish din exemplul anterior în germană după cum urmează: - P-123 'ist klassifiziert als ein' Zentrifugalpumpe

Modele Gellish

Gellish poate exprima modele de informații, cum ar fi Modele de informații despre facilități și Modele de informații despre clădiri (BIMS), precum și modele de cunoștințe, modele de cerințe, dicționare, taxonomii și ontologii. Fiecare tip de model necesită propria semantică și, prin urmare, propriul său subgrup de tipuri de relații din Dicționarul Gellish.

Baza de date Gellish

Gellish este de obicei exprimat sub forma unei baze de date Gellish care constă din unul sau mai multe tabele. Fiecare tabel din baza de date Gellish constă dintr-un set de coloane standard (sau un subset al celor standard). Fiecare rând dintr-un tabel este potrivit pentru înregistrarea oricărui fapt (principal) exprimat în limba Gellish, precum și pentru stocarea faptelor auxiliare care oferă informații referitoare la faptul principal, cum ar fi limba, statutul, autorul, data creării etc. Coloanele tabelului sunt standardizate, astfel încât proiectarea bazei de date devine inutilă. Tabelele pot fi utilizate ca parte a unei baze de date centrale sau pot constitui o bază de date distribuită, dar o tabelă poate fi schimbată și prin fișier sau ca corp al unui mesaj Gellish.

Nucleul unui tabel Gellish Database este format din trei coloane:

  • un obiect din partea stângă
  • un tip de relație
  • un obiect din partea dreaptă

Când totul are un identificator unic (UID) și cel puțin un nume, nucleul extins al unui tabel devine după cum urmează:

Limba UID obiect stânga Numele obiectului din partea stângă UID finalizat Tipul de relație UID Numele tipului de relație UID obiect dreapta Numele obiectului din partea dreaptă Stat
Engleză 101 Turnul Eiffel 201 5138 este situat în 102 Paris Admis
Engleză 101 Turnul Eiffel 202 1225 este clasificat ca a 40903 turn Admis
Engleză 102 Paris 203 1225 este clasificat ca a 700008 oraș Admis

În exemplul de mai sus, conceptele numite „turn” și „oraș”, precum și tipurile de relații (standard) sunt selectate cu UID-urile lor din Gellish English Dictionary.
Acest lucru permite formularea întrebărilor folosind același limbaj Gellish. Pentru a permite exprimarea interogărilor, limba Gellish include termeni standardizați, cum ar fi ce, care, unde și când. De exemplu, software-ul alimentat de Gellish ar trebui să poată oferi răspunsul corect la întrebare:

 - Ce <este situat în> Paris

Un tabel complet al bazei de date Gellish are coloane suplimentare pentru a exprima fapte auxiliare care susțin de exemplu utilizarea sinonimelor și omonimelor, a mai multor limbi, roluri, contexte de validitate, intenție, unitate de măsură, data ultimei modificări și referință.

Gellish permite, de asemenea, traducerea automată, datorită utilizării UID-urilor independente de limbă. Identificatorii unici sunt baza care permite software-ului Gellish să exprime automat faptele prezentate mai sus în orice altă limbă pentru care este disponibil un dicționar Gellish care utilizează aceleași UID-uri și oferă o traducere a numelor obiectelor, precum și un traducerea obiectelor. tipuri de relații standard, cum ar fi <este localizat în> și <este clasificat ca>>.
Rețineți că această capacitate de traducere automată înseamnă că o interogare / întrebare exprimată într-o anumită limbă, de exemplu engleză, poate fi utilizată pentru a căuta într-o bază de date Gellish într-o altă limbă (de exemplu chineză), în timp ce răspunsul poate fi prezentat în engleză!

Un tabel de baze de date Gellish poate fi implementat în orice format de tabel. De exemplu, poate fi implementat ca bază de date SQL sau altfel, ca fișier STEPfile (conform ISO 10303-21 ) sau ca o simplă foaie de calcul, de exemplu în Excel, cum ar fi Gellish Dictionary în sine.
Tabelele de baze de date Gellish pot fi, de asemenea, descrise într-o formă echivalentă, utilizând RDF / Notation3 sau XML . O reprezentare a „Gellish în XML” este definită într-o schemă XML standard. Este recomandabil să dați unui fișier XML cu date bazate pe această schemă XML extensia de fișier GML, în timp ce GMZ reprezintă „Gellish în format XML zip” (adică în format comprimat).

Una dintre diferențele dintre Gellish și RDF, XML sau OWL este că engleza Gellish include un extins Dicționar englez de concepte, incluzând un set mare (și extensibil) de tipuri de relații standard pentru construirea expresiilor care pot fi interpretate de computere (într-o formă care poate fi citit și pentru profesioniștii care nu sunt IT). Pe de altă parte, „limbaje” precum RDF, XML și OWL definesc doar câteva concepte de bază, ceea ce lasă multă libertate utilizatorilor lor în definirea conceptelor de „limbaj de domeniu”.
Cu toate acestea, această libertate are dezavantajul că utilizatorii de „limbi” precum RDF, XML sau OWL încă nu adoptă un limbaj comun și, în orice caz, nu pot integra date care provin din surse diferite. Gellish este conceput pentru a oferi un limbaj cu adevărat comun, cel puțin într-o măsură mult mai mare, oferind astfel mult mai multă standardizare și comunitate a terminologiei și expresiilor.

Gellish versus OWL

OWL ( Web Ontology Language ) și Gellish sunt ambele concepute pentru a fi utilizate în rețeaua semantică. Cu toate acestea, există diferențe semnificative între cele două limbi. Principalele diferențe sunt următoarele:

1. Destinatari și meta-nivel
OWL este un limbaj metalic care include o gramatică de bază, dar nu are un dicționar. OWL este destinat utilizării de către dezvoltatorii de sisteme informatice și dezvoltatorii de ontologie pentru a-i crea pe aceștia din urmă. Gellish este un limbaj care include o gramatică, un dicționar și o ontologie. Gellish poate fi utilizat atât de dezvoltatorii de sisteme informatice, cât și de utilizatorii finali și poate fi folosit și de dezvoltatorii de ontologie atunci când ontologia Gellish trebuie extinsă. Gellish nu face distincție între un meta-limbaj și un limbaj de utilizator, ci integrează conceptele ambelor „lumi” într-un singur limbaj. Astfel, dicționarul englez Gellish conține concepte echivalente cu conceptele OWL, dar conține și concepte ale unui dicționar comun în limba engleză.

2. Vocabulare și ontologii
OWL poate fi folosit pentru a reprezenta în mod explicit semnificația termenilor din vocabulare și relațiile dintre acești termeni. Cu alte cuvinte: poate fi folosit pentru definirea taxonomiilor sau ontologiilor . Termenii unui anumit vocabular nu devin parte a limbajului OWL. Prin urmare, OWL nu include definiții ale termenilor de limbaj natural, cum ar fi drum, mașină, șurub sau lungime. Cu toate acestea, poate fi folosit pentru a defini și construi o ontologie.
Partea „ontologie superioară” a lui Gellish poate fi de asemenea utilizată pentru a defini termenii și relațiile dintre ei. Cu toate acestea, mulți dintre acești termeni de limbaj natural sunt deja definiți în partea de jos a propriului dicționar Gellish (taxonomie / ontologie). Astfel, termeni precum șosea, mașină, șurub sau lungime fac parte din limbajul Gellish. Prin urmare, engleza Gellish constituie un subset de engleză naturală.

3. Sinonime și funcționalitate multi-limbă
Gellish face distincție între diferite concepte și termeni folosiți ca nume (sinonime, abrevieri și traduceri) pentru a se referi la concepte în diferite contexte și limbi. Fiecare concept este identificat printr-un identificator unic independent de limbajul natural și pot exista un număr de termeni diferiți pentru a indica acel concept în diferite limbi. Aceasta permite traducerea automată între diferite versiuni ale Gellish în limbaj natural. În OWL, diferiții termeni din diferite limbi și sinonime sunt concepte diferite în general, care trebuie declarate egale prin intermediul unor relații explicite de echivalență. Pe de o parte, acesta este un concept simplu, dar face ca traducerea automată să fie mult mai complexă.

4. Ontologie superioară
OWL poate fi considerată ca o „ ontologie superioară formată din 54 de„ constructe de limbaj ”(constructori sau concepte). Partea superioară a ontologiei Gellish constă în prezent din peste 1500 de concepte, dintre care aproximativ 650 sunt tipuri de relații standard. În plus, dicționarul și taxonomia Gellish conțin mai mult de 40.000 de concepte. Acest lucru evidențiază marea bogăție semantică și capacitatea expresivă largă a lui Gellish. În plus, Gellish conține definiții ale multor fapte legate de concepte definite și aceste fapte sunt exprimate ca relații între conceptele în sine.

5. Extensibilitate
OWL are un set fix de concepte (termeni) care este extins numai atunci când standardul OWL în sine este extins. Gellish este extensibil de către orice utilizator.

Istorie

Gellish constituie o dezvoltare ulterioară a standardelor ISO 10303-221 (AP221) și ISO 15926. Completează și extinde conceptele definite în ambele standarde. Un subset al Dicționarului Gellish (STEPlib) este utilizat pentru crearea standardului ISO 15926-4.

Legături externe și referințe

(Pentru o definiție suplimentară a „open source” a se vedea [1] )

  • A. Van Renssen, Gellish: A Generic Extensible Ontological Language , Delft University Press, 2005, ISBN 90-407-2597-7 . O versiune pdf este disponibilă gratuit de la Biblioteca Universității Delft [ link rupt ]
  • Pachetul de documentare SourceForge Gellish conține mai multe documente Gellish, cum ar fi
    • manualul de aplicații Gellish English
    • definiția bazei de date Gellish
    • manualul de extensie Dicționar Gellish.
    • liniile directoare pentru utilizarea Gellish și pentru crearea de cataloage de produse.
    • exemple cu descrieri ale unui drum și a unui sistem de lubrifiere și cunoștințe despre acestea.
  • O implementare a lui Gellish în „Creierul” prezintă, printre altele, activități și obiecte geografice și alte părți ale Dicționarului inteligent al lui Gellish.

Elementul „Creier” include, de asemenea, o bază de cunoștințe în mai multe limbi despre vinuri .

Internet Portal internet : accesați intrările Wikipedia care se ocupă de internet