WordNet

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
WordNet.PNG

WordNet este o bază de date semantico - lexicală pentru limba engleză dezvoltată de lingvistul George Armitage Miller de la Universitatea Princeton , care își propune să organizeze, să definească și să descrie conceptele exprimate prin cuvinte .

Organizarea lexiconului folosește grupări de termeni cu semnificație afină, numită „ synset ” (din contracția setului de sinonime ), și conexiunea semnificațiilor acestora prin diferite tipuri de relații clar definite. În cadrul seturilor sintetice, diferențele de semnificație sunt numerotate și definite.

Lexiconul este disponibil gratuit online și aceeași metodă a fost aplicată și diferitelor limbi europene din cadrul proiectului EuroWordNet, finanțat de Comunitatea Europeană ( 1996 - 1999 ). Lexicul pentru limba italiană a fost dezvoltat de Institutul de Lingvistică Computațională al CNR din Pisa (spre deosebire de omologul său din care trage ideea, nu poate fi descărcat public).

În 2006, baza de date pentru limba engleză conținea aproximativ 150.000 de cuvinte organizate în peste 115.000 de seturi de syns , dintre care majoritatea sunt conectate la alte synsets prin relații semantice.

WordNet este utilizat în prezent în ramura IT (în special în universități), pentru dezvoltarea sistemelor de dezambiguizare a sensului Word WSD.

Clasificare

Relațiile semantice variază în funcție de tipul de cuvânt și includ:

  • pentru substantive :
    • hiperonimie (hiperonime): Y este un hiperim al lui X dacă fiecare X este „un fel de” Y;
    • hiponimie ( hiponim ): Y este un hiponim al lui X dacă fiecare Y este (un fel de) X;
    • coordonare: Y este un termen coordonat al lui X dacă X și Y au un hipernim în comun;
    • holonimie ( holonim ): Y este un holonim al lui X dacă X face parte din Y;
    • meronymy (meronym): Y este un meronym de X , dacă Y este o parte X;
  • pentru verbe :
    • hiperonimie ( hipernimi ): verbul Y este un hiperonim al verbului X dacă activitatea X este (un fel de) Y (cum ar fi călătoria versus mișcare);
    • troponimie ( troponimii ): verbul Y este un troponim al verbului X dacă în activitatea Y se face și X (cum ar fi murmurarea cu privire la vorbire);
    • implicație ( implicare ): verbul Y este o implicație a verbului X dacă în a face X trebuie neapărat să faci Y (cum ar fi sforăitul cu privire la somn);
    • coordonare: Y este un termen coordonat de X dacă X și Y au un hipernim în comun.
  • Adjectivele sunt clasificate ca:
    • nume relative,
    • similar cu,
    • participii ale verbelor;
  • Adverbele urmează clasificarea adjectivului din care derivă.

Elemente conexe

linkuri externe

Controlul autorității VIAF (EN) 179 937 683 · LCCN (EN) n97120839 · GND (DE) 4392196-6