Lematizarea

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Lematizarea este procesul de reducere a unei forme flexionate a unui cuvânt la forma sa canonică ( nemarcată ), numită lemă . În procesarea limbajului natural , lematizarea este procesul algoritmic care determină automat lema unui cuvânt dat. Procesul poate implica alte activități de procesare a limbajului, cum ar fi analiza morfologică și gramaticală .

În multe limbi, cuvintele apar sub diferite forme flexate. De exemplu, în limba engleză verbul a mers pe jos pot apărea ca mersul pe jos, mers, mersul pe jos și așa mai departe. Forma canonică, mersul pe jos , este lema cuvântului și este forma de referință pentru căutarea cuvântului într-un dicționar . Combinația formei canonice cu partea relativă a vorbirii se numește lexema cuvântului.

Elemente conexe

linkuri externe

Lingvistică Portalul lingvistic : accesați intrările Wikipedia care se ocupă de lingvistică