Stemming

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Stemming este procesul de reducere a formei flexate a unui cuvânt la forma sa rădăcină, numită „ temă ”. Tema nu corespunde neapărat rădăcinii morfologice ( lemă ) a cuvântului: în mod normal, este suficient ca cuvintele înrudite să fie mapate pe aceeași temă (de exemplu, că „merge”, „a mers”, „a mers” la temă „și”), chiar dacă acesta din urmă nu este o rădăcină validă pentru cuvânt.

Crearea unui algoritm de derulare a fost o problemă veche în informatică . Procesul de derulare este utilizat în motoarele de căutare pentru extinderea interogărilor și alte probleme de procesare a limbajului natural .

Elemente conexe