Acuratețe și recuperare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
În această figură, elementele relevante sunt la stânga liniei drepte, în timp ce elementele găsite se află în interiorul ovalului. Cele două regiuni roșii reprezintă erori. În regiunea roșie din stânga (în afara ovalului) sunt reprezentate elementele relevante care nu au fost recuperate ( falsele negative ), în timp ce în cea din dreapta (în interiorul ovalului) elementele recuperate sunt reprezentate, dar nu sunt relevante ( falsurile pozitive ). Precizia și recuperarea sunt coeficientul zonei regiunii verzi cu, respectiv, ovalul (săgeata orizontală) și regiunea din stânga (săgeata diagonală).

Precizia și recuperarea sau rechemarea (în engleză precision and recall ) sunt două clasificări statistice comune, utilizate în diferite domenii ale cunoașterii, cum ar fi de exemplu. regăsirea informațiilor . Acuratețea poate fi văzută ca o măsură a exactității sau fidelității, în timp ce recuperarea este o măsură a completitudinii .

În Preluarea informațiilor , precizia este definită ca numărul de documente relevante preluate dintr-o căutare împărțit la numărul total de documente preluate din aceeași căutare, iar recuperarea este definită ca numărul de documente relevante preluate dintr-o căutare împărțit la numărul total de documentele relevante existente (care ar fi trebuit recuperate).

Într-un proces de clasificare statistică, precizia pentru o clasă este numărul de pozitivi adevărați (numărul obiectelor etichetate corect ca aparținând clasei) împărțit la numărul total de elemente etichetate ca aparținând clasei (suma pozitivelor adevărate și falsi pozitivi, care sunt obiecte greșit etichetate ca aparținând clasei). Recuperarea în acest context este definită ca numărul de pozitivi adevărați împărțit la numărul total de elemente care aparțin efectiv clasei (de exemplu, suma pozitivelor adevărate și falsele negative, care sunt obiecte care nu au fost etichetate ca aparținând clasei, dar ar trebui să fie).

În recuperarea informațiilor , o valoare de precizie de 1,0 înseamnă că fiecare rezultat preluat dintr-o căutare este relevant, în timp ce o valoare de recuperare de 1,0 înseamnă că toate documentele relevante au fost recuperate din căutare.

Într-un proces de clasificare, o valoare de precizie de 1.0 pentru clasa C înseamnă că fiecare obiect care a fost etichetat ca aparținând clasei C îi aparține cu adevărat (dar nu spune nimic despre numărul de elemente din clasa C care nu au fost etichetate corect) în timp ce o valoare de recuperare de 1.0 înseamnă că fiecare obiect din clasa C a fost etichetat ca aparținând acestuia (dar nu spune nimic despre numărul de elemente etichetate incorect cu C).

Definiție (regăsirea informațiilor)

În regăsirea informațiilor, acuratețea și regăsirea sunt definite în termenii unui set de documente recuperate (lista documentelor returnate de un motor de căutare cu privire la o interogare) și a unui set de documente conexe (lista tuturor documentelor relevante pentru subiectul căutat) ).

Definiție (clasificare)

Într-un proces de clasificare, termenii adevărat pozitiv, adevărat negativ, fals pozitiv și fals negativ sunt folosiți pentru a compara clasificarea unui obiect (eticheta de clasă atribuită obiectului de un clasificator) cu clasificarea corectă dorită (clasa către de care aparține efectiv obiectul).

Acuratețea și recuperarea sunt definite ca:

Interpretare probabilistică

Acuratețea este probabilitatea ca un document recuperat (selectat aleatoriu) să fie relevant. Preluarea este probabilitatea ca un document relevant (selectat aleatoriu) să fie recuperat într-o căutare.

Elemente conexe

Alte proiecte