Indicele KWIC

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Un index KWIC (acronim pentru KeyWord In Context , „cuvânt cheie în context” în engleză) este o listă redundantă de fraze care sunt utilizate pentru a constitui un index al unui corp de cunoștințe, adică o listă care facilitează accesul la conținutul corpul menționat anterior. Acești indici au fost folosiți suficient de mult pentru a compila cataloage de biblioteci ; unele indexuri de cărți se apropie de indexurile KWIC. Termenul index KWIC a fost introdus atunci când se produc astfel de indici cu computerul și în acest context termenul nostru se opune indicelui KWOC , unde KWOC înseamnă KeyWord Out of Context .

Să luăm în considerare un termen util pentru un index, de ex. fraza

Lista poligoanelor, poliedrelor și politopilor.

Alături de acesta, pot fi utile variantele obținute prin supunerea acestuia la permutări circulare , limitate la cele care încep cu cuvinte care sunt semnificative pentru cei care vor folosi indexul. În cazul luat ca exemplu, permutările circulare sunt interesante

poligoane, poliedre și politopi. * Lista de
poliedre și politopi. * Lista poligoanelor,
politopi. * Lista poligoanelor, poliedrelor și

De fapt, termenul examinat este folosit pentru a desemna un document care servește pentru a descrie o parte specifică a unui corp de cunoștințe: în acest caz, termenul este titlul unei ipotetice pagini Wikipedia care are sarcina de a facilita viziunea unei părți a cunoștințelor referitoare la disciplina „matematică”, corp care face parte din enciclopedia noastră. De asemenea, se întâmplă ca cuvintele „poligoane”, „poliedre” și „politopi” să fie în mod clar semnificative pentru mulți dintre oamenii care doresc să afle despre matematică consultând Wikipedia.

Pe de altă parte, permutarea nu este semnificativă

de poligoane, poliedre și politopi. * Listă

deoarece cuvântul „di” are un rol funcțional generic în multe propoziții ale limbii italiene și nu are conotații matematice.

Un index KWIC ar putea prezenta într-o ordine alfabetică toate permutațiile circulare începând cu cuvinte semnificative ale frazelor sale. Prin urmare, ar exista concedieri: s-ar putea avea un indice de 2-5 ori mai mare decât lista de fraze. Cu toate acestea, un index KWIC prezintă cuvinte semnificative în evidență și în ordine alfabetică și, prin urmare, poate fi căutat mai eficient.

În timp ce în bibliotecile pre-electronice indicii KWIC erau grei de construit și greoi, indicii KWIC pot fi construiți automat sau semi-automat în bazele de cunoștințe digitale, iar extinderea indicilor are costuri neglijabile. Cu toate acestea, generarea de indici KWIC prin intermediul unor proceduri pune diverse probleme, în special cea a ambiguității cuvintelor componente ale frazelor și cea a evaluării nivelului lor de semnificație pe baza previziunilor asupra posibililor utilizatori ai indexului în sine.