CBIR

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

CBIR (în limba engleză Content-Based Image Retrieval Systems) sunt sisteme de recuperare a imaginilor, digitale și fixe, pe baza atributelor vizuale ale conținutului acestor imagini.

Caracteristicile vizuale cele mai utilizate de aceste sisteme se referă la culoare, formă și textură. Aceste atribute sunt extrase și reprezentate automat prin structuri de date numerice, astfel încât nu este necesar să ne exprimăm cercetarea prin intermediul, în loc să folosim, de exemplu, palete de culori, să desenăm sau să selectăm imagini din care sistemul va returna altele care sunt similare din punct de vedere vizual. Cu toate acestea, sistemele CBIR cu caracter mixt combină de obicei aceste opțiuni de consultare cu expresia lingvistică tradițională a ceea ce căutăm.

Istorie

Sistemele CBIR s-au născut în anii 1990, coincizând cu explozia sistemelor multimedia și digitalizarea colecțiilor de imagini disponibile prin Internet și alte medii. Aceste sisteme s-au născut pentru a rezolva limitările care, înainte de explozia producției de imagini digitale, au început să apară în modelul lingvistic (reprezentări textuale ale imaginilor și utilizarea criteriilor de recuperare, inclusiv textuale) aplicate recuperării imaginilor. Deși tehnicile de indexare a textului au punctele lor forte, deoarece cuvintele sunt mai capabile să descrie aproape toate aspectele conținutului unei imagini, procesul de indexare manuală are două dezavantaje principale:

  • Cost ridicat în termeni de timp și bani.
  • Probleme de coerență între indexatorii (umani) și, în cadrul aceluiași indexator, la determinarea temelor.

Noile sisteme automatizate au permis:

  • Pentru a oferi acces la baze de date mari de imagini statice, depășind limitele de timp și costuri care implicau producția umană de informații descriptive pe imagini.
  • Eliminați subiectivitatea din partea indexerului atunci când interpretați imaginea.

Integrarea acestor sisteme duce la automatizarea proceselor pentru rezolvarea problemelor tradiționale și efectuarea unei analize și recuperări cât mai vizate de conținutul total al imaginilor.

SARI

Un SARI este un sistem automat de recuperare a imaginilor. Se compune din instrumente IT, documente și proceduri de consultare care fac posibilă căutarea selectivă a imaginilor fotografice integrate într-un fond documentar.

Sistemele de recuperare a imaginilor utilizează două posibile tehnici de reprezentare și consultare, care pot fi utilizate individual sau în combinație. Aceste tehnici sunt conceptuale și vizuale.

Ca o consecință a acestor două forme de reprezentare și recuperare, avem următoarele variante ale modelelor SARI:

  • (LL) Sisteme de limbaj : utilizați sisteme de gestionare a documentelor cu suport de imagine digitală. Acestea sunt cele mai cunoscute și utilizate pe scară largă.
  • (VV) Sisteme vizuale pure : permit reprezentarea automată a atributelor vizuale ale imaginii și recuperarea pornind de la criteriile în sine. Încearcă să rezolve limitările impuse de modelul lingvistic. Prezintă probleme de recuperare semantică: obiecte, oameni ...
  • (LV) Sisteme de reprezentare lingvistică și recuperare vizuală : Reprezentări textuale ale imaginilor, dar cu posibilitatea recuperării din propriile imagini. Au limitări derivate din sistemele lingvistice.
  • (VL) Sisteme de reprezentare vizuală și recuperare lingvistică : au ca scop depășirea a două limitări importante ale modelelor descrise mai sus. Restricționarea posibilităților expresive ale utilizatorului în consultare, de către sistemele vizuale; și dificultatea de a exprima o parte importantă a semnificației imaginii în timpul procesului de reprezentare prin sisteme lingvistice.
  • Sisteme mixte : acestea integrează diferite modele de recuperare descrise, cele mai frecvente se bazează pe integrarea unui sistem vizual pur cu un sistem lingvistic. Această integrare permite utilizatorului să utilizeze într-un mod combinat, în timpul procesului de recuperare, funcțiile de consultare vizuală și lingvistică.

Sistemele CBIR răspund modelului VV, un sistem pur de recuperare vizuală. Cu toate acestea, ele pot apărea și într-o formă mixtă.

Operațiune

Sistemele CBIR consideră în esență elementele formale intrinseci care caracterizează imaginea, adică nivelul formal sau plastic. Printre elementele grafice formale de natură intrinsecă, care pot fi extrase și analizate prin aceste sisteme se numără culorile, texturile, figurile și relațiile topologice dintre aceste atribute. Analizând aceste atribute, structurile de compoziție a imaginii sunt produse automat. Recuperarea datelor nu este altceva decât un proces de extragere a caracteristicilor vizuale, considerat drept adevăratul conținut al imaginii.

Se pot distinge trei faze ale funcționării sistemelor CBIR:

  • Faza arhivării : caracteristicile intrinseci ale imaginilor sunt analizate automat. Se generează vectori de caracteristici grafice pentru fiecare imagine. Indexul vizual leagă fiecare atribut de imaginea care îl conține.
  • Faza de consultare : utilizatorul specifică una sau mai multe caracteristici vizuale folosind opțiunile disponibile pe interfață:
    • Consultare prin exemple vizuale.
    • Consultare prin imaginea index afișată.
    • Consultare prin intermediul exemplului creat.
    • Utilizarea limbajului vizual.
  • Faza de recuperare : imaginile sunt afișate în ordinea descrescătoare a similarității.

Erori obișnuite în faza de recuperare produse de căutări vagi și inexacte de către utilizator:

  • Inexactitate cu privire la obiectul cercetării.
  • Cunoașterea inexactă a caracteristicilor vizuale.
  • Generalizare excesivă.
  • Erori în reprezentare.
  • Lipsa alinierii între percepția utilizatorului și cea a sistemului.

Tehnici de consultare

Tehnici de întrebare

  • Întrebare de exemplu : sistemul CBIR va baza căutarea pe o imagine de exemplu. Algoritmii de căutare subiacenți pot varia în funcție de utilizare, dar imaginile rezultate ar trebui să aibă puncte comune cu exemplul relevant. Opțiunile pentru furnizarea de exemple de imagini sistemului includ:
    • O imagine preexistentă poate fi administrată de utilizator sau aleasă printr-o metodă arbitrară
    • Utilizatorul desenează o aproximare a imaginii

Această tehnică de interogare elimină dificultățile care pot apărea în descrierea imaginilor cu cuvinte.

  • Recuperare semantică : Sistemul CBIR ideal, din perspectiva utilizatorului, ar implica recuperarea semantică, procesul în care utilizatorul plasează o cerere. Acest tip de operație este foarte dificil de realizat pentru un computer. Sistemele CBIR obișnuite profită în general de caracteristici de nivel inferior, cum ar fi textura, culoarea și forma, deși unele sisteme utilizează caracteristici de nivel superior, cum ar fi recunoașterea feței. Sistemele CBIR nu sunt generice, unele sunt concepute pentru un domeniu specific.
  • Alte metode de întrebare : acestea includ specificarea raporturilor de aspect ale culorilor sau căutarea de imagini care conțin un obiect în imaginea eșantionului. Sistemele CBIR pot conține comentarii referitoare la relevanță, în care utilizatorul rafinează din ce în ce mai mult rezultatele căutării marcându-le ca „relevante”, „nerelevante” sau „neutre” la întrebarea de căutare și apoi repetă căutarea cu noile informații disponibile.

Tehnici de comparare a conținutului

Următoarele puncte descriu metode comune pentru extragerea conținutului imaginii pentru a facilita compararea cu alte imagini. Aceste metode nu sunt specifice niciunei aplicații.

  • Culoare : recuperarea imaginilor pe baza asemănării culorii se obține prin calcularea histogramei de culoare pentru fiecare imagine pentru a identifica proporția pixelilor dintr-o imagine. Această metodă încearcă să segmenteze porțiunea de culoare din regiune și pentru relația spațială dintre diferitele regiuni de culoare. Aceasta este una dintre cele mai utilizate tehnici, deoarece nu depinde de dimensiunea imaginii sau de orientarea acesteia. Căutările de culoare implică în general compararea histogramelor de culoare, deși aceasta nu este singura tehnică utilizată.
  • Textură : Forma texturii caută caracteristici vizuale în imagini și încearcă să găsească modul în care se definește în spațiu. Textura este reprezentată de texeli care sunt plasate în serie în funcție de cât de multe texturi au fost găsite în imagine. Aceste serii nu numai că definesc texturile, ci și unde se află în imagine.
  • Formă : Forma nu se referă la imagine, ci la forma unei anumite regiuni din cadrul imaginii pe care o căutați. Formele sunt adesea determinate prin aplicarea segmentării sau detectării muchiilor unei imagini. În unele cazuri, detectarea formei exacte va necesita intervenția umană, deoarece este foarte dificil să automatizăm pe deplin metode precum segmentarea.

Sisteme de consultare a imaginilor prin exemple

  • QBIC (Interogare după conținut imagine)
    • QBIC Color : sistemul QIBC Color prezintă posibilitatea de a căuta imagini stabilind o proporție a culorilor prezente. Acest lucru poate prezenta complicații atunci când se decide asupra proporțiilor.
    • Aspect QBIC : această metodă mai avansată vă permite să compuneți o schemă de imagine care să fie găsită prin definirea formelor și culorilor. Acest proces presupune indexarea automată a tuturor imaginilor prin analiza formelor și în special a culorilor care apar în ele.
  • SIMPLIcity (Semantics-Sensitive Integrated Machina for Picture) : este capabil să interpreteze imagini pornind de la alte imagini de bază și să creeze o bază de date cu imaginile extrase în urma conținutului lor semantic (texturi, animații, fotografii). Metoda sa este segmentarea imaginii regiunilor bazate pe culoare și textură. Acesta constă dintr-un modul care decide categoria căreia îi aparține căutarea și caracteristicile imaginii depind de această categorie. Este un sistem conceput pentru a măsura similitudinea.
  • FOCUS: Sistem rapid de interogare bazat pe culori (2004) : Acest sistem caută regiuni din imagini. Metoda constă din două faze: prima fază: detectarea vârfurilor din histograma imaginii pentru a le recupera pe cele mai similare, faza a doua: detectarea regiunilor și codarea culorilor fiecărei regiuni pentru a elimina rezultatele fals pozitive ale recuperării fazei unu.
  • BLOBWORLD : Caracteristicile de căutare utilizate de acest sistem sunt culoarea. Textura, poziția spațială și forma regiunilor (blob-uri) din partea de jos a imaginii. Când utilizatorul efectuează căutarea, el selectează mai întâi o categorie care limitează câmpul de căutare. Într-o imagine inițială, utilizatorul selectează o regiune (blob) și indică importanța acelei regiuni. În al doilea rând, utilizatorul indică culoarea regiunii, precum și textura, forma și poziția. Mai multe regiuni pot fi selectate pentru a efectua căutarea.

Aplicații

Există un interes tot mai mare pentru sistemele CBIR datorită limitărilor prezente în sistemele bazate pe metadate, cum ar fi gama largă de utilizări posibile pentru regăsirea eficientă a imaginii.

Necesitatea acestui sistem poate fi rezumată în trei idei:

  • Cantitatea tot mai mare de imagini digitale.
  • Faptul că web - ul este o resursă deschisă.
  • Că motoarele de căutare actuale se bazează pe titlul imaginilor, cu limitarea pe care aceasta o presupune.

Câteva exemple de aplicații:

  • Unii furnizori de software încearcă să gestioneze utilizarea CBIR pe baza piețelor de filtrare și de aplicare a legii, cu scopul de a identifica și cenzura imaginile cu culoarea pielii și forme care ar putea indica prezența nudității cu rezultate controversate.
  • Bazele de date ale muzeelor ​​(picturi, sculpturi etc.) deja prin cercetarea formelor putem găsi imaginea unei opere de artă. Acest tip de consultare este deja disponibil pe unele site-uri web, cum ar fi, de exemplu, Muzeul Hermitage din Sankt Petersburg [1] .
  • Registrul de imagini medicale (radiografii, ultrasunete, mamografii ...) având imagini ale unui pacient care are o anumită patologie , este posibil să accesați un registru de imagini ale altor cazuri la alți pacienți, pentru a găsi, prin conținutul vizual , imaginea aceleiași patologii la un alt pacient și consultați ce tip de tratament este cel mai eficient. Aceste tipuri de sisteme necesită o precizie mare și o rată de eroare scăzută. Exemple de baze de date de imagini medicale în IRMA (Image Retrieval in Medical Applications) [2] .
  • Jurnalul de imagine al poliției. Prin intermediul sistemelor de consultare a imaginilor pentru conținut, este posibil să găsiți fotografia unui suspect în arhivele poliției și să consultați datele sale personale. În aceste cazuri, detectarea trăsăturilor faciale, a ochilor, nasului și gurii se efectuează pentru a efectua o căutare mai eficientă. De asemenea, este utilizat pentru a găsi într-un registru amprentele aparținând suspecților înregistrate de poliție.

Putem spune că importanța tehnicilor CBIR constă în faptul că acestea nu exclud alte metode, ci mai degrabă că pot lucra în sinergie cu formele obișnuite de reprezentare și recuperare a imaginilor. Ele oferă, de asemenea, soluții la problemele paradigmei tradiționale de analiză și regăsire, precum și suscită un nou interes în studiul regăsirii imaginii.

Notă

  1. ^ [1]
  2. ^ Copie arhivată , pe irma-project.org . Adus la 21 decembrie 2008 (arhivat din original la 2 decembrie 2008) .

Bibliografie

  • CBIR: Interacțiune și evaluare , Georgy Gimel, Universitatea din Auckand. [2]
  • Bazele de date pentru multimedia: recuperarea conținutului , Manuel Agustí i Melchor, Jose Miguel Valiente González, Universitatea Politécnică din Valencia. [3]

Elemente conexe