Transformarea caracteristicii invariante la scară

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare


Transformarea caracteristicii invariante la scară (sau SIFT ) este un algoritm utilizat în viziunea computerizată care permite detectarea și descrierea caracteristicilor locale sau caracteristicilor din imagini. Algoritmul a fost publicat de David G. Lowe în 1999 . [1]

Aplicațiile includ: recunoașterea obiectelor , cartografierea și navigarea robotică , cusătura imaginilor , modelarea 3D , recunoașterea gesturilor , urmărirea video și mutarea meciurilor .

Algoritmul este brevetat în Statele Unite; proprietarul este Universitatea British Columbia . [2]

Transformarea caracteristicii invariante la scară

Pentru fiecare obiect dintr-o imagine, pot fi extrase câteva puncte interesante pentru a oferi o descriere a caracteristicilor obiectului. Această descriere, preluată dintr-o imagine selectată pentru învățare, poate fi apoi utilizată pentru a identifica obiectul atunci când se încearcă localizarea acestuia într-o imagine de test care conține multe alte obiecte. Pentru o recunoaștere fiabilă, este important ca caracteristicile extrase din imaginea de învățare să fie detectabile chiar și cu schimbări de scară, zgomot și iluminare. Aceste puncte sunt de obicei plasate în regiuni cu contrast ridicat ale imaginii, cum ar fi contururile obiectelor.

O altă caracteristică importantă a acestor caracteristici este că pozițiile lor relative în scena originală nu se schimbă între două imagini corelate. De exemplu, dacă colțurile unei uși sunt luate ca caracteristici, acestea ar trebui să funcționeze indiferent de poziția ușii; pe de altă parte, dacă s-ar lua în considerare și punctele de contur, recunoașterea ar eșua sau nu, în funcție de ușa închisă sau deschisă. În mod similar, caracteristicile situate în obiecte articulate sau flexibile de obicei nu funcționează atunci când are loc o modificare a geometriei lor interne între două imagini din setul procesat. Cu toate acestea, SIFT pentru a reduce contribuția erorilor cauzate de variațiile locale: utilizați un număr mai mare de caracteristici din imagini, astfel încât variațiile locale ale geometriei interne să aibă o pondere mică asupra erorii medii.

Metoda lui Lowe

Metoda lui Lowe [3] poate identifica în mod robust obiecte chiar și în confuzie sau parțial ascunse, deoarece descriptorul caracteristicii SIFT este invariant la scară, orientare, distorsiune afină și parțial invariant sub modificări de iluminare [4] . Această secțiune rezumă metoda Lowe de recunoaștere a obiectelor și introduce câteva tehnici alternative disponibile pentru recunoașterea obiectelor în condiții de confuzie sau ocluzie parțială.

Punctele cheie SIFT ale obiectelor sunt mai întâi extrase dintr-un set de imagini de referință și stocate într-o bază de date. Un obiect este recunoscut într-o nouă imagine prin compararea individuală a fiecărei caracteristici a noii imagini cu cele din baza de date obținută anterior pe baza distanței euclidiene a vectorilor lor de caracteristici. Din setul complet de potriviri, subseturile de puncte cheie sunt identificate în noua imagine care sunt de acord cu obiectul locația, scara și orientarea sa pentru a filtra cele mai bune potriviri. Determinarea clusterelor consistente se face rapid folosind o implementare eficientă a tabelului hash al transformării Hough generalizate. Orice grup de 3 sau mai multe caracteristici concordante pe un obiect și locația acestuia sunt supuse unei verificări detaliate a modelului și, ca urmare, valorile aberante sunt eliminate. În cele din urmă, se calculează probabilitatea ca un anumit set de caracteristici să indice prezența unui obiect, având în vedere acuratețea potrivirii și un număr de posibile potriviri false. Cei care trec toate aceste teste sunt identificați ca fiind corectați cu mare încredere [5] .

Notă

  1. ^ Lowe, David G., Recunoașterea obiectelor din caracteristici invariante la scară locală [ link rupt ] , Proceedings of the International Conference on Computer Vision , vol. 2, 1999, pp. 1150–1157, DOI : 10.1109 / ICCV.1999.790410 .
  2. ^ Brevetul SUA 6.711.293
  3. ^ Brevetul SUA 6.711.293, „Metodă și aparat pentru identificarea caracteristicilor invariante la scară într-o imagine și utilizarea acestora pentru localizarea unui obiect într-o imagine”, brevetul metodei Lowe pentru algoritmul SIFT
  4. ^ Lowe, DG, „Recunoașterea obiectelor din caracteristicile invariante la scară locală”, Conferința internațională privind viziunea computerizată, Corfu, Grecia, septembrie 1999.
  5. ^ Lowe, DG, „Caracteristici ale imaginii distincte din punctele cheie invariante la scară”, International Journal of Computer Vision, 60, 2, pp. 91-110, 2004.

Elemente conexe