Recunoașterea gesturilor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Recunoașterea gesturilor se referă la un tip de tehnologie computerizată și tehnologie a limbajului care are ca scop interpretarea gesturilor umane prin algoritmi matematici. Gesturile pot proveni din orice poziție sau mișcare a corpului, dar de obicei provin din față sau din mână . În prezent, cercetarea se concentrează pe recunoașterea emoțiilor prin analiza feței și recunoașterea gesturilor mâinilor, utilizând camere de luat vederi și algoritmi de viziune pe computer pentru a interpreta limbajul semnelor . Cu toate acestea, alte probleme legate de tehnicile de recunoaștere a gesturilor sunt identificarea și recunoașterea posturii , mersului, proxemicii și comportamentului uman.

Recunoașterea gesturilor poate fi văzută ca un mijloc folosit de computere pentru a începe să înțeleagă limbajul corpului uman, creând astfel o „legătură” mai puternică între mașini și oameni decât interfețele de utilizator textuale primitive sau chiar GUI ( interfață grafică de utilizator ), care limitează în continuare majoritatea tastaturii și intrări mouse .

Recunoașterea prin gesturi permite oamenilor să interacționeze cu mașina (HMI, vezi 1.4) și să interacționeze într-un mod mai natural, fără dispozitive mecanice. Folosind conceptul de recunoaștere a gesturilor, puteți, de exemplu, să îndreptați degetul spre ecranul computerului și să determinați cursorul să se deplaseze corespunzător. Acest lucru ar putea face ca dispozitivele de intrare tradiționale, cum ar fi șoarecii, tastaturile și ecranele tactile , să fie redundante.

Recunoașterea gesturilor poate fi realizată cu tehnici de viziune computerizată și procesare a imaginilor.

Aplicații

Recunoașterea prin gesturi este utilizată pentru procesarea informațiilor, produse de oameni, care nu sunt transmise prin vorbire sau scriere . De fapt, există mai multe tipuri de gesturi care pot fi identificate de un computer .

  • Recunoașterea limbajului semnelor. La fel cum recunoașterea vorbirii poate transcrie cuvinte în text, unele tipuri de software de recunoaștere a gesturilor pot transcrie simboluri reprezentate prin limbajul semnelor în text.
  • Robotica aplicată asistenței sociale. Folosirea unor senzori corespunzători ( accelerometre și giroscopuri ) aplicate corpului pacientului și citirea valorilor generate de acești senzori poate ajuta la reabilitarea pacientului. Un bun exemplu poate fi reabilitarea accidentului vascular cerebral .
  • Indicații direcționale prin indicare. Arătarea are un scop foarte specific în societatea noastră: să se refere la un obiect sau locație în raport cu locația dvs. Utilizarea recunoașterii gesturilor pentru a determina ce direcție indică o persoană este utilă pentru identificarea contextului declarațiilor sau instrucțiunilor. Această aplicație prezintă un interes deosebit în domeniul roboticii .
  • Controlul prin gesturi faciale. Controlul unui computer prin gesturi faciale este o aplicație utilă de recunoaștere a gesturilor pentru utilizatorii care ar putea să nu poată utiliza fizic mouse-ul sau tastatura. Urmărirea ochilor, în special, poate fi utilă pentru controlul mișcării cursorului sau focalizarea pe elementele de pe un ecran.
  • Interfețe alternative de computer. Configurația tradițională mouse-tastatură pentru interacțiunea cu un computer ar putea fi înlocuită prin recunoașterea gesturilor, care le-ar permite utilizatorilor să efectueze operații obișnuite cu gesturile mâinii sau ale feței, cu doar utilizarea unei camere.
  • Tehnologie imersivă de jocuri. Gesturile pot fi folosite pentru a controla interacțiunile din cadrul jocurilor video pentru a încerca să facă experiența de joc mai realistă și mai captivantă.
  • Controlere virtuale. Pentru sistemele în care actul de a găsi sau de a dobândi un controler fizic poate dura prea mult, gesturile pot fi utilizate ca un mecanism alternativ de control. Câteva exemple ar fi controlul dispozitivelor secundare dintr-o mașină sau un televizor .
  • „Calcul emoțional”. Recunoașterea gesturilor este utilizată în procesul de identificare a expresiilor emoționale utilizând sisteme informatice.
  • Telecomandă. Prin utilizarea recunoașterii gesturilor, este posibil să controlezi de la distanță, prin mișcarea mâinii, diferite dispozitive. Semnalul nu trebuie să indice doar răspunsul dorit, ci și dispozitivul pe care să îl controlați.

Dispozitive de intrare

Abilitatea de a urmări mișcările unei persoane și de a determina ce gesturi ar fi putut fi realizate poate fi realizată prin diferite instrumente. Deși au fost multe cercetări în recunoașterea gesturilor prin procesarea imaginilor / videoclipurilor, există mai multe diferențe între instrumentele și mediile utilizate în diferitele implementări.

  • Camere de recunoaștere a adâncimii. Folosind camere specializate este posibil să se genereze o hartă a adâncimii de la distanță mică a ceea ce este văzut prin cameră și să se utilizeze aceste date pentru a aproxima o reprezentare 3D a ceea ce este văzut. Aceste camere se dovedesc a fi destul de eficiente în detectarea gesturilor mâinilor datorită capacității lor de rază scurtă de acțiune.
  • Camere stereoviziune . Folosind două camere ale căror relații între ele sunt cunoscute, este posibil să se aproximeze o reprezentare 3D a ceea ce este văzut de cele două camere. O referință de poziție, cum ar fi emițătoarele cu infraroșu, poate fi utilizată pentru a obține rapoarte de cameră.
  • Controlere bazate pe gesturi. Aceste controlere pot fi văzute ca o extensie a corpului; atunci când se efectuează anumite gesturi, mișcările lor pot fi ușor surprinse de software . Gesturile mouse-ului sunt un exemplu în acest sens, în care mișcarea mouse-ului este legată de un simbol desenat de mâna unei persoane sau ca telecomanda Wii , care își poate surprinde propriile schimbări de accelerație în timp, generând astfel o reprezentare a gesturilor efectuate. Unul dintre dispozitivele prezentate la CES este Verso One Arhivat la 10 februarie 2019 în Internet Archive ., Un inel care, prin Bluetooth, permite controlarea oricărui dispozitiv prin gesturi. Există mai multe alte proiecte, cum ar fi MYO Arhivat 22 mai 2020 în Arhiva Internet ., Finanțat cu câteva milioane de dolari, dar blocat în prezent.
  • Cameră unică. În situațiile în care, din cauza lipsei de resurse sau a nevoilor de mediu, nu este posibilă utilizarea altor dispozitive, este posibilă utilizarea unei camere normale (sau a camerei web ) pentru recunoașterea gesturilor bazată pe imagini. Deși nu este întotdeauna la fel de eficientă ca recunoașterea prin camerele stereovision sau de profunzime, utilizarea unei singure camere permite o portabilitate și o accesibilitate mai mari pentru un public mai larg.

Evoluții viitoare

Există multe provocări deschise asociate cu acuratețea și utilizabilitatea software-ului de recunoaștere a gesturilor. Pentru recunoașterea gesturilor bazate pe imagini există limitări atât pentru echipamentul utilizat, cât și pentru zgomotul imaginii . Este posibil ca imaginile sau videoclipurile să nu fie în condiții bune de iluminare; obiectele din fundal sau trăsăturile distinctive ale utilizatorilor pot face recunoașterea mai dificilă.

Varietatea implementărilor poate provoca, de asemenea, probleme datorită variabilității tehnologiei utilizate. De exemplu, un algoritm reglat pentru o cameră poate să nu funcționeze pentru o cameră diferită. Cantitatea de zgomot de fond provoacă, de asemenea, dificultăți în urmărire și recunoaștere, mai ales atunci când apar ocluzii (parțiale sau totale). În plus, distanța față de cameră, rezoluția și calitatea acesteia, pot provoca variații ale preciziei recunoașterii. Pentru a surprinde gesturile umane prin intermediul senzorilor vizuali, este necesar să se utilizeze metode robuste de viziune pe computer, de exemplu pentru urmărirea și recunoașterea posturii mâinii sau pentru captarea mișcărilor capului, a expresiilor faciale sau a direcției privirii.

Brațul gorilei

Brațul gorilei ” este un efect secundar al utilizării ecranelor tactile dispuse vertical, ceea ce a dus la o topire a acestei tehnologii ca suport de intrare, în ciuda unui început promițător la începutul anilor 1980. Proiectanții interfețelor tactile nu au luat în considerare faptul că oamenii nu sunt obligați să țină brațele în fața lor mult timp făcând mișcări mici. După câteva atingeri, operatorul începe să simtă brațul dureros și dureros, incapabil să-și continue sarcina.

Brațul gorilei este o problemă care nu apare în utilizări specializate pe termen scurt (utilizarea bancomatelor, biletarea electronică în gări ...), deoarece implică doar interacțiuni scurte care nu durează suficient pentru a provoca acest inconvenient.

Bibliografie

  • Matthias Rehm, Nikolaus Bee, Elisabeth André, „Wave Like a Egyptian - Accelerometer Based

Recunoașterea gesturilor pentru interacțiuni specifice culturii ", British Computer Society, 2007.

  • Ying Wu și Thomas S. Huang, „Recunoaștere gestuală bazată pe viziune: o recenzie”, în: Gesture-

Comunicarea bazată în interacțiunea om-computer, volumul 1739 din Springer Lecture Notes in Computer Science, paginile 103-115, 1999, ISBN 978-3-540-66935-7 , doi 10.1007 / 3-540-46616-9.

  • Thad Starner, Alex Pentland, „Recunoașterea vizuală a limbajului semnelor americane folosind ascuns

Markov Models ", Institutul de Tehnologie din Massachusetts.

  • Kai Nickel, Rainer Stiefelhagen, „Recunoașterea vizuală a gesturilor de indicare pentru om-robot

interacțiune , Calculul imaginii și viziunii, vol. 25, numărul 12, decembrie 2007, pp. 1875–1884.

  • Lars Bretzner și Tony Lindeberg „Folosește-ți mâna ca un mouse 3D ...”, Proc. European 5

Conferință privind viziunea computerizată (H. Burkhardt și B. Neumann, eds.), Vol. 1406 din Lecture Notes in Computer Science, (Freiburg, Germania), pp. 141-157, Springer Verlag, Berlin, iunie 1998.

  • Lars Bretzner, Ivan Laptev, Tony Lindeberg, Sören Lenman, Yngve Sundblad "A Prototype

System for Computer Vision Based Computer Computer Interaction ", Raport tehnic CVAP251, ISRN KTH NA / P 01 / 09 SE. Departamentul de analiză numerică și informatică, KTH (Royal Institute of Technology), SE-100 44 Stockholm, Suedia, 23-25 ​​aprilie 2001.

  • Per Malmestig, So Sund Sundberg, SignWiiver - implementarea tehnologiei limbajului semnelor.
  • AiLive Inc., Cartea albă LiveMove, 2006.
  • Ivan Laptev și Tony Lindeberg "Urmărirea modelelor manuale cu mai multe stări folosind filtrarea particulelor

and a Hierarchy of Multi-scale Image Features ", Proceedings Scale-Space and Morphology in Computer Vision, Volumul 2106 din Springer Lecture Notes in Computer Science, paginile 63–74, Vancouver, BC, 1999. ISBN 978-3-540-42317 -1 , doi 10.1007 / 3-540-47778-0.

  • Christian von Hardenberg și François Bérard, „Interacțiunea om-computer cu mâna goală”, ACM

Seria de proceduri internaționale a conferinței; Arhiva Vol. 15 Lucrări ale atelierului din 2001 privind interfețele de utilizator perceptive, Orlando, Florida, Pagini: 1 - 8, 2001.

  • M. Kolsch și M. Turk "Urmărirea rapidă a mâinilor 2D cu grupe de caracteristici și integrare multi-tac",

CVPRW '04. Proceedings Computer Vision and Pattern Recognition Workshop, 27 mai-2 iunie 2004, doi 10.1109 / CVPR. 2004.71.

  • A Erol, G Bebis, M Nicolescu, RD Boyle, X Twombly, „Estimarea bazată pe viziunea mâinii:

A review ", Computer Vision and Image Understanding Volume 108, Issues 1-2, October-November 2007, Pages 52–73 Special Issue on Vision for Human-Computer Interaction, doi: 10.1016 / j.cviu.2006.10.012.

  • Marco Infussi, „Cine: interfețe creative”, ed. ltd.