SLAM (robotică)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În geometria computațională și robotică, localizarea și cartarea simultană ( Localizare și cartare simultană, SLAM) este problema de calcul a construcției sau actualizării unei hărți a unui mediu necunoscut, ținând în același timp evidența poziției unui agent în interiorul său. Deși inițial pare a fi o problemă cu ouă și pui , sunt cunoscuți mai mulți algoritmi care o rezolvă, cel puțin aproximativ, în perioade de timp gestionabile pentru anumite medii. Metodele populare de soluții brute includ Filtrul de particule, Filtrul Kalman extins, Intersecția Covarianței și GraphSLAM. Algoritmii SLAM sunt utilizați în navigație, cartografiere robotică și odometrie pentru realitate virtuală sau realitate augmentată. Algoritmii SLAM sunt adaptați la resursele disponibile, deci nu vizează perfecțiunea, ci conformitatea operațională. Abordările publicate sunt utilizate în mașinile cu conducere automată, vehiculele aeriene fără pilot, vehiculele subacvatice autonome, rover-urile planetare, noii roboți de acasă și chiar în corpul uman.

Descrierea matematică a problemei

Având în vedere o serie de controale u t și observațiile senzorilor o t asupra discrete faze de timp t, problema SLAM este de a calcula o estimare a stării agentului x t și o hartă a mediului m t. Toate cantitățile sunt, în general, probabilistice, așa că scopul este de a calcula: P (m t + 1 , x t + 1 | o 1: t + 1 , u 1: t ) . Aplicarea regulii lui Bayes oferă un cadru pentru actualizarea secvențială a pozițiilor posterioare, având în vedere o hartă și o funcție de tranziție P (x t | x t-1 ) .

Algoritmi

Tehnicile statistice utilizate pentru aproximarea ecuațiilor de mai sus includ filtre Kalman și filtre de particule (cunoscute și ca metode Monte Carlo). Acestea oferă o estimare a funcției de probabilitate posterioară pentru poziția robotului și parametrii hărții. Metodele care aproximează în mod conservator modelul de mai sus folosind intersecția de covarianță sunt capabile să evite să se bazeze pe ipoteze de independență statistică pentru a reduce complexitatea algoritmică pentru aplicații pe scară largă. Alte metode de aproximare permit o eficiență de calcul mai bună utilizând reprezentări simple ale incertitudinii regiunii delimitate. Tehnicile de apartenență la grup se bazează în principal pe propagarea constrângerilor de interval. Acestea oferă un set care cuprinde poziția robotului și o aproximare a hărții. Reglarea pachetelor și, în general, estimarea maximă a posteriori ( MAP ), este o altă tehnică populară pentru SLAM care utilizează date de imagine, care estimează împreună pozițiile și pozițiile punctelor de referință, sporind fidelitatea hărții și este utilizată în SLAM sisteme comercializate ca Google ARCore care au înlocuit proiectul anterior de realitate augmentată „ Tango ”. Estimatorii MAP calculează cea mai probabilă explicație a pozițiilor robotului și mapează datele din datele senzorului, mai degrabă decât să încerce să estimeze întreaga probabilitate a posteriori. Noii algoritmi SLAM rămân un domeniu activ de cercetare și sunt adesea conduși de diferite cerințe și ipoteze cu privire la tipurile de hărți, senzori și modele descrise mai jos. Multe sisteme SLAM pot fi privite ca combinații de opțiuni din fiecare dintre aceste aspecte.

Cartografiere

Hărțile topologice sunt o metodă de reprezentare a mediului care captează conectivitatea (adică topologia) mediului, mai degrabă decât crearea unei hărți geometrice precise. Abordările topologice SLAM au fost utilizate pentru a consolida consistența generală în algoritmii SLAM metrici. În contrast, hărțile de grilă folosesc tablouri (de obicei pătrate sau hexagonale) de celule discretizate pentru a reprezenta o lume topologică și pentru a face inferențe despre ce celule sunt ocupate. Celulele sunt de obicei presupuse a fi statistic independente pentru a simplifica calculul. În această ipoteză, P (m t | x t , m t-1 , o t ) este setat la 1 dacă celulele noii hărți sunt în concordanță cu observația o t în poziția x t și 0 dacă este inconsecventă. Autovehiculele moderne cu conducere automată simplifică aproape complet problema cartografierii prin utilizarea pe scară largă a datelor de hartă extrem de detaliate colectate în avans. Aceasta poate include adnotări pe hartă până la nivelul marcării pozițiilor segmentelor de linie albă și ale bordurilor pe drum. Datele vizuale etichetate în funcție de locație, cum ar fi Google StreetView, pot fi, de asemenea, utilizate ca parte a hărților. În esență, astfel de sisteme simplifică problema SLAM într-o sarcină mai simplă doar pentru locație, permițându-vă poate să mutați obiecte precum autoturisme și persoane doar pentru a fi actualizate pe hartă în timpul rulării.

Senzori

SLAM va folosi întotdeauna diferite tipuri de senzori, iar puterile și limitele diferitelor tipuri de senzori au fost unul dintre principalii factori ai noilor algoritmi. Independența statistică este cerința obligatorie pentru a face față părtinirii metrice și a zgomotului în măsurători. Diferite tipuri de senzori dau naștere la algoritmi SLAM diferiți ale căror presupuneri sunt mai potrivite pentru senzori. La o extremă, scanările laser sau caracteristicile vizuale oferă detalii despre multe puncte dintr-o zonă, uneori redarea inferenței SLAM nu este necesară deoarece formele din acești nori de puncte pot fi aliniate ușor și eficient. La cealaltă extremă, senzorii tactili sunt extrem de puțini, deoarece conțin doar informații despre puncte foarte apropiate de agent, deci necesită modele anterioare puternice pentru a compensa în SLAM pur tactil. Majoritatea activităților practice SLAM se situează undeva între aceste extreme vizuale și tactile. Modelele senzorilor sunt în general împărțite în abordări bazate pe date istorice și date brute. Reperele sunt obiecte identificabile în mod unic în lume a căror locație poate fi estimată de un senzor, cum ar fi punctele de acces Wi-Fi sau balizele. Abordările de date brute nu presupun că punctele de referință pot fi identificate și, în schimb, modelează P (sau t | x t ) direct în funcție de locație. Senzorii optici pot fi telemetre laser unidimensionale (cu fascicul unic) sau 2D ( măturat ), LiDAR 3D de înaltă definiție, LIDAR cu bliț 3D, senzori de sonar 2D sau 3D și una sau mai multe camere 2D. Din 2005, au existat cercetări intense privind VSLAM (SLAM vizual) folosind în primul rând senzori vizuali (cameră), datorită omniprezenței în creștere a camerelor, cum ar fi cele de pe dispozitivele mobile. Senzorii vizuali și LIDAR sunt suficient de informativi pentru a permite extragerea reperelor în multe cazuri. Alte forme recente de SLAM includ SLAM haptic (numai prin detectare prin atingere locală), radar SLAM, SLAM acustic și WiFi SLAM (detectare bazată pe puterea punctelor de acces WiFi din apropiere). Abordările recente aplică gama wireless aproape optică pentru multi-laterale (RTLS) sau multi-unghi în combinație cu SLAM ca tribut pentru măsurători wireless neregulate. Un fel de SLAM pentru pietonii umani utilizează o unitate de măsurare inerțială montată pe pantof ca senzor primar și se bazează pe pietonii care pot evita pereții pentru a construi automat planurile de construcție dintr-un sistem de poziționare intern. Pentru unele aplicații în aer liber, necesitatea SLAM a fost aproape complet eliminată datorită senzorilor diferențiali GPS de înaltă precizie. Din perspectiva SLAM, aceștia pot fi priviți ca senzori de poziție ale căror probabilități sunt atât de clare încât domină complet inferența. Cu toate acestea, senzorii GPS pot degrada performanța cu totul sau ocazional, în special în perioadele de conflict militar care prezintă un interes deosebit pentru unele aplicații robotizate.

Modelare cinematică

Termenul P (x t | x t-1 ) reprezintă cinematica modelului, care include de obicei informații despre comenzile de acțiune date unui robot. Ca parte a modelului, cinematica robotului este inclusă pentru a îmbunătăți estimările de detectare în condiții de zgomot intrinsec și de mediu. Modelul dinamic echilibrează contribuțiile diferiților senzori, diferite modele de eroare parțială și include în cele din urmă o reprezentare virtuală clară, cum ar fi o hartă cu poziția și direcția robotului ca nor de probabilitate . Cartarea este reprezentarea finală a acelui model, harta este fie acea reprezentare, fie termenul abstract pentru model. Pentru roboții 2D, cinematica este de obicei dată de un amestec de comenzi de rotație și „avansare”, care sunt implementate cu motor suplimentar și zgomot. Din păcate, distribuția formată de zgomotul independent în direcții unghiulare și liniare nu este gaussiană, dar este adesea aproximată de un gaussian. O abordare alternativă este de a ignora termenul de cinematică și de a citi datele de odometrie de pe roțile robotului după fiecare comandă: aceste date pot fi apoi tratate mai degrabă ca unul dintre senzori decât ca cinematică.

SLAM acustic

O extensie a problemei comune SLAM a fost aplicată domeniului acustic, unde mediile sunt reprezentate de poziția tridimensională (3D) a surselor sonore determinate. Implementările timpurii ale acestei tehnici au folosit estimări ale direcției de sosire ( DoA ) ale poziției sursei sonore și se bazează pe tehnici majore de localizare a sunetului pentru a determina pozițiile sursei. Un observator sau robot trebuie să fie echipat cu o serie de microfoane pentru a permite utilizarea Acoustic SLAM, astfel încât caracteristicile DoA să fie estimate în mod corespunzător. Acoustic SLAM a pus bazele unor studii suplimentare privind cartarea acustică a scenei și poate juca un rol important în interacțiunea om-robot prin vorbire. Pentru a mapa surse de sunet multiple și ocazional intermitente, un sistem Acoustic SLAM folosește fundamentele teoriei setului finit aleatoriu pentru a gestiona prezența variabilă a punctelor de referință acustice. Cu toate acestea, natura caracteristicilor derivate din acustică face ca Acoustic SLAM să fie susceptibil la reverberare, inactivitate și probleme de zgomot într-o cameră.

Audiovizual SLAM

Conceput inițial pentru interacțiunea om-robot, Audio-Visual SLAM este un cadru care oferă fuziunea caracteristicilor distinctive realizate atât de modalitățile acustice, cât și de cele vizuale într-un mediu. Interacțiunea umană se caracterizează prin caracteristici percepute nu numai în modul vizual, ci și în cel acustic; ca atare, algoritmii SLAM orientați spre robot și mașină trebuie să ia în considerare ambele seturi de caracteristici. Un cadru audiovizual estimează și mapează pozițiile reperelor umane prin utilizarea unor caracteristici vizuale, cum ar fi poza umană și caracteristici audio, cum ar fi vorbirea umană și combină convingerile pentru o hartă mai robustă a mediului. Pentru aplicații în robotica mobilă (de exemplu, drone, roboți de serviciu), este util să se utilizeze echipamente ușoare și cu putere redusă, cum ar fi camere monoculare sau tablouri de microfoane microelectronice. Audiovizualul SLAM poate permite, de asemenea, funcționarea complementară a acestor senzori, compensând câmpul vizual restrâns, ocluziile caracteristice și degradările optice comune senzorilor vizuali ușori cu câmpul vizual complet și reprezentări de caracteristici neobstrucționate inerente senzorilor audio. Sensibilitatea senzorilor audio la reverberație, inactivitatea sursei de sunet și zgomot poate fi, de asemenea, compensată prin îmbinarea convingerilor de bază ale modului vizual. Funcția complementară dintre modurile audio și vizuale într-un mediu se poate dovedi neprețuită pentru crearea roboticii și a mașinilor care interacționează pe deplin cu vorbirea și mișcarea umană.

SLAM colaborativ

SLAM colaborativ combină imagini de la mai mulți roboți sau utilizatori pentru a genera hărți 3D.

Obiecte în mișcare

Mediile nestatice, precum cele care conțin alte vehicule sau pietoni, continuă să prezinte provocări de cercetare. SLAM cu DATMO este un model care urmărește obiectele în mișcare într-un mod similar cu agentul în sine.

Închidere buclă

Închiderea buclelor este problema recunoașterii unui loc vizitat anterior și a actualizării convingerilor în consecință. Aceasta poate fi o problemă, deoarece erorile de model sau algoritm pot atribui o prioritate redusă locației. Metodele tipice de închidere a buclei aplică un al doilea algoritm pentru a calcula un anumit tip de similitudine de măsurare a senzorului și a reseta prioritățile de poziție atunci când se găsește o potrivire. De exemplu, acest lucru se poate face prin stocarea și compararea vectorilor saci de cuvinte cu caracteristicile SIFT din fiecare locație vizitată anterior.

Explorare

Active SLAM ” studiază problema combinată a SLAM cu decizia unde să se mute pentru a construi harta în cel mai eficient mod posibil. Necesitatea explorării active este deosebit de pronunțată în regimurile de detectare dispersate, cum ar fi SLAM tactil. SLAM activ se realizează în general prin aproximarea entropiei hărții sub acțiuni ipotetice. „ Multi agent SLAM ” extinde această problemă la cazul mai multor roboți care se coordonează pentru a explora în mod optim.

Inspirație biologică

În neuroștiințe, hipocampul pare să fie implicat în calcule de tip SLAM, dând naștere la poziționarea celulelor și formează baza pentru sistemele SLAM bio-inspirate, cum ar fi RatSLAM.

Implementări

Diverse algoritmi SLAM sunt implementate în bibliotecile de sistem de operare robot open source (ROS), utilizate adesea împreună cu harta 3D OpenCV sau biblioteca de cloud punct vizual de caracteristici.

Istorie

O lucrare cheie în SLAM este cercetarea RC Smith și P. Cheeseman privind reprezentarea și estimarea incertitudinii spațiale în 1986. Alte lucrări de pionierat în acest domeniu au fost efectuate de grupul de cercetare Hugh F. Durrant-Whyte la începutul anilor 1990: a arătat că soluțiile pentru SLAM există în limita infinită de date. Această descoperire motivează căutarea algoritmilor care pot fi calculați prin calcul și care aproximează soluția. Mașinile cu conducere automată STANLEY și JUNIOR, conduse de Sebastian Thrun, au câștigat DARPA Grand Challenge și au ocupat locul al doilea în DARPA Urban Challenge în anii 2000 și au inclus sistemele SLAM, aducând SLAM în atenția lumii. Implementările SLAM pe piață în masă pot fi găsite acum în aspiratoarele robotizate de consum.

Elemente conexe

linkuri externe

Inginerie Portal de inginerie : accesați intrările Wikipedia care se ocupă de inginerie