Problemă inversă

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

O problemă inversă este un context de investigație generic în care se caută informații despre o cantitate fizică, sau mai general pe un sistem, pornind de la măsurători sau informații de tip indirect.

De exemplu, pornind de la măsurători ale câmpului gravitațional într-o anumită zonă a suprafeței pământului ne putem întreba: „datorită măsurătorilor pe care le-am obținut, ce putem spune despre distribuția densității masei în acea zonă?”. Rezolvarea acestei probleme (adică distribuția densității care este cel mai bine de acord cu măsurătorile) este utilă deoarece permite obținerea de informații despre o mărime fizică care nu este direct observabilă. Problemele inverse își au originea în multe ramuri ale științei și matematicii , inclusiv viziunea pe computer , învățarea automată , statistica , inferența statistică , geofizica , imagistica de diagnostic (cum ar fi tomografia axială computerizată și EEG / ERP ), teledetecția , tomografia acustică oceanografică, testarea nedistructivă , astronomia , fizică și multe alte domenii.

Istorie

Domeniul problemelor inverse a fost inițial descoperit și introdus de fizicianul sovieto - armean Viktor Amazaspovič Ambarcumjan . [1] [2]

În timp ce era încă student, Ambartsumian a studiat profund teoria structurii atomice , formarea nivelurilor de energie, ecuația Schrödinger și proprietățile acesteia, iar când a însușit teoria valorii proprii a ecuațiilor diferențiale , a observat analogia aparentă între nivelurile discrete de energie și valori proprii ale ecuațiilor diferențiale. Apoi s-a întrebat: având în vedere o familie de valori proprii, este posibil să găsim forma de ecuații care să aibă aceleași valori proprii? În esență, Ambartsumian a examinat inversul problemei Sturm - Liouville , tratând determinarea ecuațiilor unei șiruri vibrante . Acest articol a fost publicat în 1929 în revista germană de fizică Zeitschrift für Physik și a rămas mult timp în uitare. Descriind această situație după multe decenii, Ambartsumian a spus: „Dacă un astronom publică un articol cu ​​conținut matematic într-un jurnal de fizică, atunci cel mai probabil lucru care se poate întâmpla este că este uitat”.

Cu toate acestea, spre sfârșitul celui de- al doilea război mondial , articolul, scris de Ambartsumian, în vârstă de 20 de ani, a fost găsit de matematicieni suedezi și a constituit punctul de plecare pentru o întreagă zonă de cercetare a problemelor inverse, devenind fundamentul unei întreaga disciplină.

Formulare conceptuală

Soluția unei probleme „inverse” poate fi formulată ca un pasaj conceptual de la datele aflate în posesia noastră la soluția constituită de parametrii unui model al sistemului:

Date → Parametri model

Problema inversă este considerată „inversa” problemei directe. Acesta din urmă corelează parametrii modelului cu datele observate:

Parametrii modelului → Date

Transformarea de la date la parametrii modelului (sau invers) este rezultatul interacțiunii unui sistem fizic (de exemplu un instrument) cu obiectul căruia dorim să deducem proprietățile. Cu alte cuvinte, transformarea este fizica care leagă mărimea fizică (adică parametrii modelului) de datele observate.

Tabelul de mai jos prezintă diferite exemple de sistem fizic, fizica care stă la baza acestuia, cantitatea fizică care ne interesează și tipul de date observate.

Sistemul fizic Descrierea ecuațiilor Cantitate fizica Date observate
Câmpul de gravitație al Pământului Legea gravitației lui Newton Densitate Câmp gravitațional
Câmpul magnetic al Pământului (la suprafață) Ecuațiile lui Maxwell Sensibilitate magnetică Camp magnetic
Undele seismice (de la cutremure) Ecuația undelor Viteza undei (densitatea) Viteza particulelor

Algebra liniară este un instrument util pentru înțelegerea construcției fizice și matematice a problemelor inverse, grație prezenței transformării sau „mapării” de la date la parametrii modelului.

Formularea generală a problemei

Scopul problemei inverse este de a găsi cel mai bun model, , astfel încât (cel puțin aproximativ)

unde este este un operator care descrie relația explicită dintre datele observate, , și parametrii modelului. În diverse contexte, operatorul se numește operator direct , operator de observare sau funcție de observare . Într-un context mai general, G reprezintă ecuațiile care guvernează legătura de la parametrii modelului la datele observate (adică fizica subiacentă).

Problemă liniară inversă

În cazul problemei inverse discrete liniare care descrie un sistem liniar , Și sunt vectori, iar problema poate fi scrisă ca

unde este este o matrice , numită adesea matricea de observare .

Exemple

Câmpul gravitațional al Pământului

Doar câteva sisteme fizice sunt de fapt liniare în raport cu parametrii modelului. În domeniul geofizicii un astfel de sistem este cel al câmpului gravitațional al Pământului. Câmpul gravitațional al Pământului este determinat de distribuția densității care stă la baza suprafeței Pământului. Deoarece litografia Pământului se schimbă semnificativ, putem observa diferențe minuscule în câmpul de gravitație al suprafeței Pământului. Din înțelegerea gravitației ( Legea gravitației a lui Newton ), știm că expresia matematică a gravitației este:

unde este este o măsură a accelerației gravitaționale locale, este constanta gravitațională universală, este masa locală (densitatea) în apropierea suprafeței ed este distanța de la masă la punctul de observare.

Discretizând ecuația anterioară, suntem capabili să legăm datele discrete din observațiile efectuate pe suprafața Pământului cu parametrii discreți (densitate) care stau la baza suprafeței pe care o investigăm. De exemplu, să luăm în considerare cazul în care luăm 5 măsurători pe suprafața pământului. În acest caz, vectorul nostru de date, d, este un vector de coloană (format) de dimensiune (5x1). Știm, de asemenea, că avem o distribuție de cinci mase sub suprafață (o condiție nerealistă, dar utilă pentru demonstrarea conceptului). Astfel, putem construi un sistem liniar care conectează cele cinci mase necunoscute la datele în cinci puncte după cum urmează:

Acum, putem vedea că sistemul are cinci ecuații, , cu cinci necunoscute, . Pentru a rezolva acest lucru obținând parametrii modelului care se potrivesc cu datele noastre, putem inversa matricea obținând direct valorile parametrilor modelului nostru. De exemplu:

Cu toate acestea, nu toate matricile pătrate sunt inversabile ( este de cele mai multe ori neinversibil). Acest lucru se datorează faptului că nu avem garanția de a avea suficiente informații pentru a determina doar soluția unei ecuații date, cu excepția cazului în care avem măsuri independente (adică măsurători, fiecare adăugând informații unice despre sistem). Este important de reținut că pentru multe sisteme fizice nu avem suficiente informații „forțate” către o soluție unică și acest lucru se datorează faptului că sistemul de ecuații nu este „suficient” determinat. În termeni algebrici, matricea este deficitar de rang (adică admite valori proprii nule), deci nu este inversabil. Mai mult, dacă adăugăm observații suplimentare (adică ecuații suplimentare), atunci matricea nu mai rămâne pătrat. Din nou, nu ni se garantează că obținem un rang complet pentru matricea de observare. Prin urmare, multe probleme inverse sunt considerate sub determinate, ceea ce înseamnă că nu avem soluții unice la problema inversă. Dacă avem un sistem complet, atunci soluția noastră poate fi unică. Sistemele nedeterminate (mai multe ecuații decât necunoscute) prezintă alte dificultăți.

Deoarece nu putem inversa direct matricea, vom folosi metode de optimizare pentru a rezolva problema inversă. Pentru a face acest lucru, definim un obiectiv sau mai degrabă o funcție obiectivă. Ținta este o funcționalitate care estimează proximitatea datelor prezise de model față de datele observate. Dacă am avea date perfecte (adică nu sunt afectate de zgomot) și o înțelegere exactă a fenomenului fizic, atunci modelul ar reproduce perfect datele observate. De obicei forma standard a funcției obiective, , Și:

care este norma care definește distanța dintre datele observate și datele reproduse de modelul nostru. Standardul este folosit pentru a estima distanța dintre datele observate și cele reproduse de model, dar pot fi utilizate și alte tipuri de norme. Funcția obiectivă este utilizată cu scopul de a minimiza distanța dintre datele prezise (pe baza modelului) și datele observate.

Pentru a minimiza funcția obiectivă (și, prin urmare, a rezolva problema inversă), gradientul său este calculat într-un mod care este complet analog cu cel al minimizării unei funcții cu o singură variabilă. Gradientul funcției obiective este:

ceea ce simplifică la

care cu un pasaj suplimentar devine

Ecuația în acest mod este pusă în așa-numita formă normală și oferă o soluție formală la problema inversă. Soluția este echivalentă cu cea obișnuită pentru cele mai mici pătrate :

Datele arată de obicei variații intrinseci provenite din zgomot aleatoriu sau, mai rău, coerent. În orice caz, erorile din datele observațiilor introduc erori în parametrii modelului obținuți prin rezolvarea problemei inverse. Pentru a evita aceste erori poate fi necesar să restrângem soluțiile posibile pentru a sublinia anumite caracteristici ale modelului nostru. Acest tip de restricție este cunoscut sub numele de regularizare.

Matematica

Un exemplu cheie al problemei inverse liniare este oferit de ecuația integrală Fredholm de primul tip.

Pentru funcții suficient de regulat ( neted ) operatorul definit mai sus este compact pe spații Banach „rezonabile” precum Spații L p . Chiar dacă harta este injectivă , inversul acesteia nu va fi continuu în general (cu toate acestea, datorită teoremei operatorului invers mărginit, dacă harta este bijectivă, atunci funcția inversă este mărginită, adică continuă). Prin urmare, mici erori în date sunt enorm amplificate în soluție . În acest sens, problema inversă este aceea de a deduce din măsuri este prost condiționat .

Pentru a obține o soluție numerică, integralul trebuie aproximat prin cuadratură , iar datele trebuie să fie eșantionate în formă discretă. Sistemul rezultat de ecuații liniare va fi slab condiționat

Un alt exemplu este inversarea transformatei Radon . În acest caz, o funcție, de exemplu a două variabile, este dedusă dintr-o serie de integrale ale acesteia de-a lungul tuturor direcțiilor posibile ale planului. Aceasta este exact problema rezolvată în reconstrucția imaginii în contextul tomografiei computerizate cu raze X. Deși, din punct de vedere teoretic, multe probleme liniare inverse sunt bine înțelese, problemele care implică transformarea Radon și generalizările sale prezintă încă numeroase provocări teoretice, cu probleme de suficiență a datelor încă nerezolvate. Astfel de probleme includ date incomplete pentru transformarea de raze X în trei dimensiuni și probleme care implică generalizarea transformării de raze X în câmpuri tensoriale.

Un ultim exemplu legat de Ipoteza Riemann a fost dat de Wu și Sprung. Ideea este că în (veche) teorie cuantică semiclasică inversul potențialului în cadrul hamiltonienului este proporțional cu semi-derivatul valorilor proprii (energiile) funcției de densitate numerică n (x).

Problemă neliniară inversă

O familie intrinsec mai dificilă de probleme inverse este aceea a problemelor inverse neliniare.

Problemele inverse neliniare prezintă o relație mai complexă între date și model, reprezentată de ecuația:

În acest caz nu este un operator liniar și nu poate fi separat pentru a reprezenta o mapare liniară a parametrilor modelului pe care îl transformă în date. În căutarea soluției, prima prioritate este de a înțelege structura problemei și de a da un răspuns teoretic la cele trei întrebări ale lui Hadamard (astfel încât problema să fie rezolvată din punct de vedere teoretic). Doar într-o fază ulterioară de studiu se poate face regularizarea și interpretarea dependenței soluției (sau a soluțiilor, în funcție de condițiile de unicitate) de parametri și date / măsurători (probabilistice sau altele).

În timp ce problema inversă liniară a fost complet rezolvată teoretic spre sfârșitul secolului al XIX-lea, doar o clasă de probleme inverse neliniare a fost rezolvată înainte de 1970, cea a dispersiei inverse spectrale (problemă) și inversă (unidimensională), grație seminalului opera școlii matematice rusești ( Kerin , Gelfand , Levitan, Marchenko ). O mare examinare a rezultatelor a fost dată de Chadan și Sabatier în cartea lor „Inverse Problems of Quantum Scattering Theory” (două ediții în engleză și una în rusă).

În acest tip de problemă, datele sunt proprietăți ale spectrului unui operator liniar care descrie împrăștierea. Spectrul este alcătuit din valorile proprii și funcțiile proprii , formând împreună „spectrul discret” și generalizarea acestuia numită „spectru continuu”. Punctul remarcabil din punct de vedere fizic este că experimentele de împrăștiere oferă informații numai pe spectrul continuu și că cunoașterea întregului spectru este atât necesară, cât și suficientă pentru a obține operatorul de împrăștiere. Prin urmare, avem parametri invizibili, ceea ce este mult mai interesant decât cazul problemei liniare inverse în care informația analogă este furnizată de cunoașterea spațiului nul. Mai mult, există domenii fizice în care mișcarea este asociată ca o consecință cu conservarea spectrului operatorului. Acest fenomen este guvernat în evoluția sa de ecuații diferențiale parțiale neliniare speciale, de exemplu ecuația Korteweg - de Vries . Dacă spațiul unui operator este constituit dintr-o singură valoare proprie, atunci mișcarea corespunzătoare este cea a unui singur impuls care se propagă cu o viteză constantă și fără deformare, undă solitară numită „ soliton ”.

Un semnal perfect, generalizarea acestuia pentru ecuația Korteweg - de Vries sau alte ecuații integrale-diferențiale parțiale neliniare sunt de mare interes, cu multe aplicații posibile. Această zonă a fost studiată ca ramură a fizicii matematice din 1970. Problemele inverse neliniare sunt, de asemenea, studiate în prezent în multe domenii ale științei aplicate (acustică, mecanică, împrăștiere electromagnetică - în special sondaje radar, sondaje seismice și aproape toate modalitățile de detectare prin imagini .

Considerații matematice

Problemele inverse sunt de obicei slab condiționate, spre deosebire de problemele bine condiționate tipice în situații de modelare fizică în care sunt cunoscuți parametrii modelului sau proprietățile materiale. Dintre cele trei condiții pentru o problemă bine condiționată sugerată de Jacques Hadamard (existența, unicitatea, stabilitatea soluției sau soluțiilor), condiția stabilității este cea mai des încălcată. În contextul analizei funcționale , problema inversă este reprezentată de o hartă între spații metrice . Deși problemele inverse sunt adesea formulate în spații cu dimensiune infinită, limitările numărului de măsurători și considerarea practică a derivării doar a unui număr finit de parametri necunoscuți, pot duce la o reformulare a problemei în formă discretă. În acest caz, problema va fi de obicei condiționată prost. În aceste cazuri, regularizarea poate fi utilizată pentru a introduce ipoteze mai puțin severe, prevenind supraadaptarea . Multe exemple de probleme inverse regularizate pot fi interpretate ca cazuri speciale de inferență bayesiană .

Reviste academice

Există patru reviste academice majore care se ocupă cu probleme inverse în general.

În plus, există multe reviste despre instrumente de imagistică medicală, teste nedistructive etc. care se ocupă în principal de probleme inverse în domeniile lor de interes.

Notă

Bibliografie

Elemente conexe

linkuri externe

Asociații cu probleme inverse

Controlul autorității NDL ( EN , JA ) 00577248
Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică