Inferența bayesiană

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Inferența bayesiană este o abordare a inferenței statistice în care probabilitățile nu sunt interpretate ca frecvențe, proporții sau concepte similare, ci mai degrabă ca niveluri de încredere în apariția unui eveniment dat. Numele derivă din teorema lui Bayes , care stă la baza acestei abordări.

La rândul său, teorema lui Bayes poartă numele reverendului Thomas Bayes . Cu toate acestea, nu este clar dacă Bayes însuși ar subscrie la interpretarea teoriei probabilității pe care o numim acum bayesiană .

Principiile și instrumentele abordării bayesiene

Dovezi empirice și metodă științifică

Statisticienii bayesieni susțin că metodele de inferență bayesiană reprezintă o formalizare a metodei științifice , care implică în mod normal colectarea de date ( dovezi empirice ), care coroborează sau infirmă o ipoteză dată. În acest sens, nu puteți fi niciodată sigur cu privire la o ipoteză , dar pe măsură ce disponibilitatea datelor crește, gradul de încredere se schimbă; cu suficiente dovezi empirice, va deveni foarte mare (de exemplu, tindând la 1) sau foarte scăzută (tindând la 0).

Soarele a răsărit și a apus de miliarde de ani. Soarele a apus din nou în seara asta. Cu o probabilitate mare, soarele va răsări mâine.

Acest exemplu este preluat dintr-un bine-cunoscut argument al lui Pierre Simon Laplace , care pare să fi ajuns independent la rezultatul teoremei lui Bayes .

Statisticienii bayesieni susțin, de asemenea, că inferența bayesiană este cea mai logică bază pentru discriminarea dintre ipoteze alternative / conflictuale. Prin această abordare, se utilizează o estimare a gradului de încredere într-o anumită ipoteză înainte de a observa datele, pentru a asocia o valoare numerică cu gradul de încredere în aceeași ipoteză după observarea datelor. Întrucât se bazează pe niveluri subiective de încredere, pe de altă parte, inferența bayesiană nu este complet reductibilă la conceptul de inducție ; vezi și metoda științifică .

Teorema lui Bayes

În termeni mai simpli, teorema lui Bayes oferă o metodă de modificare a nivelului de încredere într-o ipoteză dată în lumina noilor informații. Denotând cu ipoteza nulă și cu datele empirice observate, teorema lui Bayes poate fi afirmată ca:

Lăsând deoparte originea ipotezei nule (care ar fi putut fi formulată ab initio sau dedusă din observațiile anterioare), ea trebuie în orice caz formulată înainte de observație . În terminologia statisticilor bayesiene , în plus:

  • se numește probabilitate a priori a ;
  • se numește funcția de probabilitate și se bazează pe inferența clasică sau frecventistă ;
  • probabilitatea de observare se numește probabilitate marginală , fără informații anterioare; este o constantă de normalizare;
  • se numește probabilitatea posterioară a , dat .

Factorul de scară poate fi interpretat ca o măsură a impactului acelei observații are asupra gradului de încredere al cercetătorului în ipoteza nulă , reprezentată la rândul ei de probabilitatea a priori ; dacă este foarte puțin probabil ca asta să fie respectat, cu excepția cazului în care nu este chiar adevărat, factorul de scară va fi mare. În consecință, probabilitatea (încrederea) a posteriori combină credințele pe care cercetătorul le are a priori cu cele care derivă din observarea datelor empirice.

Este ușor să arăți asta este întotdeauna mai mic sau cel mult egal cu 1, astfel încât proprietățile obișnuite ale probabilității sunt satisfăcute; intr-adevar:

astfel, dacă , , și în orice alt caz probabilitatea posterioară va fi strict mai mică de 1.

Probabilitate obiectivă și subiectivă

Unii statistici Bayesieni cred că, dacă ar fi posibil să atribuim o valoare obiectivă probabilităților a priori, teorema lui Bayes ar putea fi utilizată pentru a furniza o măsură obiectivă a probabilității unei ipoteze . Pentru alții, totuși, nu ar fi posibil să se atribuie probabilități obiective ; de fapt, acest lucru pare să necesite abilitatea de a atribui probabilități tuturor ipotezelor posibile.

Alternativ (și mai des, în contextul statisticilor bayesiene ), probabilitățile sunt considerate o măsură a gradului subiectiv de încredere din partea cercetătorului și se presupune că restricționează potențialele ipoteze la un set limitat, încadrat într-un model de referință. Teorema lui Bayes ar trebui să furnizeze apoi un criteriu rațional pentru evaluarea măsurii în care o observație dată ar trebui să modifice convingerile cercetătorului; în acest caz, însă, probabilitatea rămâne subiectivă: prin urmare, este posibil să se utilizeze teorema pentru a justifica rațional unele ipoteze , dar în detrimentul respingerii obiectivității afirmațiilor care derivă din aceasta.

De asemenea, este puțin probabil ca doi indivizi să treacă de la același grad de încredere subiectivă. Susținătorii metodei bayesiene susțin că, chiar și cu probabilități a priori foarte diferite, un număr suficient de observații poate duce la probabilități a posteriori foarte apropiate. Aceasta presupune că cercetătorii nu resping ipotezele omologului lor a priori și că atribuie probabilități condiționale similare ( funcții de probabilitate ).

Școala italiană de statistică a adus contribuții importante la dezvoltarea concepției subiective a probabilității , prin opera lui Bruno de Finetti . Cu privire la distincția dintre probabilitatea obiectivă și subiectivă , a se vedea și articolul despre probabilitate .

Raportul de probabilitate

Adesea impactul observației empirice poate fi rezumat printr-un raport de probabilitate . Acesta din urmă poate fi combinat cu probabilitatea a priori, pentru a reprezenta gradul de încredere a priori și orice rezultate empirice anterioare. De exemplu, luați în considerare raportul de probabilitate :

Enunțul teoremei lui Bayes poate fi rescris ca:

Pe baza a două rezultate empirice independente , , cele de mai sus pot fi exploatate pentru a calcula probabilitatea posterioară pe baza , și utilizați-l pe acesta din urmă ca nouă probabilitate a priori pentru a calcula o a doua probabilitate posterioară bazată pe . Această procedură este algebric echivalentă cu înmulțirea rapoartelor de probabilitate. Asa de:

implica:

Funcția de pierdere

Statisticile bayesiene au legături importante cu teoria deciziei ; o decizie bazată pe fundamentarea inferenței bayesiene este determinată de o funcție de pierdere asociată. Funcția de pierdere reflectă în esență consecințele negative asociate cu decizia „greșită”. Un exemplu destul de comun și care duce la rezultate foarte apropiate de cele ale inferenței clasice sau frecvențiste, este cel al funcției de pierdere pătratică.

Distribuții particulare a priori și a posteriori

Vc Beta în inferența bayesiană

Vc Beta joacă un rol important în contextul inferenței bayesiene, deoarece pentru unele vc este atât distribuția a priori, cât și distribuția a posteriori (cu parametri diferiți) a parametrilor acestor vc

Priori căsătoriți și vc binomial

Dacă X este distribuit ca un Vc binomial cu parametrii n și π

iar parametrul π este distribuit a priori ca vc Beta cu parametrii a și b

atunci parametrul π este distribuit și a posteriori ca vc Beta, dar cu parametrii a + x și b + nx

Dacă distribuția a priori este o variabilă aleatorie dreptunghiulară în intervalul [0; 1] (adică presupunând a priori toate valorile posibile ale lui π la fel de probabile) și, prin urmare, a = 1 și b = 1 , atunci distribuția a posteriori este a Beta cu parametrii x + 1 și n-x + 1

care are p ca valoare modală (și deci ca cea mai probabilă valoare)

, care corespunde frecvenței observate care este estimarea utilizată în contextul frecventistic

în timp ce valoarea care minimizează deviația pătrată , aceasta este media este

, care pentru x <n / 2 este mai mare decât valoarea modală

Vc Beta, Binom și Beta-Binom

În cazul unui vc binomial cu conjugat anterior Beta (a, b) din , vc care descrie probabilitatea de a obține x evenimente pozitive pe n este distribuit ca o variabilă aleatorie beta-binomială . Vc-binomial vc intră astfel în formula cu care probabilitatea posterioară a unui model este determinată într-un mod bayesian.

Priori conjugați și vc negativ binomial

Dacă X este distribuit ca un binom negativ vc cu parametrii m și θ

iar parametrul θ este distribuit a priori ca vc Beta cu parametrii a și b

atunci parametrul θ este distribuit și a posteriori ca vc Beta, dar cu parametrii a + m și b + x

Dacă distribuția a priori este o variabilă aleatorie dreptunghiulară în intervalul [0; 1] (adică presupunând a priori toate valorile posibile ale θ echiprobabile) și, prin urmare, a = 1 și b = 1 , atunci distribuția a posteriori este a Beta cu parametrii m + 1 și x + 1

care are t ca valoare modală (și deci ca cea mai probabilă valoare)

t = m / (m + x)

Gamma vc în inferența bayesiană

Vc Gamma joacă un rol important în contextul inferenței bayesiene, deoarece pentru unele vc este atât distribuția a priori, cât și distribuția a posteriori (cu parametri diferiți) a parametrilor acestor vc

Priori căsătoriți și același vc Gamma

Dacă X este distribuit ca o gamă vc cu parametrii α și θ

iar parametrul θ este distribuit a priori la rândul său ca o gamă vc cu parametrii a și b

atunci parametrul θ este distribuit și a posteriori ca o gamă vc, dar cu parametrii a + α și b + x

Priori căsătoriți și vc Poissoniana

Dacă X este distribuit ca vc Poissonian cu parametrul λ

iar parametrul λ este distribuit a priori ca o gamă vc cu parametrii a și b

atunci parametrul λ este distribuit a posteriori și ca o gamă vc, dar cu parametrii a + x și b + n

Vc Poissoniana, Gamma și Poisson-Gamma

Dacă conjugatul anterior al unui vc Poissonian este un vc Gamma, atunci probabilitatea ca să apară x evenimente este distribuită ca o variabilă aleatorie Poisson-Gamma . Poisson-Gamma introduce astfel formula cu care probabilitatea unui model este determinată într-un mod bayesian după ce a cunoscut datele.

Vc exponențial, Gamma și Gamma-Gamma

În cazul în care conjugatul anterior al unei variabile aleatorii exponențiale este o gamă vc, atunci funcția densității probabilității este distribuită ca o variabilă aleatorie Gamma-Gamma .

Priori căsătoriți și vc normal

Vc Gamma ca priori conjugați de vc normal

Dacă X este distribuit ca unVc normal cu parametrii μ și 1 / θ

iar parametrul θ este distribuit a priori ca o gamă vc cu parametrii a și b

atunci parametrul θ este distribuit și în spate ca o gamă de curent continuu, dar cu parametrii a + 1/2 și + b (x-μ) 2/2

Conjugat normal înainte de unul normal

Dacă X este distribuit ca unvc normal cu parametrii m și σ 2

iar parametrul m este distribuit a priori ca un vc normal cu parametrii μ și σ 2

atunci parametrul m este distribuit și a posteriori ca un Vc normal, dar cu parametri Și

Vich Dirichlet ca conjugat priori al multinominalului

Dacă X este distribuit ca o variabilă aleatorie multinomială

iar distribuția a priori a lui θ este o variabilă aleatorie Dirichlet

atunci distribuția posterioară a lui θ este, de asemenea, un Dirichlet vc, dar cu parametri noi

Uniforma discretă în cazul extragerii simple

Dacă X este distribuit ca urmare a unei simple extracții a unei populații dihotomice

iar parametrul θ este distribuit a priori ca o variabilă aleatorie uniformă discretă

apoi distribuția posterioară cu funcția de probabilitate

Popularitatea inferenței bayesiene

Inferența bayesiană a fost mult timp un curent minoritar în teoria statistică . Acest lucru se datorează în mare parte dificultăților algebrice pe care le pune; calculul probabilităților a posteriori se bazează pe calculul integralelor , pentru care adesea nu există expresii analitice.

Până acum câțiva ani, aceste dificultăți limitau capacitatea statisticilor bayesiene de a produce modele realiste ale realității. Pentru a evita confruntarea cu probleme algebrice, majoritatea rezultatelor s-au bazat pe teoria conjugatelor , familii particulare de distribuții pentru care probabilitatea posterioară pare să aibă aceeași formă ca cea a priori. În mod evident, o astfel de abordare nu a fost însoțită de ambiția bayeziană de a face statistici pornind de la ipoteze mai puțin restrictive decât cele de inferență clasică.

Datorită disponibilității crescute a resurselor IT din anii 1990 , a fost posibil să depășim aceste dificultăți. De fapt, este posibil să se rezolve numerele integrale , ocolind problemele algebrice, în majoritatea aplicațiilor de pe orice computer personal . Această posibilitate a stimulat, de asemenea, aplicarea la statistica bayesiană a metodelor numerice dezvoltate în alte contexte, precum cele bazate pe simulare ( metoda Monte Carlo , algoritmii de eșantionare Gibbs și Metropolis-Hastings ), precum și dezvoltarea de noi metode în domeniul Statisticile bayesiene în sine (de exemplu, metodele populare bazate pe lanțul Monte Carlo Markov sau MCMC). Acest lucru a crescut foarte mult popularitatea inferenței bayesiene în rândul statisticienilor; deși bayezienii constituie încă o minoritate, ei sunt o minoritate în creștere rapidă.

Dincolo de dificultățile numerice care au făcut mult timp nepopulară inferența bayesiană sau problemele epistemologice ridicate de metodele bayesiene, abordarea bayesiană are meritul de a fi stimulat, în statistici ca și în alte discipline (un exemplu recent este dat de economie ), reflecția asupra a ceea ce un model este și despre ce lectură trebuie să dea un cercetător despre el.

Elemente conexe

linkuri externe

Controlul autorității Tezaur BNCF 36249 · LCCN (EN) sh85012506 · GND (DE) 4144220-9