Probabilitatea bayesiană

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Probabilitatea bayesiană este o interpretare a conceptului de probabilitate, în care, în loc de frecvența sau înclinația unui fenomen, probabilitatea este interpretată ca o așteptare rațională [1] reprezentând o stare de cunoaștere [2] sau ca o cuantificare a unei credințe personale . [3]

Interpretarea bayesiană a probabilității poate fi văzută ca fiind coextensivă a logicii propoziționale cu includerea raționamentului prin ipoteză [4], adică cu propoziții al căror adevăr sau falsitate este necunoscut. În viziunea bayesiană, o probabilitate este atribuită unei ipoteze, în timp ce în abordarea frecventistă a inferențelor, o ipoteză este testată de obicei fără a fi atribuită o probabilitate.

Probabilitatea bayesiană aparține categoriei „probabilităților probatorii”: de fapt, pentru a evalua probabilitatea unei ipoteze, probabilistul bayesian trebuie să specifice o probabilitate inițială ( probabilitate anterioară ). Acest lucru, la rândul său, este apoi actualizat la o probabilitate finală în lumina noilor date relevante (dovezi sau dovezi). [5] Interpretarea bayesiană oferă, de asemenea, un set standard de proceduri și formule pentru efectuarea acestui calcul.

Termenul bayesian derivă din matematicianul și teologul secolului al XVIII-lea Thomas Bayes , care a oferit primul tratament formal al unei probleme netiviale care implică analiza datelor statistice folosind ceea ce este acum cunoscut sub numele de inferență bayesiană . [6] Matematicianul și fizicianul francez Pierre-Simon Laplace (1749 - 1827) a fost un pionier în popularizarea a ceea ce se numește acum probabilitatea bayesiană.

Metodologia bayesiană

Metodologia bayesiană se caracterizează prin câteva concepte și proceduri:

  • Utilizarea variabilelor aleatorii sau a unor cantități mai general necunoscute [7] pentru a modela toate sursele de incertitudine în modelele statistice, inclusiv incertitudinea rezultată din lipsa de informații.
  • Necesitatea de a determina distribuția probabilităților inițiale luând în considerare informațiile (anterioare) disponibile.
  • Utilizarea secvențială a teoremei lui Bayes : când mai multe date (dovezi) devin disponibile, probabilitatea finală este determinată folosind formula Bayes; ulterior, distribuția finală a probabilității devine la rândul ei o probabilitate inițială, care poate fi modificată ca urmare a unor noi dovezi.
  • În timp ce pentru frecventist, o ipoteză este o propoziție (care trebuie să fie adevărată sau falsă ), astfel încât probabilitatea unei ipoteze să fie 0 sau 1, în statisticile bayesiene, probabilitatea care poate fi atribuită unei ipoteze poate fi orice valoare în intervalul valorilor reale cuprinse între 0 și 1 (valoare incertă a probabilității).

Probabilități obiective și probabilități subiective

În linii mari, există două interpretări predominante ale probabilității bayesiene. Pentru obiectiviviști , care interpretează probabilitatea ca fiind coextensivă cu logica , probabilitatea cuantifică așteptările rezonabile pe care toți cei care împărtășesc aceleași cunoștințe ar trebui să le împărtășească în conformitate cu regulile statisticilor bayesiene, care pot fi justificate prin teorema lui Cox . [2] [8] Pentru subiectiviști , probabilitatea corespunde în schimb unui grad de credință personală. [3] În cadrul acestei viziuni principalele constrângeri ale credinței personale sunt date de conceptele de raționalitate și coerență; aceste constrângeri sunt justificate de argumentul depariere olandez sau de teoria deciziei și de teorema lui De Finetti. Interpretările obiective și subiective ale probabilității bayesiene diferă în principal prin interpretarea și atribuirea valorii probabilităților inițiale.

Istorie

Termenul bayesian derivă de la Thomas Bayes (1702–1761), un presbiter și matematician britanic care a dovedit un caz special al ceea ce se numește acum teorema lui Bayes într-o lucrare intitulată Un eseu către rezolvarea unei probleme în Doctrina șanselor . [9] Pierre-Simon Laplace (1749-1827) a introdus o versiune generală a teoremei și a folosit-o pentru a aborda problemele mecanicii cerești , statisticilor medicale și jurisprudenței . [10] Inferența bayesiană folosea inițial probabilități inițiale uniforme urmând principiul Laplace (denumit și principiul rațiunii insuficiente sau principiul echiprobabilității ) și a fost numită „probabilitate inversă” (deoarece acționează „înapoi”, adică de la observații la parametri sau de la efecte la cauze). [11] După anii 1920, această abordare a fost în mare parte înlocuită de o colecție de metode care au ajuns să fie numite statistici frecventiste , în urma muncii unor matematicieni precum Richard von Mises și a unor filosofi precum Hans Reichenbach .

În secolul al XX-lea, ideile lui Laplace s-au dezvoltat în două direcții, dând naștere curentelor obiectiviviste și subiectiviste ale abordării bayesiene. Teoria probabilității lui Harold Jeffreys (publicată pentru prima dată în 1939) a jucat un rol important în revigorarea viziunii bayesiene asupra probabilității, urmată de lucrările lui Abraham Wald (1950) și Leonard J. Savage (1954). Adjectivul bayesian în sine datează doar din anii 1950; în timp ce termenul derivat neo-bayesianism a fost inventat în anii 1960. [12] [13] [14] În abordarea obiectivistă, analiza statistică depinde doar de modelul asumat și de datele analizate; [15] nu este necesar să se implice decizii subiective. Dimpotrivă, statisticienii „subiectiviști”, precum italianul Bruno De Finetti , neagă posibilitatea unei analize pe deplin obiective pentru cazul general.

În anii 1980, s-a înregistrat o creștere dramatică a cercetării și aplicațiilor metodelor bayesiene, atribuită în principal descoperirii metodelor lanțului Monte Carlo Markov și în consecință îndepărtării multor probleme de calcul și interesului tot mai mare pentru aplicațiile complexe, care nu sunt standard . [16] Deși statisticile frecventiste rămân utilizate pe scară largă (așa cum se poate vedea din faptul că majoritatea predării universitare se bazează încă pe aceasta [17] ), metodele bayesiene sunt larg acceptate și utilizate, de exemplu, în domeniul învățării automate . [18]

Justificarea abordării bayesiene

Utilizarea probabilităților bayesiene, ca punct de plecare al inferenței bayesiene , a fost susținută de mai multe argumente, precum axiomele lui Cox , argumentulpariului olandez sau pe baza argumentelor bazate pe teoria deciziei și teorema lui De. Finetti.

Abordare axiomatică

Richard T. Cox a arătat că [8] actualizarea bayesiană rezultă din mai multe axiome, inclusiv două ecuații funcționale și o ipoteză de diferențiere. Alte axiomatizări au fost sugerate de diverși autori pentru a face teoria mai riguroasă. [7]

Abordarea pariului olandez

Argumentul depariere olandez a fost propus de matematicianul Bruno De Finetti și se bazează pe pariuri. Unpariu olandez este o situație care apare atunci când un jucător rațional plasează o serie de pariuri care îi garantează un profit, indiferent de rezultatul pariurilor. Dacă o casă de pariuri respectă regulile calculului bayesian în construirea cotelor sale, unpariu olandez nu poate fi făcut. Pe baza acestui argument, De Finetti definește conceptul de coerență .

Cu toate acestea, Ian Hacking a arătat că argumentele tradiționale ale „pariului olandez ” nu necesită neapărat o abordare bayesiană, ci permit o abordare non-bayesiană pentru actualizarea cotelor.

De fapt, există reguli de actualizare non-bayesiene care evită pariurile olandeze. Ipotezele suplimentare suficiente pentru a specifica (în mod unic) abordarea bayesiană a actualizării bayesiene nu sunt considerate universal satisfăcătoare. [19]

Abordarea prin teoria deciziilor

O justificare bazată pe teoria deciziei privind utilizarea inferenței bayesiene (și, prin urmare, probabilitățile bayesiene) a fost furnizată de matematicianul maghiar Abraham Wald , care a dovedit că orice procedură statistică fezabilă (în sensul statisticilor bayesiene) este fie o procedură bayesiană, fie este o limitare a procedurilor bayesiene. [20] În schimb, orice procedură bayesiană este admisibilă. [21]

Probabilități personale și metode obiective pentru construirea probabilităților inițiale

În urma lucrărilor privind teoria utilității așteptate de FP Ramsey și J. von Neumann , teoreticienii deciziilor au explicat comportamentul rațional folosind o distribuție de probabilitate relativă a agentului . Johann Pfanzagl a completat teoria jocurilor și comportamentul economic oferind o axiomatizare a probabilității și utilității subiective, sarcină lăsată incompletă de von Neumann și Oskar Morgenstern : teoria lor originală, de fapt, presupunea că toți agenții aveau aceeași distribuție a probabilității, pentru comoditate. [22]

Frank Plumpton Ramsey și Leonard Jimmie Savage au remarcat că distribuția probabilității agentului unic ar putea fi studiată în mod obiectiv prin experimente.

„Testul Ramsey” pentru evaluarea distribuțiilor de probabilitate este teoretic implementabil și a fost de interes pentru psihologia experimentală de aproape o jumătate de secol. [23] Această lucrare demonstrează că propunerile de probabilitate bayesiană pot fi falsificate și astfel pot satisface un criteriu empiric pus de Charles S. Peirce , a cărui lucrare a inspirat-o pe Ramsey. (Acest criteriu de falsificare a fost popularizat de Karl Popper [24] [25] ).

Probabilitățile personale sunt problematice pentru științe și pentru unele aplicații în care agenții nu au cunoștințele sau timpul necesar pentru a specifica o distribuție informată a probabilității pe care sunt dispuși să acționeze. Pentru a satisface nevoile științei și a depăși limitele umane, unii teoreticieni bayesieni au dezvoltat metode „obiective” pentru specificarea probabilităților inițiale.

Într - adevăr, unele Bayesians au susținut că starea inițială a cunoștințelor definește (doar) distribuția de probabilitate anterioară pentru probleme statistice „obișnuite“ ( de exemplu , bine reprezentate , în sensul prevăzut de J. Hadamard ). Găsirea metodei corecte pentru construirea unor astfel de probabilități inițiale „obiective” (pentru clase adecvate de probleme regulate) a fost cercetarea teoreticienilor statistici de la Laplace la John Maynard Keynes , Harold Jeffreys și Edwin Thompson Jaynes . Acești teoreticieni și succesorii lor au sugerat mai multe metode pentru construirea probabilităților inițiale „obiective”:

Fiecare dintre aceste metode contribuie la formarea probabilităților inițiale utile pentru probleme „regulate” cu un parametru și fiecare dintre ele poate gestiona unele modele statistice stimulante (cu „nereguli” sau parametri diferiți). Mai mult, fiecare dintre aceste metode a fost utilă în practica bayesiană. Într-adevăr, metodele de construire a probabilităților inițiale „obiective” au fost dezvoltate de autoclamați subiectivisti (sau „personali”) bayezieni precum James Berger ( Duke University ) și José-Miguel Bernardo ( Universitat de València ), pur și simplu pentru că astfel de probabilități inițiale sunt necesare practicii bayesiene, în special în știință. [26] Căutarea „metodei universale de construire a probabilităților inițiale” continuă să atragă teoreticieni statistici.

Notă

  1. ^ RT Cox , Probability, Frequency, and Reasonable Expectation , în American Journal of Physics , vol. 14, n. 1, 1946, pp. 1-10, Bibcode : 1946AmJPh..14 .... 1C , DOI : 10.1119 / 1.1990764 .
  2. ^ a b Jaynes, ET, Bayesian Methods: General Background , in Justice, JH (eds), Maximum-Entropy and Bayesian Methods in Applied Statistics , Cambridge, Cambridge University Press, 1986.
  3. ^ a b Bruno de Finetti, Teoria probabilității: un tratament introductiv critic , Chichester, John Wiley & Sons Ltd., 2017, ISBN 978-1-119-28637-0 .
  4. ^ Theodore Hailperin, Sentential Probability Logic: Origins, Development, Current Status, and Technical Applications , Londra, Associated University Presses, 1996, ISBN 0-934223-45-9 .
  5. ^ New York Times , https://www.nytimes.com/2011/08/07/books/review/the-theory-that-would-not-die-by-sharon-bertsch-mcgrayne-book-review.html . Accesat la 6 august 2011 .
  6. ^ Stephen M. Stigler,The history of statistics , Harvard University Press, martie 1990, ISBN 978-0-674-40341-3 .
  7. ^ a b Dupré, Maurice J. și Tipler, Frank J., Axiome noi pentru probabilitatea bayesiană riguroasă , în Analiza Bayesiană , vol. 4, nr. 3, 2009, pp. 599–606, DOI : 10.1214 / 09-BA422 .
  8. ^ a b Richard T. Cox, Algebra inferenței probabile , Reprint, Baltimore, MD; Londra, Marea Britanie, Johns Hopkins Press; Oxford University Press [distribuitor], 1961, ISBN 978-0-8018-6982-2 .
  9. ^ McGrayne, Sharon Bertsch,Teoria care nu ar muri , 2011,   , p. 10 . .
  10. ^ Stigler, Stephen M., capitolul 3 , în Istoria statisticii , Harvard University Press, 1986.
  11. ^ Fienberg, Stephen. E., Când a devenit inferența bayesiană „bayesiană”? ( PDF ), în Analiza Bayesiană , vol. 1, nr. 1, 2006, pp. 5, 1–40, DOI : 10.1214 / 06-BA101 (arhivat din original la 10 septembrie 2014) .
  12. ^ Marshall Dees Harris, Dezvoltări recente ale așa-numitei abordări bayesiene a statisticii , în Legal-Economic Research , Universitatea din Iowa, 1959, pp. 125 (fn. # 52), 126.
    „Lucrările lui Wald , Statistical Decision Functions (1950) și Savage , The Foundation of Statistics (1954) sunt în mod obișnuit considerate puncte de plecare pentru abordările Bayesiene actuale” .
  13. ^ Analele Laboratorului de Calcul al Universității Harvard , vol. 31, 1962, p. 180.
    „Această revoluție, care poate avea sau nu succes, este neo-bayezianism. Jeffreys a încercat să introducă această abordare, dar nu a reușit în acel moment să-i facă apel general. " .
  14. ^ 1967, https://books.google.com/books?id=IC4Ku_7dBFUC&pg=PA235#v=onepage . din
  15. ^ JM Bernardo , Analiza referințelor , în Handbook of Statistics , vol. 25, 2005, pp. 17–90, DOI : 10.1016 / S0169-7161 (05) 25002-2 , ISBN 978-0-444-51539-1 .
  16. ^ Wolpert, RL, O conversație cu James O. Berger , în Știința statistică , vol. 9, 2004, pp. 205-218, DOI : 10.1214 / 088342304000000053 .
  17. ^ Bernardo, José M., 2006, http://www.ime.usp.br/~abe/ICOTS7/Proceedings/PDFs/InvitedPapers/3I2_BERN.pdf . din
  18. ^ Bishop, CM, Pattern Recognition and Machine Learning , Springer, 2007.
  19. ^ Bas van Frassen , Legi și simetrie , Oxford University Press, 1989, ISBN 0-19-824860-1 .
  20. ^ Wald, Abraham, Funcții de decizie statistică , Wiley, 1950.
  21. ^ Bernardo, José M. și Smith, Adrian FM, Teoria Bayesiană , John Wiley, 1994, ISBN 0-471-92416-4 .
  22. ^ Pfanzagl (1967, 1968)
  23. ^ Davidson și colab. (1957)
  24. ^ Enciclopedia Stanford a filosofiei .
  25. ^ (EN) Popper, Karl, The Logic of Scientific Discovery , 2nd, Routledge, 2002 [1959], p. 57, ISBN 0-415-27843-0 . (traducerea originalului din 1935, în germană).
  26. ^ Bernardo, JM, Analysis Analysis ( PDF ), în Dey (ed.), Handbook of Statistics , vol. 25, Amsterdam, Elsevier, 2005, pp. 17–90.

Elemente conexe

Filozofie Portal de filosofie : accesați intrările Wikipedia care se ocupă de filosofie