Teorema lui Bayes

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Formula teoremei lui Bayes reprodusă într-un semn cu tub fluorescent în birourile din Cambridge ale Autonomy Corporation

Teorema lui Bayes (cunoscută și ca formula lui Bayes sau teorema probabilității cauzelor ), propusă de Thomas Bayes (1702-1761), derivă din două teoreme fundamentale ale probabilității : teorema probabilității compuse și teorema probabilității absolute . Este folosit pentru a calcula probabilitatea unei cauze care a declanșat evenimentul verificat.

De exemplu, este posibil să se calculeze probabilitatea ca o anumită persoană să sufere de boala pentru care a efectuat testul de diagnostic (dacă acesta este negativ) sau invers nu este afectată de această boală (dacă testul este pozitiv), cunoscând frecvența cu care apare boala și procentul de eficacitate al testului de diagnostic. În mod formal, teorema lui Bayes este valabilă în toate interpretările probabilității. În orice caz, importanța acestei teoreme pentru statistici este de așa natură încât împărțirea dintre cele două școli ( statistici bayesiene și statistici frecventiste ) rezultă din interpretarea dată teoremei în sine.

Enunțarea teoremei lui Bayes

Luând în considerare un set de alternative care partiționează spațiul evenimentului (sau Și ) găsim următoarea expresie pentru probabilitatea condițională :

Unde este:

  • P (A) este probabilitatea a priori sau marginală a lui A. „A priori” înseamnă că nu ia în considerare nicio informație despre E.
  • P (A | E) este probabilitatea condițională a lui A, cunoscută E. Se mai numește probabilitate a posteriori, deoarece este derivată sau depinde de valoarea specifică a lui E.
  • P (E | A) este probabilitatea condițională a lui E, cunoscută A.
  • P (E) este probabilitatea a priori a lui E și servește drept constantă de normalizare .

Intuitiv, teorema descrie modul în care opiniile din observarea A sunt îmbogățite prin observarea evenimentului E.

Un exemplu

Luați în considerare o școală care are 60% bărbați și 40% femei.
Elevii poartă un număr egal de fuste sau pantaloni; elevii poartă toți pantaloni. Un observator, de la distanță, observă un student generic în pantaloni. Care este probabilitatea ca elevul respectiv să fie fată?

Problema poate fi rezolvată cu teorema lui Bayes, prin stabilirea evenimentului A că elevul observat este de sex feminin și al evenimentului B că studentul observat poartă pantaloni. Pentru a calcula P (A | B), va trebui să știm:

  • P (A) sau probabilitatea ca elevul să fie femeie fără alte informații. Deoarece observatorul vede un elev aleatoriu , aceasta înseamnă că toți elevii au șanse egale de a fi observați. Deoarece studentele reprezintă 40% din total, probabilitatea va fi de 2/5.
  • P (A ') sau probabilitatea ca elevul să fie bărbat fără alte informații. Deoarece A 'este evenimentul complementar al lui A, rezultă 3/5.
  • P (B | A) sau probabilitatea ca o studentă să poarte pantaloni (adică probabilitatea ca, odată cu evenimentul în care elevul este femeie, să se întâmple evenimentul în care ea poartă pantalonii). Deoarece poartă fuste și pantaloni în număr egal, probabilitatea va fi 1/2.
  • P (B | A '), sau probabilitatea ca un student să poarte pantaloni, observ că studentul este bărbat. Toți studenții de sex masculin poartă pantaloni, deci merită 1.
  • P (B) sau probabilitatea ca orice student (bărbat sau femeie) să poarte pantalonii. Deoarece numărul celor care poartă pantaloni este de 80 (60 bărbați + 20 femei) din 100 de bărbați și femei, probabilitatea P (B) este 80/100 = 4/5.

Acestea fiind spuse, putem aplica teorema:

Prin urmare, există 1/4 de probabilitate ca elevul să fie femeie, adică 25%. [1]

Derivarea teoremei

Teorema lui Bayes. Ω este spațiul măsurilor: A, nu A, B, nu B. Graficul evidențiază toate posibilitățile condiționate.

Teorema derivă din definiția probabilității condiționate . Probabilitatea unui eveniment A , odată cunoscut un eveniment B , este:

În mod similar, probabilitatea evenimentului B observă evenimentul A :

Prin urmare:

Înlocuind în prima egalitate, găsim teorema lui Bayes:

Aplicații

Aplicarea la problema Monty Hall

Pictogramă lupă mgx2.svg Același subiect în detaliu: problema Monty Hall .

Să presupunem că participați la un joc premiat, în care puteți alege între trei uși: în spatele uneia dintre ele este o mașină, în spatele celorlalte, două capre. Se alege o ușă, să zicem numărul 1, iar dirijorul jocului premiat, care știe ce se ascunde în spatele fiecărei uși, deschide o altă ușă, să zicem 3, dezvăluind o capră. Apoi întreabă: „Ați vrea să alegeți numărul 2?” Ar trebui să vă schimbați alegerea inițială?

S-ar putea crede că, cu două uși închise, există o probabilitate de 50:50 pentru fiecare și, prin urmare, nu există niciun motiv pentru a schimba ușile. Nu este cazul. Numim evenimentul că mașina se află în spatele unei anumite uși A 1 , A 2 și respectiv A 3 .

La început, este evident că:

Așa cum am menționat anterior, ușa aleasă este numărul 1. Numim evenimentul „prezentatorul deschide ușa 3” B. Acum:

  • În cazul în care mașina se află în spatele ușii 1, prezentatorul va fi liber să aleagă în mod aleatoriu ușa 2 sau 3. Prin urmare,
  • În cazul în care mașina se află în spatele ușii 2, prezentatorul va fi obligat să deschidă ușa 3. Prin urmare
  • În cazul în care mașina se află în spatele ușii 3, prezentatorul va fi obligat să deschidă ușa 2. Prin urmare

Probabilitatea a priori pentru evenimentul B este de 50%, de fapt:

De la care:

Din aceasta este evident că trebuie să se schimbe întotdeauna cu portul 2.

Filtre bayesiene

Pictogramă lupă mgx2.svg Același subiect în detaliu: filtru bayesian .

Filtrele bayesiene sunt un instrument utilizat pentru combaterea spamului care își datorează funcționarea teoremei lui Bayes. Un filtru Bayesian folosește un clasificator Bayesian pentru a recunoaște dacă o anumită secvență de simboluri (cum ar fi un cuvânt) apare adesea în mesajele spam, apoi aplică inferența Bayesiană pentru a calcula probabilitatea ca un anumit mesaj să fie spam.

fundal

Teorema este numită în onoarea Reverendului Thomas Bayes (1702–1761), care a studiat cum se calculează o distribuție pentru parametrul unei distribuții binomiale . Un prieten de-al său, Richard Price, a publicat lucrarea în 1763 , după moartea lui Bayes, în articolul Essay Towards Solving a Problem in the Doctrine of Chances . Câțiva ani mai târziu (în 1774 ) a fost formulat de Pierre Simon Laplace, care probabil nu știa de munca lui Bayes.

Cercetările unui profesor de statistică (Stigler, 1982) par să sugereze că teorema lui Bayes a fost descoperită de Nicholas Saunderson cu ani înainte de Bayes.

Notă

  1. ^ Verificarea acurateței rezultatului, în acest exemplu simplu, este imediată dacă folosim definiția simplă a „probabilității unui eveniment” = „numărul de cazuri în favoarea evenimentului / numărul de cazuri posibile”. Numărul de cazuri posibile, purtând pantalonii studenți (sau studenți) observați, este de 80 (60 bărbați + 20 femei), în timp ce cel al cazurilor favorabile (adică femeile care poartă pantaloni) este de 20, deci probabilitatea ca aceasta să fie o femeie este de 20 / 80 adică 1/4 cvd

Bibliografie

Versiuni non-ficțiune

  • Thomas Bayes (1763), Un eseu către rezolvarea unei probleme din Doctrina șanselor. Până la sfârșitul reverendului dl Bayes, FRS a comunicat de dl Price, într-o scrisoare către John Canton, AMFRS , Philosophical Transactions , Dating some of the Present Entreprisesments , Studies and Labour of the Ingenious in Many Considerable Parts of the World, 53: 370-418.
  • Thomas Bayes (1763/1958), Studii de istorie a probabilității și statistici: IX. Eseul lui Thomas Bayes Către rezolvarea unei probleme în Doctrina șanselor , Biometrika 45: 296-315. ( Eseul lui Bayes în notație modernizată ).

Comentarii

  • GA Barnard , Studii în istoria probabilității și statisticii: IX. Eseul lui Thomas Bayes Către rezolvarea unei probleme în Doctrina șanselor , Biometrika 45: 293–295, 1958
  • Daniel Covarrubias, Un eseu către rezolvarea unei probleme în Doctrina șanselor
  • Stephen M. Stigler, Thomas Bayes 'Bayesian Inference , Journal of the Royal Statistical Society , Seria A, 145: 250–258, 1982
  • Isaac Todhunter , O istorie a teoriei matematice a probabilității de pe vremea lui Pascal până la cea a lui Laplace , Macmillan, 1865. Reeditat 1949, 1956 de Chelsea și 2001 de Thoemmes.

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității GND ( DE ) 4144221-0
Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică