Distribuție {\ displaystyle \ mathrm {B} (\ alpha, \ beta)} |
---|
Funcția densității probabilității |
Funcția de distribuție |
Parametrii | {\ displaystyle \ alpha, \ beta> 0 \} |
---|
A sustine | {\ displaystyle [0,1] \} |
---|
Funcția de densitate | {\ displaystyle {\ frac {x ^ {\ alpha -1} (1-x) ^ {\ beta -1}} {\ mathrm {B} (\ alpha, \ beta)}}} |
---|
Funcția de distribuție | {\ displaystyle I_ {x} (\ alpha, \ beta) \} ( funcția Beta incompletă regularizată ) |
---|
Valorea estimata | {\ displaystyle {\ frac {\ alpha} {\ alpha + \ beta}}} |
---|
Modă | {\ displaystyle {\ frac {\ alpha -1} {\ alpha + \ beta -2}}} de sine {\ displaystyle \ alpha, \ beta> 1 \} {\ displaystyle 0 \} de sine {\ displaystyle \ alpha <1 \} Și {\ displaystyle \ beta \ geqslant 1} {\ displaystyle 1 \} de sine {\ displaystyle \ alpha \ geqslant 1} Și {\ displaystyle \ beta <1 \}
|
---|
Varianța | {\ displaystyle {\ frac {\ alpha \ beta} {(\ alpha + \ beta) ^ {2} (\ alpha + \ beta +1)}}} |
---|
Indicele de asimetrie | {\ displaystyle 2 {\ frac {\ beta - \ alpha} {\ alpha + \ beta +2}} {\ sqrt {\ frac {\ alpha + \ beta +1} {\ alpha \ beta}}}} |
---|
Funcție generatoare de momente | {\ displaystyle 1+ \ sum _ {k = 1} ^ {\ infty} \ left (\ prod _ {r = 0} ^ {k-1} {\ frac {\ alpha + r} {\ alpha + \ beta + r}} \ right) {\ frac {t ^ {k}} {k!}}} |
---|
Funcția caracteristică | {\ displaystyle {} _ {1} F_ {1} (\ alpha; \ alpha + \ beta; i \, t)} |
---|
Manual |
În teoria probabilității și în statistică distribuția {\ displaystyle \ mathrm {B}} ( Beta ) este o distribuție continuă de probabilitate definită de doi parametri {\ displaystyle \ alpha} Și {\ displaystyle \ beta} pe intervalul unitar {\ displaystyle [0,1]} .
Această distribuție găsește o utilizare specială în statisticile bayesiene, deoarece guvernează probabilitatea {\ displaystyle p} a unui proces Bernoulli a posteriori de observare a {\ displaystyle \ alpha -1} „succese” e {\ displaystyle \ beta -1} „eșecuri”, când {\ displaystyle p} este a priori repartizat uniform între și {\ displaystyle 1} .
Definiție
Distribuția beta a parametrilor {\ displaystyle (\ alpha, \ beta)} (ambele pozitive) este definit pe interval {\ displaystyle [0,1]} cu funcție de densitate de probabilitate
- {\ displaystyle f (x) = {\ frac {x ^ {\ alpha -1} (1-x) ^ {\ beta -1}} {\ mathrm {B} (\ alpha, \ beta)}}} .
Cu alte cuvinte, funcția densității probabilității este proporțională cu funcția
- {\ displaystyle x ^ {\ alpha -1} (1-x) ^ {\ beta -1}} ,
redimensionat de un factor dat de funcția Beta
- {\ displaystyle \ mathrm {B} (\ alpha, \ beta) = \ int _ {0} ^ {1} x ^ {\ alpha -1} (1-x) ^ {\ beta -1} dx} ;
în acest fel are o probabilitate totală {\ displaystyle P (X \ in [0,1]) = 1} .
Funcția sa de distribuție este funcția Beta incompletă regularizată
- {\ displaystyle F (x) = I_ {x} (\ alpha, \ beta) = {\ frac {\ mathrm {B} _ {x} (\ alpha, \ beta)} {\ mathrm {B} (\ alpha , \ beta)}} = {\ frac {\ int _ {0} ^ {x} t ^ {\ alpha -1} (1-t) ^ {\ beta -1} dt} {\ int _ {0} ^ {1} t ^ {\ alpha -1} (1-t) ^ {\ beta -1} dt}}} .
Caracteristici
Momentele simple ale unei variabile aleatorii {\ displaystyle X} cu distribuția beta a parametrilor {\ displaystyle (\ alpha, \ beta)} Sunt
- {\ displaystyle \ mu _ {k} = E [X ^ {k}] = {\ frac {\ int _ {0} ^ {1} x ^ {\ alpha + k-1} (1-x) ^ { \ beta -1} dx} {\ int _ {0} ^ {1} x ^ {\ alpha -1} (1-x) ^ {\ beta -1} dx}} = {\ frac {\ mathrm {B } (\ alpha + k, \ beta)} {\ mathrm {B} (\ alpha, \ beta)}} = {\ frac {(\ alpha) _ {k}} {(\ alpha + \ beta) _ { k}}}} ,
unde este {\ displaystyle x_ {k}} denotă factorialul în creștere cu factorii k , {\ displaystyle (x) _ {k} = x (x + 1) \ cdots (x + k-1)} . (Ultima egalitate poate fi dedusă din expresia funcției Beta prin funcția Gamma , {\ displaystyle \ mathrm {B} (\ alpha, \ beta) = \ Gamma (\ alpha) \ Gamma (\ beta) / \ Gamma (\ alpha + \ beta)} și din proprietate{\ displaystyle \ Gamma (x + 1) = x \ Gamma (x)} .)
Momentele simple satisfac apoi relația recursivă
- {\ displaystyle \ mu _ {k + 1} = {\ frac {\ alpha + k} {\ alpha + \ beta + k}} \ mu _ {k}} .
În plus, distribuția are:
- valorea estimata {\ displaystyle E [X] = {\ frac {\ alpha} {\ alpha + \ beta}}} ;
- varianță {\ displaystyle {\ text {Var}} (X) = {\ frac {\ alpha \ beta} {(\ alpha + \ beta) ^ {2} (\ alpha + \ beta +1)}}} ;
- indicele de asimetrie {\ displaystyle \ gamma _ {1} = 2 {\ frac {\ beta - \ alpha} {\ alpha + \ beta +2}} {\ sqrt {\ frac {\ alpha + \ beta +1} {\ alpha \ beta}}}} ;
- indicele kurtozei {\ displaystyle \ gamma _ {2} = 6 {\ frac {\ alpha ^ {3} -2 \ alpha ^ {2} \ beta -2 \ alpha \ beta ^ {2} + \ beta ^ {3} + \ alpha ^ {2} -4 \ alpha \ beta + \ beta ^ {2}} {\ alpha \ beta (\ alpha + \ beta +2) (\ alpha + \ beta +3)}}} .
Parametrii {\ displaystyle \ alpha} Și {\ displaystyle \ beta} poate fi determinat în mod unic din valoarea și varianța așteptate:
- {\ displaystyle \ alpha = E [X] \ left ({\ frac {E [X] (1-E [X])} {{\ text {Var}} (X)}} - 1 \ right)} ;
- {\ displaystyle \ beta = (1-E [X]) \ left ({\ frac {E [X] (1-E [X])} {{\ text {Var}} (X)}} - 1 \ dreapta)} .
Aceste formule sunt aplicate în metoda momentelor cu media și varianța observate pe un eșantion .
Entropia este
- {\ displaystyle H (X) = \ log \ mathrm {B} (\ alpha, \ beta) - (\ alpha -1) \ digamma (\ alpha) - (\ beta -1) \ digamma (\ beta) + { \ alpha + \ beta -2) \ digamma (\ alpha + \ beta)} ,
unde este {\ displaystyle \ digamma} este funcția digamă .
Moda distribuției depinde de semnele {\ displaystyle \ alpha -1} Și {\ displaystyle \ beta -1} , și este unic numai dacă cel puțin unul dintre cele două este pozitiv:
- de sine {\ displaystyle \ alpha> 1} Și {\ displaystyle \ beta> 1} atunci moda este {\ displaystyle {\ frac {\ alpha -1} {\ alpha + \ beta -2}}} ;
- de sine {\ displaystyle \ alpha> 1} (sau {\ displaystyle \ alpha = 1} ) Și {\ displaystyle \ beta <1} atunci modul este 1;
- de sine {\ displaystyle \ beta> 1} (sau {\ displaystyle \ beta = 1} ) Și {\ displaystyle \ alpha <1} atunci moda este 0.
(Funcția densității probabilității are o asimptotă în 0 s {\ displaystyle \ alpha <1} , în 1 dacă {\ displaystyle \ beta <1} .)
Relații cu alte distribuții
O distribuție beta poate fi definită pe orice interval {\ displaystyle [a, b]} , luând {\ displaystyle Y = a + (ba) X} .
De sine {\ displaystyle X} Urmează distribuția beta a parametrilor {\ displaystyle (\ alpha, \ beta)} asa de {\ displaystyle 1-X} Urmează distribuția beta a parametrilor {\ displaystyle (\ beta, \ alpha)} .
- Distribuția Dirichlet este o generalizare a distribuției beta și descrie parametrii unei distribuții multinomiale a posteriori a unei observații. Distribuția Dirichlet cu doi parametri este exact distribuția beta.
- Pentru {\ displaystyle \ alpha = \ beta = {\ tfrac {3} {2}}} densitatea probabilității {\ displaystyle f (x) = {\ sqrt {x (1-x)}}} distribuției beta descrie jumătatea superioară a unei circumferințe :{\ displaystyle (2f (x)) ^ {2} + (2x-1) ^ {2} = 1} , descrie un semicerc. Variabila aleatorie {\ displaystyle Y = r (2X-1)} urmează o distribuție Wigner a parametrului r .
- De sine {\ displaystyle X} Și {\ displaystyle Y} sunt două variabile aleatoare independente cu distribuții Gamma ale parametrilor respectivi {\ displaystyle (\ alpha, \ theta)} Și {\ displaystyle (\ beta, \ theta)} , apoi variabila aleatorie {\ displaystyle {\ tfrac {X} {X + Y}}} Urmează distribuția beta a parametrilor {\ displaystyle (\ alpha, \ beta)} .
- Dacă variabila aleatorie {\ displaystyle X} Urmează distribuția beta a parametrilor {\ displaystyle (\ alpha, \ beta)} apoi variabila aleatorie {\ displaystyle T = {\ tfrac {X} {1-X}}} este descris prin distribuția beta a celui de-al doilea tip , care are o funcție de densitate de probabilitate
- {\ displaystyle f (t) = {\ frac {x ^ {\ alpha -1} / (1-x) ^ {\ alpha + \ beta}} {\ mathrm {B} (\ alpha, \ beta)}} }
- Distribuția Wilks {\ displaystyle \ Lambda (p, m, n)} poate fi interpretat ca distribuția care guvernează produsul {\ displaystyle X_ {1} \ cdots X_ {n}} a n variabile aleatorii independente {\ displaystyle X_ {1}, ..., X_ {n}} cu parametrii respectivi {\ displaystyle ({\ tfrac {m + 1-p} {2}}, {\ tfrac {p} {2}}), ..., ({\ tfrac {m + np} {2}}, { \ tfrac {p} {2}})} .
- De sine {\ displaystyle Y} este o variabilă aleatorie cu distribuția parametrilor Kumaraswamy {\ displaystyle (a, b)} asa de {\ displaystyle X = Y ^ {a}} Urmează distribuția beta a parametrilor {\ displaystyle (1, b)} .
Statistici bayesiene
Distribuția beta și procesul Bernoulli
Dacă X este distribuit ca un vc binomial cu parametrii n și π
- {\ displaystyle f (x | \ pi) = Binom (x | n; \ pi)}
iar parametrul π este distribuit a priori ca vc Beta cu parametrii a și b
- {\ displaystyle g (\ pi) = Beta (\ pi | a; b)}
atunci parametrul π este distribuit și a posteriori ca vc Beta, dar cu parametrii a + x și b + nx
- {\ displaystyle g (\ pi | x) = Beta (\ pi | a + x; b + nx)}
Dacă distribuția a priori este o variabilă aleatorie dreptunghiulară în intervalul [0; 1] (adică presupunând a priori toate valorile posibile ale π echiprobabile) și, prin urmare, a = 1 și b = 1 , atunci distribuția a posteriori este a Beta cu parametrii x + 1 și n-x + 1
- {\ displaystyle g (\ pi | x) = (n + 1) {n \ alege x} \ pi ^ {x} (1- \ pi) ^ {nx}}
care are p ca valoare modală (și deci ca cea mai probabilă valoare)
- {\ displaystyle p = {\ frac {x} {n}}} , care corespunde frecvenței observate care este estimarea utilizată în contextul frecventistic
în timp ce valoarea care minimizează deviația pătrată , aceasta este media este
- {\ displaystyle p = {\ frac {x + 1} {n + 2}}} , care pentru x <n / 2 este mai mare decât valoarea modală {\ displaystyle {\ frac {x} {n}}}
Într-adevăr, probabilitatea de a obține {\ displaystyle \ alpha -1} succese și {\ displaystyle \ beta -1} eșecurile într-un proces Bernoulli al parametrului p este {\ displaystyle {\ tbinom {\ alpha + \ beta -2} {\ alpha -1 \ ,, \, \ beta -1}} p ^ {\ alpha -1} (1-p) ^ {\ beta -1 }} , proporțional cu densitatea {\ displaystyle f (p)} a distribuției Beta a parametrilor {\ displaystyle (\ alpha, \ beta)} .
Prin urmare, dacă variabila aleatorie {\ displaystyle S} urmează o distribuție binomială {\ displaystyle {\ mathcal {B}} (P, \ alpha + \ beta -2)} cu parametrul aleatoriu P distribuit uniform a priori pe intervalul unitar {\ displaystyle [0,1]} , după observație {\ displaystyle S = \ alpha -1} parametrul P urmează distribuția {\ displaystyle \ mathrm {B} (\ alpha, \ beta)} .
Mai general, dacă {\ displaystyle S} este o variabilă aleatorie cu distribuție binomială {\ displaystyle {\ mathcal {B}} (P, n)} iar parametrul P urmează distribuția a priori {\ displaystyle \ mathrm {B} (\ alpha, \ beta)} , apoi a posteriori al observației {\ displaystyle S = s} parametrul P urmează distribuția {\ displaystyle \ mathrm {B} (\ alpha + s, \ beta + ns)} .
Cazul distribuției uniforme a priori este un caz special al acestuia din urmă, fiind {\ displaystyle \ mathrm {B} (1,1) = {\ mathcal {U}} (0,1)} .
Priori conjugați și binomul negativ vc
Dacă X este distribuit ca un binom negativ vc cu parametrii m și θ
- {\ displaystyle f (x | \ theta) = BinNeg (x | m; \ theta)}
iar parametrul θ este distribuit a priori ca vc Beta cu parametrii a și b
- {\ displaystyle g (\ theta) = Beta (\ theta | a; b)}
atunci parametrul θ este distribuit și a posteriori ca vc Beta, dar cu parametrii a + m și b + x
- {\ displaystyle g (\ theta | x) = Beta (\ theta | a + m; b + x)}
Dacă distribuția a priori este o variabilă aleatorie dreptunghiulară în intervalul [0; 1] (adică presupunând a priori toate valorile posibile ale θ echiprobabile) și, prin urmare, a = 1 și b = 1 , atunci distribuția a posteriori este a Beta cu parametrii m + 1 și x + 1
care are t ca valoare modală (și deci ca cea mai probabilă valoare)
- t = m / (m + x)
În mod similar, dacă variabila aleatorie {\ displaystyle T} Urmează distribuția Pascal {\ displaystyle {\ mathcal {NB}} (P, n)} iar P urmează distribuția a priori {\ displaystyle \ mathrm {B} (\ alpha, \ beta)} , apoi a posteriori al observației {\ displaystyle T = t} parametrul P urmează distribuția {\ displaystyle \ mathrm {B} (\ alpha + n, \ beta + t)} .
Elemente conexe
Alte proiecte