Distribuția probabilității compuse

În teoria probabilității , o distribuție de probabilitate compusă este o distribuție de probabilitate care rezultă din presupunerea că o variabilă aleatorie este distribuită în funcție de o distribuție parametrizată $F.$ ${\ displaystyle F}$ $F.$ cu un parametru necunoscut θ sau un parametru vector θ care la rândul său este distribuit în funcție de o altă distribuție G cu hiperparametru α și, prin urmare, determinarea distribuției care rezultă din marginalizarea deasupra lui G (adică integrarea deasupra parametrului sau parametrilor necunoscuți). Distribuția rezultată, H , se numește distribuția rezultată din compoziția distribuției F cu distribuția G. În inferența bayesiană , distribuția G este adesea o distribuție conjugată a priori a lui F.

În cazul parametrilor pur scalari și hiperparametrilor, distribuția probabilității compuse este exprimată în forma matematică

p_{H}(x|\alpha )={\displaystyle \int \limits _{\theta }p_{F}(x|\theta )\,p_{G}(\theta |\alpha )\operatorname {d} \!\theta }

{\ displaystyle p_ {H} (x | \ alpha) = {\ displaystyle \ int \ limits _ {\ theta} p_ {F} (x | \ theta) \, p_ {G} (\ theta | \ alpha) \ operatorname {d} \! \ theta}}

{\ displaystyle p_ {H} (x | \ alpha) = {\ displaystyle \ int \ limits _ {\ theta} p_ {F} (x | \ theta) \, p_ {G} (\ theta | \ alpha) \ operatorname {d} \! \ theta}}

Aceeași formulă se aplică dacă unele sau toate variabilele sunt vectori. În cazul datelor cu parametri vectoriali și hiperparametri

p_{H}(\mathbf {x} |{\boldsymbol {\alpha }})={\displaystyle \int \limits _{\boldsymbol {\theta }}p_{F}(\mathbf {x} |{\boldsymbol {\theta }})\,p_{G}({\boldsymbol {\theta }}|{\boldsymbol {\alpha }})\operatorname {d} \!{\boldsymbol {\theta }}}

{\ displaystyle p_ {H} (\ mathbf {x} | {\ boldsymbol {\ alpha}}) = {\ displaystyle \ int \ limits _ {\ boldsymbol {\ theta}} p_ {F} (\ mathbf {x} | {\ boldsymbol {\ theta}}) \, p_ {G} ({\ boldsymbol {\ theta}} | {\ boldsymbol {\ alpha}}) \ operatorname {d} \! {\ boldsymbol {\ theta}} }}

{\ displaystyle p_ {H} (\ mathbf {x} | {\ boldsymbol {\ alpha}}) = {\ displaystyle \ int \ limits _ {\ boldsymbol {\ theta}} p_ {F} (\ mathbf {x} | {\ boldsymbol {\ theta}}) \, p_ {G} ({\ boldsymbol {\ theta}} | {\ boldsymbol {\ alpha}}) \ operatorname {d} \! {\ boldsymbol {\ theta}} }}

O distribuție compusă $H.$ ${\ displaystyle H}$ $H.$ seamănă cu distribuția originală în multe feluri $F.$ ${\ displaystyle F}$ $F.$ care l-a generat, dar are de obicei o varianță mai mare și adesea cozi mai grele în distribuția sa. Sprijinul $H.$ ${\ displaystyle H}$ $H.$ este la fel ca suportul $F.$ ${\ displaystyle F}$ $F.$ , și adesea forma este în mare măsură similară. Parametrii de $H.$ ${\ displaystyle H}$ $H.$ include parametrii $G.$ ${\ displaystyle G}$ $G.$ și câțiva dintre parametrii $F.$ ${\ displaystyle F}$ $F.$ care nu au fost marginalizate.

Distribuțiile compuse apar frecvent în statisticile bayesiene, deoarece apar atunci când un parametru este marginalizat (adesea văzut ca un "parametru de prisos" într-o astfel de situație). Exemple sunt:

Distribuția predictivă a posteriori : F este distribuția unei noi date, G este distribuția a posteriori a parametrilor.
Distribuția predictivă a priori : F este distribuția unei noi date, G este distribuția a priori a parametrilor. Această distribuție, de fapt, poate fi utilizată pentru a defini o distribuție compusă.
Probabilitatea marginală : F este distribuția prin eșantionare a unui set de valori observate, G este distribuția a priori a parametrilor.

Un alt exemplu se găsește îneșantionarea Gibbs prăbușită , unde „prăbușirea” unei variabile înseamnă marginalizarea acesteia și, de obicei, parametrii distribuției a priori sunt prăbușiți. Distribuțiile compuse sunt uneori utilizate direct în inferență statistică, deoarece cozile lor tipice grele le fac mai potrivite pentru analize robuste în cazul datelor de măsurare potențial incorecte. De exemplu, distribuția Student t este adesea utilizată în locul unei distribuții normale exact din acest motiv.

Exemple

Compoziția unei distribuții normale cu varianță distribuită în funcție de o distribuție Gamma inversă (sau echivalent cu precizie , adică reciprocă a varianței, distribuită ca o distribuție Gamma ) oferă o distribuție t Student ne-standardizată. Această distribuție are aceeași formă simetrică ca o distribuție normală cu același punct central, dar cu o varianță mai mare și cozi mai grele.

Compoziția unei distribuții binomiale cu probabilitate de succes distribuită în funcție de o distribuție beta dă o distribuție beta-binomială . Această distribuție este, de fapt, discretă ca distribuția binomială , cu suport pentru numerele între „0” și „n” (numărul de încercări din distribuția binomială inițială). Există trei parametri, un parametru $n$ ${\ displaystyle n}$ $n$ (numărul de probe) din parametrii de distribuție și formă binomială $\alpha$ ${\ displaystyle \ alpha}$ $\ alfa$ Și $\beta$ ${\ displaystyle \ beta}$ $\ beta$ din distribuția beta. Forma este aceeași cu distribuția binomială atunci când $\alpha$ ${\ displaystyle \ alpha}$ $\ alfa$ Și $\beta$ ${\ displaystyle \ beta}$ $\ beta$ au valori ridicate. Acest lucru are sens, deoarece indică o mare certitudine că probabilitatea a priori este de fapt concentrată aproape de o poziție specificată. Valoarea limită, cu toate probabilitățile concentrate pe un punct specific, este aceeași cu faptul că nu are distribuție a priori, adică, de fapt, modul de specificare a probabilității ca parametru unic, ca în cazul simplu al distribuției binomiale necompuse . Cu toate acestea, când $\alpha$ ${\ displaystyle \ alpha}$ $\ alfa$ Și $\beta$ ${\ displaystyle \ beta}$ $\ beta$ au valori mici, forma distribuției compuse devine via, via mai asemănătoare cu cea a distribuției beta .

Alte exemple:

Compoziția unei distribuții gaussiene cu medie distribuită în funcție de o altă distribuție gaussiană, dintr-o distribuție gaussiană.
Compoziția unei distribuții gaussiene cu medie distribuită în funcție de o distribuție exponențială mutată de o distribuție gaussiană modificată exponențial .
Compoziția unei distribuții gaussiene cu o varianță distribuită în funcție de o distribuție exponențială în care parametrul de descompunere (sau creștere, dacă este pozitiv) este el însuși distribuit în conformitate cu o distribuție Gamma , dintr-o distribuție gamma-exponențială-normală . (Aceasta implică două etape ale compoziției.)
Compoziția unei distribuții multinomiale cu vector de probabilitate distribuită conform unei distribuții Dirichlet dă naștere unei distribuții multinichiale Dirichlet .
Compoziția unei distribuții Poisson cu parametru de variație distribuit în funcție de o distribuție Gamma dă naștere unei distribuții binomiale negative .
Compoziția unei distribuții Gamma cu parametru de scară inversă distribuită în funcție de o altă distribuție Gamma dă naștere unei distribuții Beta de primul tip cu trei parametri.

Familia distribuțiilor exponențiale

Distribuțiile compuse derivate din familia distribuțiilor exponențiale au adesea o formă închisă. Pentru mai multe informații, consultați articolul privind distribuția predictivă a posteriori .

Semnificații conexe

Un concept legat, dar ușor diferit de „compoziție” apare cu distribuția compusă Poisson . Într-o formulare, compoziția are loc deasupra unei distribuții rezultate din N distribuții subiacente, unde N este el însuși tratat ca o variabilă aleatorie. Distribuția Poisson compusă rezultă din luarea în considerare a unui set de variabile aleatorii distribuite identic și independente distribuite conform lui J , întrebând care este distribuția sumei lor, dacă numărul variabilelor este el însuși o variabilă aleatorie necunoscută $Nu.$ ${\ displaystyle N}$ $Nu.$ distribuit în funcție de o distribuție Poisson și independent de variabilele care au fost însumate. În acest caz, variabila aleatorie N este marginalizată într-un mod similar cu ceea ce se face cu parametrul θ.

Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică