Distribuția probabilității compuse

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În teoria probabilității , o distribuție de probabilitate compusă este o distribuție de probabilitate care rezultă din presupunerea că o variabilă aleatorie este distribuită în funcție de o distribuție parametrizată cu un parametru necunoscut θ sau un parametru vector θ care la rândul său este distribuit în funcție de o altă distribuție G cu hiperparametru α și, prin urmare, determinarea distribuției care rezultă din marginalizarea deasupra lui G (adică integrarea deasupra parametrului sau parametrilor necunoscuți). Distribuția rezultată, H , se numește distribuția rezultată din compoziția distribuției F cu distribuția G. În inferența bayesiană , distribuția G este adesea o distribuție conjugată a priori a lui F.

În cazul parametrilor pur scalari și hiperparametrilor, distribuția probabilității compuse este exprimată în forma matematică

Aceeași formulă se aplică dacă unele sau toate variabilele sunt vectori. În cazul datelor cu parametri vectoriali și hiperparametri

O distribuție compusă seamănă cu distribuția originală în multe feluri care l-a generat, dar are de obicei o varianță mai mare și adesea cozi mai grele în distribuția sa. Sprijinul este la fel ca suportul , și adesea forma este în mare măsură similară. Parametrii de include parametrii și câțiva dintre parametrii care nu au fost marginalizate.

Distribuțiile compuse apar frecvent în statisticile bayesiene, deoarece apar atunci când un parametru este marginalizat (adesea văzut ca un "parametru de prisos" într-o astfel de situație). Exemple sunt:

Un alt exemplu se găsește îneșantionarea Gibbs prăbușită , unde „prăbușirea” unei variabile înseamnă marginalizarea acesteia și, de obicei, parametrii distribuției a priori sunt prăbușiți. Distribuțiile compuse sunt uneori utilizate direct în inferență statistică, deoarece cozile lor tipice grele le fac mai potrivite pentru analize robuste în cazul datelor de măsurare potențial incorecte. De exemplu, distribuția Student t este adesea utilizată în locul unei distribuții normale exact din acest motiv.

Exemple

Compoziția unei distribuții normale cu varianță distribuită în funcție de o distribuție Gamma inversă (sau echivalent cu precizie , adică reciprocă a varianței, distribuită ca o distribuție Gamma ) oferă o distribuție t Student ne-standardizată. Această distribuție are aceeași formă simetrică ca o distribuție normală cu același punct central, dar cu o varianță mai mare și cozi mai grele.

Compoziția unei distribuții binomiale cu probabilitate de succes distribuită în funcție de o distribuție beta dă o distribuție beta-binomială . Această distribuție este, de fapt, discretă ca distribuția binomială , cu suport pentru numerele între „0” și „n” (numărul de încercări din distribuția binomială inițială). Există trei parametri, un parametru (numărul de probe) din parametrii de distribuție și formă binomială Și din distribuția beta. Forma este aceeași cu distribuția binomială atunci când Și au valori ridicate. Acest lucru are sens, deoarece indică o mare certitudine că probabilitatea a priori este de fapt concentrată aproape de o poziție specificată. Valoarea limită, cu toate probabilitățile concentrate pe un punct specific, este aceeași cu faptul că nu are distribuție a priori, adică, de fapt, modul de specificare a probabilității ca parametru unic, ca în cazul simplu al distribuției binomiale necompuse . Cu toate acestea, când Și au valori mici, forma distribuției compuse devine via, via mai asemănătoare cu cea a distribuției beta .

Alte exemple:

Familia distribuțiilor exponențiale

Distribuțiile compuse derivate din familia distribuțiilor exponențiale au adesea o formă închisă. Pentru mai multe informații, consultați articolul privind distribuția predictivă a posteriori .

Semnificații conexe

Un concept legat, dar ușor diferit de „compoziție” apare cu distribuția compusă Poisson . Într-o formulare, compoziția are loc deasupra unei distribuții rezultate din N distribuții subiacente, unde N este el însuși tratat ca o variabilă aleatorie. Distribuția Poisson compusă rezultă din luarea în considerare a unui set de variabile aleatorii distribuite identic și independente distribuite conform lui J , întrebând care este distribuția sumei lor, dacă numărul variabilelor este el însuși o variabilă aleatorie necunoscută distribuit în funcție de o distribuție Poisson și independent de variabilele care au fost însumate. În acest caz, variabila aleatorie N este marginalizată într-un mod similar cu ceea ce se face cu parametrul θ.

Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică