De la Wikipedia, enciclopedia liberă.
În teoria probabilității , distribuția Dirichlet , adesea notată cu {\ displaystyle \ operatorname {Dir} ({\ boldsymbol {\ alpha}})} , este o distribuție continuă a probabilității , dependentă de un vector de numere reale pozitive {\ displaystyle \ alpha} , care generalizează variabila aleatorie Beta în cazul multivariat . Este numit după matematicianul german Peter Gustav Lejeune Dirichlet .
Are o funcție de densitate a probabilității
- {\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k}) = {\ frac {\ Gamma (\ alpha)} {\ Gamma (\ alpha _ {1}) \ Gamma (\ alpha _ {2}) \ ldots \ Gamma (\ alpha _ {k})}} x_ {1} ^ { \ alpha _ {1} -1} x_ {2} ^ {\ alpha _ {2} -1} \ ldots x_ {k} ^ {\ alpha _ {k} -1},}
unde este {\ displaystyle \ alpha = \ alpha _ {1} + \ alpha _ {2} + \ ldots + \ alpha _ {k}} Și {\ displaystyle x_ {1}, \ dots, x_ {k}} sunt numere reale pozitive astfel încât
- {\ displaystyle x_ {1} + \ cdots + x_ {k} = 1.}
Valoarea sa așteptată este
- {\ displaystyle E (X_ {i}) = {\ frac {\ alpha _ {i}} {\ alpha}},}
moda este
- {\ displaystyle x_ {i} = {\ frac {\ alpha _ {i} -1} {\ alpha -k}}, \ quad \ alpha _ {i}> 1,}
în timp ce varianța este
- {\ displaystyle Var (X_ {i}) = {\ frac {(\ alpha - \ alpha _ {i}) \ alpha _ {i}} {\ alpha ^ {2} (\ alpha +1)}}.}
De asemenea, pentru fiecare cuplu {\ displaystyle X_ {i}, X_ {j}} cu {\ displaystyle i \ neq j} , avem covarianța
- {\ displaystyle Cov (X_ {i}, X_ {j}) = - {\ frac {\ alpha _ {i} \ alpha _ {j}} {\ alpha ^ {2} (\ alpha +1)}}. }
Teoreme
Distribuția beta ca un caz special
Dacă k = 2,{\ displaystyle X_ {2} = 1-X_ {1}} , asa de {\ displaystyle X_ {1}} este distribuit ca o variabilă aleatorie Beta {\ displaystyle Beta (\ alpha _ {1}, \ alpha _ {2})}
Distribuția Dirichlet ca conjugat anterior al vcMultinomial
În contextul inferenței bayesiene, variabila aleatorie Dirichlet este un conjugat anterior al variabilei aleatoare multinomiale, deoarece dacă este aplicată la
- {\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Multinomial} _ {k} (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k})}
o distribuție a priori a θ corespunzătoare unei variabile aleatorii Dirichlet
- {\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k})}
atunci distribuția posterioară a θ este, de asemenea, o variabilă aleatorie Dirichlet, dar cu parametrii crescuți cu valorile observate
- {\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k} | (x_ {1}, x_ {2}, \ ldots, x_ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1} + x_ {1}, \ alpha _ {2} + x_ {2}, \ ldots, \ alpha _ {k} + x_ {k})}
Această teoremă poate fi văzută ca o generalizare multivariată a teoremei univariate echivalente, care implică variabila aleatoare binomială în loc de multinomială și variabila aleatoare Beta în loc de Dirichlet.
De la Gamma (Erlang B) la Dirichlet
Dacă există k variabile aleatoare independente distribuite fiecare ca variabilă aleatorie Gamma cu un parametru comun tuturor și unitar și un parametru individualizat (sunt, prin urmare, variabile aleatoare numiteErlang B , fiecare cu propriul parametru)
- {\ displaystyle Y_ {i} \ sim \ operatorname {Gamma} (\ alpha _ {i}, 1)}
definindu-le suma ca.
- {\ displaystyle V = \ sum _ {i = 1} ^ {k} Y_ {i} \ sim \ operatorname {Gamma} (\ sum _ {i = 1} ^ {k} \ alpha _ {i}, 1) ,}
atunci avem asta
- {\ displaystyle (X_ {1}, \ ldots, X_ {k}) = (Y_ {1} / V, \ ldots, Y_ {k} / V) \ sim \ operatorname {Dir_ {k}} (\ alpha _ {1}, \ ldots, \ alpha _ {k}).}
Alte proiecte
linkuri externe
- SciencesPo : pachetul R care conține funcții pentru simularea parametrilor de distribuție Dirichlet.