Distribuția Dirichlet

În teoria probabilității , distribuția Dirichlet , adesea notată cu $\operatorname {Dir} ({\boldsymbol {\alpha }})$ ${\ displaystyle \ operatorname {Dir} ({\ boldsymbol {\ alpha}})}$ ${\ displaystyle \ operatorname {Dir} ({\ boldsymbol {\ alpha}})}$ , este o distribuție continuă a probabilității , dependentă de un vector de numere reale pozitive $\alpha$ ${\ displaystyle \ alpha}$ $\ alfa$ , care generalizează variabila aleatorie Beta în cazul multivariat . Este numit după matematicianul german Peter Gustav Lejeune Dirichlet .

Are o funcție de densitate a probabilității

f(x_{1},x_{2},\ldots ,x_{k}|\alpha _{1},\alpha _{2},\ldots ,\alpha _{k})={\frac {\Gamma (\alpha )}{\Gamma (\alpha _{1})\Gamma (\alpha _{2})\ldots \Gamma (\alpha _{k})}}x_{1}^{\alpha _{1}-1}x_{2}^{\alpha _{2}-1}\ldots x_{k}^{\alpha _{k}-1},

{\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k}) = {\ frac {\ Gamma (\ alpha)} {\ Gamma (\ alpha _ {1}) \ Gamma (\ alpha _ {2}) \ ldots \ Gamma (\ alpha _ {k})}} x_ {1} ^ { \ alpha _ {1} -1} x_ {2} ^ {\ alpha _ {2} -1} \ ldots x_ {k} ^ {\ alpha _ {k} -1},}

{\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k}) = {\ frac {\ Gamma (\ alpha)} {\ Gamma (\ alpha _ {1}) \ Gamma (\ alpha _ {2}) \ ldots \ Gamma (\ alpha _ {k})}} x_ {1} ^ { \ alpha _ {1} -1} x_ {2} ^ {\ alpha _ {2} -1} \ ldots x_ {k} ^ {\ alpha _ {k} -1},}

unde este $\alpha =\alpha _{1}+\alpha _{2}+\ldots +\alpha _{k}$ ${\ displaystyle \ alpha = \ alpha _ {1} + \ alpha _ {2} + \ ldots + \ alpha _ {k}}$ ${\ displaystyle \ alpha = \ alpha _ {1} + \ alpha _ {2} + \ ldots + \ alpha _ {k}}$ Și $x_{1},\dots ,x_{k}$ ${\ displaystyle x_ {1}, \ dots, x_ {k}}$ ${\ displaystyle x_ {1}, \ dots, x_ {k}}$ sunt numere reale pozitive astfel încât

x_{1}+\cdots +x_{k}=1.

{\ displaystyle x_ {1} + \ cdots + x_ {k} = 1.}

{\ displaystyle x_ {1} + \ cdots + x_ {k} = 1.}

Valoarea sa așteptată este

E(X_{i})={\frac {\alpha _{i}}{\alpha }},

{\ displaystyle E (X_ {i}) = {\ frac {\ alpha _ {i}} {\ alpha}},}

{\ displaystyle E (X_ {i}) = {\ frac {\ alpha _ {i}} {\ alpha}},}

moda este

x_{i}={\frac {\alpha _{i}-1}{\alpha -k}},\quad \alpha _{i}>1,

{\ displaystyle x_ {i} = {\ frac {\ alpha _ {i} -1} {\ alpha -k}}, \ quad \ alpha _ {i}> 1,}

{\ displaystyle x_ {i} = {\ frac {\ alpha _ {i} -1} {\ alpha -k}}, \ quad \ alpha _ {i}> 1,}

în timp ce varianța este

Var(X_{i})={\frac {(\alpha -\alpha _{i})\alpha _{i}}{\alpha ^{2}(\alpha +1)}}.

{\ displaystyle Var (X_ {i}) = {\ frac {(\ alpha - \ alpha _ {i}) \ alpha _ {i}} {\ alpha ^ {2} (\ alpha +1)}}.}

{\ displaystyle Var (X_ {i}) = {\ frac {(\ alpha - \ alpha _ {i}) \ alpha _ {i}} {\ alpha ^ {2} (\ alpha +1)}}.}

De asemenea, pentru fiecare cuplu $X_{i},X_{j}$ ${\ displaystyle X_ {i}, X_ {j}}$ ${\ displaystyle X_ {i}, X_ {j}}$ cu $i\neq j$ ${\ displaystyle i \ neq j}$ ${\ displaystyle i \ neq j}$ , avem covarianța

Cov(X_{i},X_{j})=-{\frac {\alpha _{i}\alpha _{j}}{\alpha ^{2}(\alpha +1)}}.

{\ displaystyle Cov (X_ {i}, X_ {j}) = - {\ frac {\ alpha _ {i} \ alpha _ {j}} {\ alpha ^ {2} (\ alpha +1)}}. }

{\ displaystyle Cov (X_ {i}, X_ {j}) = - {\ frac {\ alpha _ {i} \ alpha _ {j}} {\ alpha ^ {2} (\ alpha +1)}}. }

Teoreme

Distribuția beta ca un caz special

Dacă k = 2, $X_{2}=1-X_{1}$ ${\ displaystyle X_ {2} = 1-X_ {1}}$ ${\ displaystyle X_ {2} = 1-X_ {1}}$ , asa de $X_{1}$ ${\ displaystyle X_ {1}}$ $X_ {1}$ este distribuit ca o variabilă aleatorie Beta $Beta(\alpha _{1},\alpha _{2})$ ${\ displaystyle Beta (\ alpha _ {1}, \ alpha _ {2})}$ ${\ displaystyle Beta (\ alpha _ {1}, \ alpha _ {2})}$

Distribuția Dirichlet ca conjugat anterior al vcMultinomial

În contextul inferenței bayesiene, variabila aleatorie Dirichlet este un conjugat anterior al variabilei aleatoare multinomiale, deoarece dacă este aplicată la

f(x_{1},x_{2},\ldots ,x_{k}|\theta _{1},\theta _{2},\ldots ,\theta _{k})=\operatorname {Multinomiale} _{k}(\theta _{1},\theta _{2},\ldots ,\theta _{k})

{\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Multinomial} _ {k} (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k})}

{\ displaystyle f (x_ {1}, x_ {2}, \ ldots, x_ {k} | \ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Multinomial} _ {k} (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k})}

o distribuție a priori a θ corespunzătoare unei variabile aleatorii Dirichlet

g(\theta _{1},\theta _{2},\ldots ,\theta _{k})=\operatorname {Dir} _{k}(\alpha _{1},\alpha _{2},\ldots ,\alpha _{k})

{\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k})}

{\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1}, \ alpha _ {2}, \ ldots, \ alpha _ {k})}

atunci distribuția posterioară a θ este, de asemenea, o variabilă aleatorie Dirichlet, dar cu parametrii crescuți cu valorile observate

g(\theta _{1},\theta _{2},\ldots ,\theta _{k}|(x_{1},x_{2},\ldots ,x_{k})=\operatorname {Dir} _{k}(\alpha _{1}+x_{1},\alpha _{2}+x_{2},\ldots ,\alpha _{k}+x_{k})

{\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k} | (x_ {1}, x_ {2}, \ ldots, x_ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1} + x_ {1}, \ alpha _ {2} + x_ {2}, \ ldots, \ alpha _ {k} + x_ {k})}

{\ displaystyle g (\ theta _ {1}, \ theta _ {2}, \ ldots, \ theta _ {k} | (x_ {1}, x_ {2}, \ ldots, x_ {k}) = \ operatorname {Dir} _ {k} (\ alpha _ {1} + x_ {1}, \ alpha _ {2} + x_ {2}, \ ldots, \ alpha _ {k} + x_ {k})}

Această teoremă poate fi văzută ca o generalizare multivariată a teoremei univariate echivalente, care implică variabila aleatoare binomială în loc de multinomială și variabila aleatoare Beta în loc de Dirichlet.

De la Gamma (Erlang B) la Dirichlet

Dacă există k variabile aleatoare independente distribuite fiecare ca variabilă aleatorie Gamma cu un parametru comun tuturor și unitar și un parametru individualizat (sunt, prin urmare, variabile aleatoare numiteErlang B , fiecare cu propriul parametru)