Distribuție multinomială

În teoria probabilității , distribuția multinomială este o distribuție discretă de probabilitate care generalizează distribuția binomială în mai multe variabile.

Cu alte cuvinte, în cazul în care distribuția binomială descrie numărul de succese într-un proces Bernoulli , pentru care fiecare studiu unic poate oferi doar două rezultate, distribuția multinomială descrie cazul mai general în care fiecare proces poate oferi un număr finit de rezultate., fiecare cu probabilitatea sa.

Un exemplu de distribuție multinomială este dat de numărul de apariții ale fiecărei fețe pentru câteva lansări succesive ale unei matrițe pe 6 fețe.

Definiție

Distribuție binomială

Distribuția binomială ${\mathcal {B}}(p,n)$ ${\ displaystyle {\ mathcal {B}} (p, n)}$ ${\ mathcal {B}} (p, n)$ descrie probabilitățile pentru fiecare pereche $(k,n-k)$ ${\ displaystyle (k, nk)}$ $(k, n-k)$ ("succese", "eșecuri") în $n$ ${\ displaystyle n}$ $n$ studii independente, fiecare dintre ele având probabilități $p$ ${\ displaystyle p}$ $p$ Și $1-p$ ${\ displaystyle 1-p}$ $1-p$ pentru a oferi un „succes” sau un „eșec”.

Distribuție multinomială

Distribuția multinomială a parametrilor $((p_{1},...,p_{s}),n)$ ${\ displaystyle ((p_ {1}, ..., p_ {s}), n)}$ $((p_ {1}, ..., p_ {s}), n)$ , cu $p_{1}+...+p_{s}=1$ ${\ displaystyle p_ {1} + ... + p_ {s} = 1}$ $p_ {1} + ... + p_ {s} = 1$ , descrie probabilitățile pentru fiecare s -uple $(n_{1},...,n_{s})$ ${\ displaystyle (n_ {1}, ..., n_ {s})}$ $(n_ {1}, ..., n_ {s})$ (cu $n_{1}+...+n_{s}=n$ ${\ displaystyle n_ {1} + ... + n_ {s} = n}$ $n_ {1} + ... + n_ {s} = n$ ) de rezultate $x_{1},...,x_{s}$ ${\ displaystyle x_ {1}, ..., x_ {s}}$ $x_ {1}, ..., x_ {s}$ în $n$ ${\ displaystyle n}$ $n$ studii independente, fiecare dintre ele având probabilități $p_{i}$ ${\ displaystyle p_ {i}}$ $p_ {i}$ A furniza $x_{i}$ ${\ displaystyle x_ {i}}$ $x_i$ .

Această distribuție poate fi descrisă luând un vector aleatoriu $X_{j}$ ${\ displaystyle X_ {j}}$ $X_j$ pentru rezultatele fiecărui test individual, cu

P(X_{j}=e_{i})=p_{i}

{\ displaystyle P (X_ {j} = e_ {i}) = p_ {i}}

P (X_ {j} = e_ {i}) = p_ {i}

,

unde este $\{e_{1},...,e_{s}\}$ ${\ displaystyle \ {e_ {1}, ..., e_ {s} \}}$ $\ {e_ {1}, ..., e_ {s} \}$ este baza canonică pentru $\mathbb {R} ^{s}$ ${\ displaystyle \ mathbb {R} ^ {s}}$ ${\ mathbb {R}} ^ {s}$ , $e_{1}=(1,0,...,0)$ ${\ displaystyle e_ {1} = (1,0, ..., 0)}$ $e_ {1} = (1,0, ..., 0)$ , ..., $e_{s}=(0,...,0,1)$ ${\ displaystyle e_ {s} = (0, ..., 0,1)}$ $e_ {s} = (0, ..., 0,1)$ . Distribuția binomială descrie apoi variabila aleatorie $S=X_{1}+...+X_{n}$ ${\ displaystyle S = X_ {1} + ... + X_ {n}}$ $S = X_ {1} + ... + X_ {n}$ .

Şansă

Funcția de probabilitate a distribuției multinomiale a parametrilor $((p_{1},...,p_{s}),n)$ ${\ displaystyle ((p_ {1}, ..., p_ {s}), n)}$ $((p_ {1}, ..., p_ {s}), n)$ , cu $p_{1}+...+p_{s}=1$ ${\ displaystyle p_ {1} + ... + p_ {s} = 1}$ $p_ {1} + ... + p_ {s} = 1$ , Și

P(n_{1},...,n_{s})={\binom {n}{n_{1},...,n_{s}}}\prod _{i}p_{i}^{n_{i}}={\frac {n!}{n_{1}!\cdots n_{s}!}}p_{1}^{n_{1}}\cdots p_{s}^{n_{s}}

{\ displaystyle P (n_ {1}, ..., n_ {s}) = {\ binom {n} {n_ {1}, ..., n_ {s}}} \ prod _ {i} p_ { i} ^ {n_ {i}} = {\ frac {n!} {n_ {1}! \ cdots n_ {s}!}} p_ {1} ^ {n_ {1}} \ cdots p_ {s} ^ {n_ {s}}}

P (n_ {1}, ..., n_ {s}) = {\ binom {n} {n_ {1}, ..., n_ {s}}} \ prod _ {i} p_ {i} ^ {{n_ {i}}} = {\ frac {n!} {n_ {1}! \ cdots n_ {s}!}} p_ {1} ^ {{n_ {1}}} \ cdots p_ {s} ^ {{n_ {s}}}

pentru toate s -duplurile

(n_{1},...,n_{s})\in \{0,1,..,n\}^{s}

{\ displaystyle (n_ {1}, ..., n_ {s}) \ in \ {0,1, .., n \} ^ {s}}

(n_ {1}, ..., n_ {s}) \ in \ {0,1, .., n \} ^ {s}

cu

n_{1}+...+n_{s}=n

{\ displaystyle n_ {1} + ... + n_ {s} = n}

n_ {1} + ... + n_ {s} = n

.

Aici coeficientul multinomial $\textstyle {\binom {n}{n_{1},...,n_{s}}}$ ${\ displaystyle \ textstyle {\ binom {n} {n_ {1}, ..., n_ {s}}}}$ $\ textstyle {\ binom {n} {n_ {1}, ..., n_ {s}}}$ „contorizează” numărul de secvențe posibile cu $n_{1}$ ${\ displaystyle n_ {1}}$ $n_ {1}$ rezultate $x_{1}$ ${\ displaystyle x_ {1}}$ $x_1$ , $n_{2}$ ${\ displaystyle n_ {2}}$ $n_ {2}$ rezultate $x_{2}$ ${\ displaystyle x_ {2}}$ $x_2$ si asa mai departe. Produsul $\textstyle \prod _{i}p_{i}^{n_{i}}$ ${\ displaystyle \ textstyle \ prod _ {i} p_ {i} ^ {n_ {i}}}$ $\ textstyle \ prod _ {i} p_ {i} ^ {{n_ {i}}}$ dă probabilitatea fiecăreia dintre aceste secvențe.

Teorema multinomială arată că probabilitatea totală este egală cu 1:

\sum _{n_{1}+...+n_{s}=n}P(n_{1},...,n_{s})=(p_{1}+...+p_{n})^{n}=1^{n}=1

{\ displaystyle \ sum _ {n_ {1} + ... + n_ {s} = n} P (n_ {1}, ..., n_ {s}) = (p_ {1} + ... + p_ {n}) ^ {n} = 1 ^ {n} = 1}

\ sum _ {{n_ {1} + ... + n_ {s} = n}} P (n_ {1}, ..., n_ {s}) = (p_ {1} + ... + p_ {n}) ^ {n} = 1 ^ {n} = 1

.

Caracteristici

Caz binomial

Distribuția binomială a parametrilor $(p,n)$ ${\ displaystyle (p, n)}$ $(p, n)$ este o distribuție multinomială a parametrilor $((p,1-p),n)$ ${\ displaystyle ((p, 1-p), n)}$ $((p, 1-p), n)$ .

Dacă vectorul aleatoriu $S=(S_{1},...,S_{s})$ ${\ displaystyle S = (S_ {1}, ..., S_ {s})}$ $S = (S_ {1}, ..., S_ {s})$ urmează distribuția multinomială a parametrilor $((p_{1},...,p_{s}),n)$ ${\ displaystyle ((p_ {1}, ..., p_ {s}), n)}$ $((p_ {1}, ..., p_ {s}), n)$ apoi fiecare dintre coordonatele sale $S_{i}$ ${\ displaystyle S_ {i}}$ $Da}$ este o variabilă aleatorie care urmează distribuția binomială $(p_{i},n)$ ${\ displaystyle (p_ {i}, n)}$ $(p_ {i}, n)$ . Cu alte cuvinte, fiecare coordonată $the$ ${\ displaystyle i}$ $the$ ia în considerare „succesele” evenimentului $x_{i}$ ${\ displaystyle x_ {i}}$ $x_i$ .

Indici

Mulți dintre indicii obișnuiți ai unei distribuții pe $\mathbb {R}$ ${\ displaystyle \ mathbb {R}}$ $\ mathbb {R}$ nu se extind la cazul multidimensional.

Speranța matematică a vectorului aleatoriu $S.$ ${\ displaystyle S}$ $S.$ (definită ca suma ponderată a vectorilor posibili) pentru transformarea liniară are ca componente speranțele componentelor și este egală cu $n$ ${\ displaystyle n}$ $n$ ori speranța unei singure dovezi :

E[S]={\big (}E[S_{1}],...,E[S_{s}]{\big )}=nE[X]=n(p_{1},...,p_{s})=(np_{1},...,np_{s})

{\ displaystyle E [S] = {\ big (} E [S_ {1}], ..., E [S_ {s}] {\ big)} = nE [X] = n (p_ {1}, ..., p_ {s}) = (np_ {1}, ..., np_ {s})}

E [S] = {\ big (} E [S_ {1}], ..., E [S_ {s}] {\ big)} = nE [X] = n (p_ {1}, ... , p_ {s}) = (np_ {1}, ..., np_ {s})

.

Ca și în cazul binomial, matricea de covarianță a $S=(S_{1},...,S_{s})$ ${\ displaystyle S = (S_ {1}, ..., S_ {s})}$ $S = (S_ {1}, ..., S_ {s})$ (matricea $s\times s$ ${\ displaystyle s \ times s}$ $s \ times s$ cu elemente $m_{i,j}={\text{cov}}(S_{i},S_{j})$ ${\ displaystyle m_ {i, j} = {\ text {cov}} (S_ {i}, S_ {j})}$ $m _ {{i, j}} = {\ text {cov}} (S_ {i}, S_ {j})$ ) este egal cu $n$ ${\ displaystyle n}$ $n$ de ori matricea de covarianță a unui singur proces $X$ ${\ displaystyle X}$ $X$ , prin urmare este dat de

m_{i,i}=n\,{\text{Var}}(X_{i})=np_{i}(1-p_{i})

{\ displaystyle m_ {i, i} = n \, {\ text {Var}} (X_ {i}) = np_ {i} (1-p_ {i})}

m _ {{i, i}} = n \, {\ text {Var}} (X_ {i}) = np_ {i} (1-p_ {i})

m_{i,j}=n\,{\text{cov}}(X_{i},X_{j})=-np_{i}p_{j}

{\ displaystyle m_ {i, j} = n \, {\ text {cov}} (X_ {i}, X_ {j}) = - np_ {i} p_ {j}}

m _ {{i, j}} = n \, {\ text {cov}} (X_ {i}, X_ {j}) = - np_ {i} p_ {j}

de sine

i\neq j

{\ displaystyle i \ neq j}

i \ neq j

.

Distribuții conexe

În statisticile bayesiene, distribuția Dirichlet este un conjugat al distribuției multinomiale. Mai exact, dacă parametrul $(p_{1},...,p_{s})$ ${\ displaystyle (p_ {1}, ..., p_ {s})}$ $(p_ {1}, ..., p_ {s})$ a unei distribuții multinomiale urmează un parametru Dirichlet distribution $\alpha =(\alpha _{1},...,\alpha _{s})$ ${\ displaystyle \ alpha = (\ alpha _ {1}, ..., \ alpha _ {s})}$ $\ alpha = (\ alpha _ {1}, ..., \ alpha _ {s})$ apoi distribuirea sa condiționată de eveniment $S=\sigma =(n_{1},...,n_{s})$ ${\ displaystyle S = \ sigma = (n_ {1}, ..., n_ {s})}$ $S = \ sigma = (n_ {1}, ..., n_ {s})$ urmează din nou o distribuție Dirichlet, a parametrului $\alpha +\sigma =(\alpha _{1}+n_{1}+...+\alpha _{s}+n_{s})$ ${\ displaystyle \ alpha + \ sigma = (\ alpha _ {1} + n_ {1} + ... + \ alpha _ {s} + n_ {s})}$ $\ alpha + \ sigma = (\ alpha _ {1} + n_ {1} + ... + \ alpha _ {s} + n_ {s})$ . (Distribuția Dirichlet este generalizarea multivariată a distribuției Beta , care joacă același rol pentru distribuția binomială.)

Testul $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$ ajustarea poate fi descrisă pornind de la distribuția multinomială, deoarece pentru valorile "mari" ale $n$ ${\ displaystyle n}$ $n$ distribuția fiecărei componente $S_{i}$ ${\ displaystyle S_ {i}}$ $Da}$ ( centrat și redus ) este aproximat printr-o distribuție normală (standard).

Exemplu

Numărul de rezultate „1”, „2”, „3”, „4”, „5” și „6” pentru n aruncări ale unei matrițe echilibrate pe 6 fețe este descris de distribuția multinomială a parametrilor $(({\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}}),n)$ ${\ displaystyle (({\ tfrac {1} {6}}, {\ tfrac {1} {6}}, {\ tfrac {1} {6}}, {\ tfrac {1} {6}}, { \ tfrac {1} {6}}, {\ tfrac {1} {6}}), n)}$ $(({\ tfrac {1} {6}}, {\ tfrac {1} {6}}, {\ tfrac {1} {6}}, {\ tfrac {1} {6}}, {\ tfrac { 1} {6}}, {\ tfrac {1} {6}}), n)$ .

Un exemplu diferit este extragerea (cu reintroducere) a unei bile dintr-o urnă care conține bile de diferite culori. Pentru o urnă cu șase bile, dintre care una este verde, două albe și trei albastre, aveți parametrii $(p_{1},p_{2},p_{3})=({\tfrac {1}{6}},{\tfrac {1}{3}},{\tfrac {1}{2}})$ ${\ displaystyle (p_ {1}, p_ {2}, p_ {3}) = ({\ tfrac {1} {6}}, {\ tfrac {1} {3}}, {\ tfrac {1} { 2}})}$ $(p_ {1}, p_ {2}, p_ {3}) = ({\ tfrac {1} {6}}, {\ tfrac {1} {3}}, {\ tfrac {1} {2}} )$ ; rezultatul a cinci extracții (cu reintroducerea mingii extrase) este descris de distribuția multinomială a parametrilor $(({\tfrac {1}{6}},{\tfrac {1}{3}},{\tfrac {1}{2}}),5)$ ${\ displaystyle (({\ tfrac {1} {6}}, {\ tfrac {1} {3}}, {\ tfrac {1} {2}}), 5)}$ $(({\ tfrac {1} {6}}, {\ tfrac {1} {3}}, {\ tfrac {1} {2}}), 5)$ .
Pentru a calcula probabilitatea ca bila trasă să fie de două ori verde, o dată albă și de două ori albastră, calculați doar probabilitatea