Varianța

Exemplu de probe din două populații cu aceeași variație medie, dar diferite. Populația roșie are medie de 100 și 100 varianță (SD = 10), în timp ce populația albastră are medie de 100 și 2500 varianță (SD = 50).

În statistici și teoria probabilității, varianța unei variabile statistice sau o variabilă aleatoare $X$ ${\ displaystyle X}$ $X$ este o funcție , indicată cu $\sigma _{X}^{2}$ ${\ displaystyle \ sigma _ {X} ^ {2}}$ $\ Sigma _ {X} ^ {2}$ sau cu $\mathrm {Var} (X)$ ${\ Displaystyle \ mathrm {} Var (X)}$ ${\ Mathrm {Var}} (X)$ (Sau pur și simplu cu $\sigma ^{2}$ ${\ displaystyle \ sigma ^ {2}}$ $\ sigma ^ {2}$ dacă variabila este implicit), care oferă o măsură a variabilității valorilor asumate de variabila in sine; în mod specific, măsura a cât de mult se deosebesc quadratically din media aritmetică sau valoarea așteptată, respectiv $\mathbb {E} [X]$ ${\ displaystyle \ mathbb {E} [X]}$ ${\ Mathbb E} [X]$ .

Termenul „variație“ a fost introdus în 1918 de către Ronald Fisher și -a lungul timpului a înlocuit termenul „abaterea standard pătratică“ utilizat de Karl Pearson .

Şansă

Definiție

Varianța variabilei aleatoare $X$ ${\ displaystyle X}$ $X$ este definită ca valoarea așteptată a pătratului variabilei aleatoare centrate $X-\mathbb {E} [X]$ ${\ Displaystyle X \ mathbb {E} [X]}$ $X - {\ mathbb {E}} [X]$

\sigma _{X}^{2}=\mathbb {E} {\Big [}{\big (}X-\mathbb {E} [X]{\big )}^{2}{\Big ]}.

{\ Displaystyle \ sigma _ {X} ^ {2} = \ mathbb {E} {\ Big [} {\ mare (} X \ mathbb {E} [X] {\ mare)} ^ {2} {\ Mare]}.}

\ Sigma _ {X} ^ {2} = {\ mathbb {E}} {\ Big [} {\ mare (} X - {\ mathbb {E}} [X] {\ mare)} ^ {2} { \ Big]}.

Un exemplu de „măsură“ a abaterii unei variabile aleatoare de medie este dată de inegalitatea Čebyšëv care controlează această abatere în ceea ce privește abaterea standard:

P{\Big (}{\big |}X-\mathbb {E} [X]{\big |}\geqslant \lambda \sigma _{X}{\Big )}\leqslant {\frac {1}{\lambda ^{2}}},

{\ Displaystyle P {\ Big (} {\ mare |} X \ mathbb {E} [X] {\ mare |} \ geqslant \ lambda \ sigma _ {X} {\ Big)} \ leqslant {\ frac { 1} {\ lambda ^ {2}}}}

P {\ Big (} {\ mare |} X - {\ mathbb {E}} [X] {\ mare |} \ geqslant \ lambda \ sigma _ {X} {\ Big)} \ leqslant {\ frac {1 } {\ lambda ^ {2}}},

unde este $\sigma _{X}={\sqrt {\sigma _{X}^{2}}}$ ${\ Displaystyle \ sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}}$ $\ Sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}$

Proprietate

Semnul de varianță

Varianța unei variabile aleatoare nu este negativ, și este zero numai atunci când variabila aproape sigur presupune o singură valoare $x_{0}$ ${\ displaystyle x_ {0}}$ $x_0$ , adică dacă $P(X=x_{0})=1$ ${\ Displaystyle P (X = X_ {0}) = 1}$ $P (X = X_ {0}) = 1$ .

Maximă și minimă a varianței fixă valorile extreme ale distribuției

Având în vedere un set de $n$ ${\ displaystyle n}$ $n$ unități statistice, în cazul în care $\mathrm {min}$ ${\ Displaystyle \ mathrm {min}}$ ${\ Displaystyle \ mathrm {min}}$ Și $\mathrm {max}$ ${\ Displaystyle \ mathrm {max}}$ ${\ Displaystyle \ mathrm {max}}$ sunt valorile minime și maxime între unitățile, valoarea maximă pe care variația poate lua este egală cu

\sigma _{\mathrm {max} }^{2}={\frac {(\mathrm {max} -\mathrm {min} )^{2}}{4}}.

{\ Displaystyle \ sigma _ {\ mathrm {max}} ^ {2} = {\ frac {(\ mathrm {max} - \ mathrm {min}). ^ {2}} {4}}}

{\ Displaystyle \ sigma _ {\ mathrm {max}} ^ {2} = {\ frac {(\ mathrm {max} - \ mathrm {min}). ^ {2}} {4}}}

Dacă numai media este cunoscută a observațiilor $\mu$ ${\ displaystyle \ mu}$ $\ mu$ , Valoarea este egală

\sigma _{\mathrm {max} }^{2}=\mu ^{2}(n-1).

{\ Displaystyle \ sigma _ {\ mathrm {max}} ^ {2} = \ mu ^ {2} (n-1).}

{\ Displaystyle \ sigma _ {\ mathrm {max}} ^ {2} = \ mu ^ {2} (n-1).}

Exprimarea varianță ca diferența dintre momentul comenzii 2 și pătratul valorii așteptate

Același subiect în detaliu: formula computaționale pentru varianță .

O formulă alternativă pentru varianța este

\sigma _{X}^{2}=\mathbb {E} [X^{2}]-\mathbb {E} [X]^{2}\

{\ Displaystyle \ sigma _ {X} ^ {2} = \ mathbb {E} [X ^ {2}] - \ mathbb {E} [X] ^ {2} \}

\ Sigma _ {X} ^ {2} = {\ mathbb {E}} [X ^ {2}] - {\ mathbb {E}} [X] ^ {2} \

Această formulă este mai practic pentru calcularea varianței.

Demonstrație

Varianța $X$ ${\ displaystyle X}$ $X$ este prin definiție egală cu valoarea așteptată a

(X-\mathbb {E} [X])^{2}=X^{2}-2X\mathbb {E} [X]+\mathbb {E} [X]^{2}\

{\ Displaystyle (X \ mathbb {E} [X]) ^ {2} = X ^ {2} -2x \ mathbb {E} [X] + \ mathbb {E} [X] ^ {2} \}

(X - {\ mathbb {E}} [X]) ^ {2} = X ^ {2} -2x {\ mathbb {E}} [X] + {\ mathbb {E}} [X] ^ {2 } \

:

pentru liniaritatea a valorii așteptate se obține

\sigma _{X}^{2}=\mathbb {E} [X^{2}-2X\mathbb {E} [X]+\mathbb {E} [X]^{2}]=\mathbb {E} [X^{2}]-2\mathbb {E} [X]\mathbb {E} [X]+\mathbb {E} [X]^{2}=\mathbb {E} [X^{2}]-\mathbb {E} [X]^{2}\

{\ Displaystyle \ sigma _ {X} ^ {2} = \ mathbb {E} [X ^ {2} -2x \ mathbb {E} [X] + \ mathbb {E} [X] ^ {2}] = \ mathbb {E} [X ^ {2}] - 2 \ mathbb {E} [X] \ mathbb {E} [X] + \ mathbb {E} [X] ^ {2} = \ mathbb {E} [ X ^ {2}] - \ mathbb {E} [X] ^ {2} \}

\ Sigma _ {X} ^ {2} = {\ mathbb {E}} [X ^ {2} -2x {\ mathbb {E}} [X] + {\ mathbb {E}} [X] ^ {2 }] = {\ mathbb {E}} [X ^ {2}] - 2 {\ mathbb {E}} [X] {\ mathbb {E}} [X] + {\ mathbb {E}} [X] ^ {2} = {\ mathbb {E}} [X ^ {2}] - {\ mathbb {E}} [X] ^ {2} \

.

invarianta Traducere

Variația este traducerea invariant, care lasă distanțele față de medie fixă, și se schimbă quadratically de rescaling :

\sigma _{aX+b}^{2}=a^{2}\sigma _{X}^{2}\

{\ Displaystyle \ sigma _ {aX + b} ^ {2} = a ^ {2} \ sigma _ {X} ^ {2} \}

\ Sigma _ {{aX + b}} ^ {2} = a ^ {2} \ sigma _ {X} ^ {2} \

Demonstrație

Profitând de liniaritatea din valoarea așteptată este găsit

(aX+b)-\mathbb {E} [aX+b]=aX+b-a\mathbb {E} [X]-b=a(X-\mathbb {E} [X]),

{\ Displaystyle (aX + b) - \ mathbb {E} [aX + b] = aX + ba \ mathbb {E} [X] -b = a (X \ mathbb {E} [X]),}

(AX + b) - {\ mathbb {E}} [aX + b] = aX + ba {\ mathbb {E}} [X] -b = a (X - {\ mathbb {E}} [X]) .

asa de

\sigma _{aX+b}^{2}=\mathbb {E} [a^{2}(X-\mathbb {E} [X])^{2}]=a^{2}\sigma _{X}^{2}.

{\ Displaystyle \ sigma _ {aX + b} ^ {2} = \ mathbb {E} [a ^ {2} (X \ mathbb {E} [X]) ^ {2}] = a ^ {2} \ sigma _ {X} ^ {2}.}

\ Sigma _ {{aX + b}} ^ {2} = {\ mathbb {E}} [a ^ {2} (X - {\ mathbb {E}} [X]) ^ {2}] = a ^ {2} \ sigma _ {X} ^ {2}.

Varianța suma a două variabile independente

Variația sumei de două independente sau chiar necorelate variabile este egală cu suma varianțelor lor

\sigma _{X+Y}^{2}=\sigma _{X}^{2}+\sigma _{Y}^{2}.

{\ Displaystyle \ sigma _ {X + Y} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}.}

\ Sigma _ {{X + Y}} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}.

Demonstrație

De sine $\mathbb {E} [X]=\mathbb {E} [Y]=0$ ${\ Displaystyle \ mathbb {E} [X] = \ mathbb {E} [Y] = 0}$ ${\ Mathbb {E}} [X] = {\ mathbb {E}} [Y] = 0$ , asa de $\mathbb {E} [X+Y]=0$ ${\ Displaystyle \ mathbb {E} [X + Y] = 0}$ ${\ Displaystyle \ mathbb {E} [X + Y] = 0}$ Și

\sigma _{X+Y}^{2}=\mathbb {E} [(X+Y)^{2}]=\mathbb {E} [X^{2}]+2\mathbb {E} [XY]+\mathbb {E} [Y^{2}]=\sigma _{X}^{2}+\sigma _{Y}^{2}+2\mathbb {E} [XY],

{\ Displaystyle \ sigma _ {X + Y} ^ {2} = \ mathbb {E} [(X + Y) ^ {2}] = \ mathbb {E} [X ^ {2}] + 2 \ mathbb { E} [XY] + \ mathbb {E} [Y ^ {2}] = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} 2 \ mathbb {E} [XY] ,}

\ Sigma _ {{X + Y}} ^ {2} = {\ mathbb {E}} [(X + Y) ^ {2}] = {\ mathbb {E}} [X ^ {2}] + 2 {\ mathbb {E}} [XY] + {\ mathbb {E}} [Y ^ {2}] = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} 2 { \ mathbb {E}} [XY],

și din moment ce variabilele sunt independente se dovedește $\mathbb {E} [XY]=\mathbb {E} [X]\mathbb {E} [Y]=0.$ ${\ Displaystyle \ mathbb {E} [XY] = \ mathbb {E} [X] \ mathbb {E} [Y] = 0.}$ ${\ Mathbb {E}} [XY] = {\ mathbb {E}} [X] {\ mathbb {E}} [Y] = 0.$

În cazul general, este suficient să se traducă variabilele, astfel încât acestea să aibă o valoare nulă de așteptat (cum ar fi $X'=X-\mathbb {E} [X]$ ${\ Displaystyle X „= X \ mathbb {E} [X]}$ $X „= X - {\ mathbb {E}} [X]$ ); varianța lor nu se schimba, deoarece variația este invariantă de traducere.

Varianța a diferenței dintre cele două variabile independente

Folosind cele două declarații anterioare, putem spune că variația diferenței dintre două variabile independente este egală cu suma varianțelor lor

\sigma _{X-Y}^{2}=\sigma _{X+(-Y)}^{2}=\sigma _{X}^{2}+\sigma _{-Y}^{2}=\sigma _{X}^{2}+\sigma _{Y}^{2}.

{\ Displaystyle \ sigma _ {XY} ^ {2} = \ sigma _ {X + (- Y)} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {- Y} ^ { 2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}.}

\ Sigma _ {{XY}} ^ {2} = \ sigma _ {{X + (- Y)}} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {{- Y} } ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}.

Varianța suma a două variabile independente non-

De sine $X$ ${\ displaystyle X}$ $X$ Și $Da$ ${\ displaystyle Y}$ $Da$ nu sunt independente, formula este corectată prin lor de covarianță ,

\sigma _{X+Y}^{2}=\sigma _{X}^{2}+\sigma _{Y}^{2}+2\sigma _{X,Y},

{\ Displaystyle \ sigma _ {X + Y} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} +2 \ sigma _ {X, Y}}

\ Sigma _ {{X + Y}} ^ {2} = \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} +2 \ sigma _ {{X, Y}},

unde este

\sigma _{X,Y}=\mathbb {E} [XY]-\mathbb {E} [X]\mathbb {E} [Y].

{\ Displaystyle \ sigma _ {X, Y} = \ mathbb {E} [XY] - \ mathbb {E} [X] \ mathbb {E} [Y].}

\ Sigma _ {{X, Y}} = {\ mathbb {E}} [XY] - {\ mathbb {E}} [X] {\ mathbb {E}} [Y].

Varianța mediei aritmetice a variabilelor independente

În special, media aritmetică $\textstyle {\bar {X}}={\frac {X_{1}+\ldots +X_{n}}{n}}$ ${\ Displaystyle \ textstyle {\ bar {X}} = {\ frac {X_ {1} + \ ldots + X_ {n}} {n}}}$ $\ Textstyle {\ bar {X}} = {\ frac {X_ {1} + \ ldots + X_ {n}} {n}}$ din $n$ ${\ displaystyle n}$ $n$ variabile aleatoare independente având aceeași distribuție, are varianța aritmetică

\sigma _{\bar {X}}^{2}={\frac {1}{n^{2}}}\sigma _{X_{1}+\ldots +X_{n}}^{2}={\frac {1}{n}}\sigma _{X_{1}}^{2}.

{\ Displaystyle \ sigma _ {\ bar {X}} ^ {2} = {\ frac {1} {n ^ {2}}} \ sigma _ {X_ {1} + \ ldots + X_ {n}} ^ {2} = {\ frac {1} {n}} \ sigma _ {X_ {1}} ^ {2}.}

\ Sigma _ {{{\ bar {X}}}} ^ {2} = {\ frac {1} {n ^ {2}}} \ sigma _ {{X_ {1} + \ ldots + X_ {n} }} ^ {2} = {\ frac {1} {n}} \ sigma _ {{X_ {1}}} ^ {2}.

Discretă și variabile aleatoare continue

Varianța unei discrete variabile aleatoare $X$ ${\ displaystyle X}$ $X$ la valorile dintr-un set $LA$ ${\ displaystyle A}$ $LA$ este calculat prin intermediul acesteia funcție de probabilitate :

\mathbb {E} [X]=\sum _{x\in A}xP(X=x)

{\ Displaystyle \ mathbb {E} [X] = \ sum _ {x \ în A} xP (X = x)}

{\ Mathbb {E}} [X] = \ sum _ {{x \ în A}} xP (X = x)

\sigma _{X}^{2}=\sum _{x\in A}(x-\mathbb {E} [X])^{2}P(X=x).

{\ Displaystyle \ sigma _ {X} ^ {2} = \ sum _ {x \ în A} (x- \ mathbb {E} [X]) ^ {2} P (X = x).}

\ Sigma _ {X} ^ {2} = \ sum _ {{x \ în A}} (x - {\ mathbb {E}} [X]) ^ {2} P (X = x).

Varianța unei variabile aleatoare continuă $X$ ${\ displaystyle X}$ $X$ la valorile dintr-un set $LA$ ${\ displaystyle A}$ $LA$ se calculează prin intermediul său de densitate de probabilitate :

\mathbb {E} [X]=\int _{A}xf(x)dx

{\ Displaystyle \ mathbb {E} [X] = \ int _ {A} xf (x) dx}

{\ Mathbb {E}} [X] = \ int _ {A} xf (x) dx

\sigma _{X}^{2}=\int _{A}(x-\mathbb {E} [X])^{2}f(x)dx.

{\ Displaystyle \ sigma _ {X} ^ {2} = \ int _ {A} (x- \ mathbb {E} [X]) ^ {2} f (x) dx.}

\ Sigma _ {X} ^ {2} = \ int _ {A} (x - {\ mathbb {E}} [X]) ^ {2} f (x) dx.

Exemplu

O Bernoulli variabilă aleatoare $X$ ${\ displaystyle X}$ $X$ , Adică, care are probabilitatea $p$ ${\ displaystyle p}$ $p$ pentru a da „1“ și probabilitate $q=1-p$ ${\ displaystyle q = 1-p}$ $q = 1-p$ la alimentarea cu „0“, are o valoare de așteptat

\mathbb {E} [X]=0\cdot P(X=0)+1\cdot P(X=1)=P(X=1)=p,

{\ Displaystyle \ mathbb {E} [X] = 0 \ cdot P (X = 0) +1 \ cdot P (X = 1) = P (X = 1) = p,}

{\ Mathbb {E}} [X] = 0 \ cdot P (X = 0) +1 \ cdot P (X = 1) = P (X = 1) = p,

și variația acestuia poate fi calculată ca

\sigma _{X}^{2}=\mathbb {E} [(X-\mathbb {E} [X])^{2}]=\mathbb {E} [(X-p)^{2}]=p^{2}P(X=0)+q^{2}P(X=1)=pq(p+q)=pq,

{\ Displaystyle \ sigma _ {X} ^ {2} = \ mathbb {E} [(X \ mathbb {E} [X]) ^ {2}] = \ mathbb {E} [(Xp) ^ {2 }] = p ^ {2} p (X = 0) + q ^ {2} p (X = 1) = pq (p + q) = pq,}

\ Sigma _ {X} ^ {2} = {\ mathbb {E}} [(X - {\ mathbb {E}} [X]) ^ {2}] = {\ mathbb {E}} [(Xp) ^ {2}] = p ^ {2} p (X = 0) + q ^ {2} p (X = 1) = pq (p + q) = pq,

sau cum

\sigma _{X}^{2}=\mathbb {E} [X^{2}]-\mathbb {E} [X]^{2}=P(X=1)-p^{2}=p(1-p)=pq.

{\ Displaystyle \ sigma _ {X} ^ {2} = \ mathbb {E} [X ^ {2}] - \ mathbb {E} [X] ^ {2} = P (X = 1) -p ^ { 2} = p (1-p) = pq.}

\ Sigma _ {X} ^ {2} = {\ mathbb {E}} [X ^ {2}] - {\ mathbb {E}} [X] ^ {2} = P (X = 1) -p ^ {2} = p (1-p) = pq.

Statistici

În statistica , varianța este un indice de variabilitate . Având în vedere o distribuție a unui cantitativă caracter $X$ ${\ displaystyle X}$ $X$ dintr - o populație de $n$ ${\ displaystyle n}$ $n$ elemente, variația este media aritmetică a pătratul distanțelor valorilor de la media lor

\sigma _{X}^{2}={\frac {\sum _{i}(x_{i}-\mu _{X})^{2}}{n}},

{\ Displaystyle \ sigma _ {X} ^ {2} = {\ frac {\ sum _ {i} (X_ {i} - \ mu _ {X}) ^ {2}} {n}}}

\ Sigma _ {X} ^ {2} = {\ frac {\ sum _ {i} (X_ {i} - \ mu _ {X}) ^ {2}} {n}},

unde este $\textstyle \mu _{X}={\frac {\sum _{i}x_{i}}{n}}$ ${\ Displaystyle \ textstyle \ mu _ {X} = {\ frac {\ sum _ {i} X_ {i}} {n}}}$ $\ Textstyle \ mu _ {X} = {\ frac {\ sum _ {i} X_ {i}} {n}}$ este media aritmetică a $X$ ${\ displaystyle X}$ $X$ .

Dacă aveți distribuția de frecvență a unui caracter , puteți calcula mai ușor varianța folosind următoarea formulă:

\sigma _{X}^{2}={\frac {1}{n}}\sum _{j=1}^{K}(x_{j}-\mu _{X})^{2}n_{j}

{\ Displaystyle \ sigma _ {X} ^ {2} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {K} (X_ {j} - \ mu _ {X}) ^ {2} n_ {j}}

{\ Displaystyle \ sigma _ {X} ^ {2} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {K} (X_ {j} - \ mu _ {X}) ^ {2} n_ {j}}

unde este $K.$ ${\ displaystyle K}$ $K.$ reprezintă numărul de moduri în care caracterul x apare, în timp ce $x_{j}$ ${\ Displaystyle X_ {j}}$ $x_j$ Și $n_{j}$ ${\ Displaystyle n_ {j}}$ $n_ {j}$ sunt respectiv j- modalitatea de x și relativă frecvența absolută .

Pornind de la formula anterioară, amintindu-ne că $n_{j}/n=f_{j}$ ${\ Displaystyle n_ {j} / n = f_ {j}}$ ${\ Displaystyle n_ {j} / n = f_ {j}}$ , Vom obține, de asemenea:

\sigma _{X}^{2}=\sum _{j=1}^{K}(x_{j}-\mu _{X})^{2}f_{j}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ sum _ {j = 1} ^ {K} (X_ {j} - \ mu _ {X}) ^ {2} f_ {j}}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ sum _ {j = 1} ^ {K} (X_ {j} - \ mu _ {X}) ^ {2} f_ {j}}

unde este $f_{j}$ ${\ Displaystyle f_ {j}}$ $f_ {j}$ este frecvența relativă a modalității-j - lea.

În cele din urmă, există o formulă simplificată pentru calcularea varianța:

\sigma _{X}^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}x_{i}^{2}\right)-\mu _{X}^{2}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ stânga ({\ frac {1} {n}} \ sum _ {i = 1} ^ {n} X_ {i} ^ {2} \ dreapta) - \ mu _ {X} ^ {2}}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ stânga ({\ frac {1} {n}} \ sum _ {i = 1} ^ {n} X_ {i} ^ {2} \ dreapta) - \ mu _ {X} ^ {2}}

Formulele care corespund cel anterior care utilizează frecvențele absolute și relative sunt:

\sigma _{X}^{2}={\frac {1}{n}}\sum _{j=1}^{K}x_{j}^{2}n_{j}-\mu _{X}^{2}

{\ Displaystyle \ sigma _ {X} ^ {2} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {k} X_ {j} ^ {2} n_ {j} - \ mu _ {X} ^ {2}}

{\ Displaystyle \ sigma _ {X} ^ {2} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {k} X_ {j} ^ {2} n_ {j} - \ mu _ {X} ^ {2}}

\sigma _{X}^{2}=\sum _{j=1}^{K}x_{j}^{2}f_{j}-\mu _{X}^{2}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ sum _ {j = 1} ^ {k} X_ {j} ^ {2} f_ {j} - \ mu _ {X} ^ {2}}

{\ Displaystyle \ sigma _ {X} ^ {2} = \ sum _ {j = 1} ^ {k} X_ {j} ^ {2} f_ {j} - \ mu _ {X} ^ {2}}

Defectul a varianței este acela de a nu avea aceeași unitate de măsură ca și valorile analizate (dacă, de exemplu, acestea sunt în cm, varianța va fi în cm ^2), prin urmare , în statisticile rădăcina pătrată a varianței este de asemenea folosit foarte des, și anume abaterea standard (sau abaterea standard sau abaterea standard) $\sigma _{X}={\sqrt {\sigma _{X}^{2}}}$ ${\ Displaystyle \ sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}}$ $\ Sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}$ . Cu referire la această notație, variația este, prin urmare, de asemenea, indicat ca $\sigma ^{2}$ ${\ displaystyle \ sigma ^ {2}}$ $\ sigma ^ {2}$ .

Estimatori

În statistici , două estimatori sunt de obicei utilizate pentru varianța pe un eșantion de cardinalitate $n$ ${\ displaystyle n}$ $n$ :

S_{n}^{2}={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n}}\quad

{\ S_ displaystyle {n} ^ {2} = {\ frac {\ sum _ {i = 1} ^ {n} (X_ {i} - {\ bar {x}}) ^ {2}} {n} } \ Quad}

S_ {n} ^ {2} = {\ frac {\ sum _ {{i = 1}} ^ {n} (X_ {i} - {\ bar {x}}) ^ {2}} {n}} \ Quad

Și

\quad S_{n-1}^{2}={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n-1}},

{\ Displaystyle \ quad S_ {n-1} ^ {2} = {\ frac {\ sum _ {i = 1} ^ {n} (X_ {i} - {\ bar {x}}) ^ {2} } {n-1}}}

\ Quad S _ {{n-1}} ^ {2} = {\ frac {\ sum _ {{i = 1}} ^ {n} (X_ {i} - {\ bar {x}}) ^ { 2}} {n-1}},

unde este $\textstyle {\bar {x}}={\frac {x_{1}+\ldots +x_{n}}{n}}$ ${\ Displaystyle \ textstyle {\ bar {x}} = {\ frac {X_ {1} + \ ldots + X_ {n}} {n}}}$ $\ Textstyle {\ bar {x}} = {\ frac {X_ {1} + \ ldots + X_ {n}} {n}}$ este proba medie . Primul se numește variația probei, în timp ce al doilea se numește variația probei corectă datorită proprietății sale de corectitudine . Într-adevăr, estimatorul $S_{n-1}^{2}$ ${\ displaystyle S_ {n-1} ^ {2}}$ $S _ {{n-1}} ^ {2}$ este distortion- liber, adică ei valoare de așteptat este tocmai varianța:

\mathbb {E} [S_{n-1}^{2}]=\sigma ^{2}(X)

{\ Displaystyle \ mathbb {E} [S_ {n-1} ^ {2}] = \ sigma ^ {2} (X)}

{\ Mathbb {E}} [S _ {{n-1}} ^ {2}] = \ sigma ^ {2} (X)

.

Demonstrație

{\begin{aligned}\operatorname {\mathbb {E} } [S_{n-1}^{2}]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}~-~{\overline {x}})^{2}\right]\\[8pt]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}^{2}~-~2x_{i}{\overline {x}}+{\overline {x}}^{2})\right]\\[8pt]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\left(\sum _{i=1}^{n}x_{i}^{2}~-~2{\overline {x}}\sum _{i=1}^{n}x_{i}+n{\overline {x}}^{2}\right)\right]\\[8pt]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\left(\sum _{i=1}^{n}x_{i}^{2}~-~2n{\overline {x}}^{2}+n{\overline {x}}^{2}\right)\right]\\[8pt]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\left(\sum _{i=1}^{n}x_{i}^{2}~-~n{\overline {x}}^{2}\right)\right]\\[8pt]&=\operatorname {\mathbb {E} } \left[{\frac {1}{n-1}}\sum _{i=1}^{n}x_{i}^{2}~-~{\frac {n}{n-1}}{\overline {x}}^{2}\right]\\[8pt]&={\frac {1}{n-1}}\left(\sum \operatorname {\mathbb {E} } [x_{i}^{2}]~-~n\operatorname {\mathbb {E} } [{\overline {x}}^{2}]\right)\\[8pt]&={\frac {1}{n-1}}\left(n\operatorname {\mathbb {E} } [x^{2}]~-~n\operatorname {\mathbb {E} } [{\overline {x}}^{2}]\right)\\[8pt]&={\frac {n}{n-1}}\left(\sigma ^{2}(x)+\operatorname {\mathbb {E} } [x]^{2}~-~\sigma ^{2}({\overline {x}})-\operatorname {\mathbb {E} } [{\overline {x}}]^{2}\right)\\[8pt]&={\frac {n}{n-1}}\left(\sigma ^{2}(x)+\mu ^{2}~-~{\frac {1}{n}}\sigma ^{2}(x)-\mu ^{2}\right)\\[8pt]&={\frac {n}{n-1}}\left({\frac {n-1}{n}}~\sigma ^{2}(x)\right)\\[8pt]&=\sigma ^{2}.\end{aligned}}

{\ Displaystyle {\ begin {aliniat} \ operatorname {\ mathbb {E}} [S_ {n-1} ^ {2}] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} ~ - ~ {\ overline {x}}) ^ {2} \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} ^ {2} ~ - ~ 2x_ {i} {\ overline {x}} + {\ overline {x}} ^ {2}) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n -1}} \ stânga (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ 2 {\ overline {x}} \ sum _ {i = 1} ^ {n} X_ {i} + n {\ overline {x}} ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n -1}} \ stânga (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ 2n {\ overline {x}} ^ {2} + n {\ overline {x} } ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1} \

din

stânga} (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ n {\ overline {x}} ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E }} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ {\ frac {n} {n-1 }} {\ overline {x}} ^ {2} \ right] \\ [8pt] & = {\ frac {1} {n-1 \

la

stânga}} (\ sum \ operatorname {\ mathbb {E}} [ X_ {i} ^ {2}] ~ - ~ n \ operatorname {\ mathbb {E}} [{\ overl INE {x}} ^ {2}] \ dreapta) \\ [8pt] & = {\ frac {1} {n-1}} \ stânga (n \ operatorname {\ mathbb {E}} [x ^ {2 }] ~ - ~ n \ operatorname {\ mathbb {E}} [{\ overline {x}} ^ {2}] \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga (\ sigma ^ {2} (x) {\ mathbb {E}} [x] ^ ~ {2} + \ operatorname - ~ \ sigma ^ ({\ overline {x}}) {2} - \ operatorname {\ mathbb {E}} [{\ overline {x}}] ^ {2} \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga (\ sigma ^ {2 } (x) + \ mu ^ {2} ~ - ~ {\ frac {1} {n}} \ sigma ^ {2} (x) - \ mu ^ {2} \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga ({\ frac {n-1} {n}} ~ \ sigma ^ {2} (x) \ dreapta) \\ [8pt] & = \ sigma ^ {2}. \ end {aliniat}}}

{\ Displaystyle {\ begin {aliniat} \ operatorname {\ mathbb {E}} [S_ {n-1} ^ {2}] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} ~ - ~ {\ overline {x}}) ^ {2} \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} ^ {2} ~ - ~ 2x_ {i} {\ overline {x}} + {\ overline {x}} ^ {2}) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n -1}} \ stânga (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ 2 {\ overline {x}} \ sum _ {i = 1} ^ {n} X_ {i} + n {\ overline {x}} ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n -1}} \ stânga (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ 2n {\ overline {x}} ^ {2} + n {\ overline {x} } ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E}} \ stânga [{\ frac {1} {n-1} \ din stânga} (\ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ n {\ overline {x}} ^ {2} \ dreapta) \ right] \\ [8pt] & = \ operatorname {\ mathbb {E }} \ stânga [{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} X_ {i} ^ {2} ~ - ~ {\ frac {n} {n-1 }} {\ overline {x}} ^ {2} \ right] \\ [8pt] & = {\ frac {1} {n-1 \ la stânga}} (\ sum \ operatorname {\ mathbb {E}} [ X_ {i} ^ {2}] ~ - ~ n \ operatorname {\ mathbb {E}} [{\ overl INE {x}} ^ {2}] \ dreapta) \\ [8pt] & = {\ frac {1} {n-1}} \ stânga (n \ operatorname {\ mathbb {E}} [x ^ {2 }] ~ - ~ n \ operatorname {\ mathbb {E}} [{\ overline {x}} ^ {2}] \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga (\ sigma ^ {2} (x) {\ mathbb {E}} [x] ^ ~ {2} + \ operatorname - ~ \ sigma ^ ({\ overline {x}}) {2} - \ operatorname {\ mathbb {E}} [{\ overline {x}}] ^ {2} \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga (\ sigma ^ {2 } (x) + \ mu ^ {2} ~ - ~ {\ frac {1} {n}} \ sigma ^ {2} (x) - \ mu ^ {2} \ dreapta) \\ [8pt] & = {\ frac {n} {n-1}} \ stânga ({\ frac {n-1} {n}} ~ \ sigma ^ {2} (x) \ dreapta) \\ [8pt] & = \ sigma ^ {2}. \ end {aliniat}}}

Dimpotrivă, estimatorul $S_{n}^{2}$ ${\ displaystyle S_ {n} ^ {2}}$ $S _ {{n}} ^ {2}$ are o valoare de așteptat, altele decât varianța, $\mathbb {E} [S_{n}^{2}]=\textstyle {\frac {n-1}{n}}\sigma ^{2}(X)$ ${\ Displaystyle \ mathbb {E} [S_ {n} ^ {2}] = \ textstyle {\ frac {n-1} {n}} \ sigma ^ {2} (X)}$ ${\ Mathbb {E}} [S_ {n} ^ {2}] = \ textstyle {\ frac {n-1} {n}} \ sigma ^ {2} (X)$ .

O explicație a termenului $n-1$ ${\ Displaystyle n-1}$ $n-1$ este dată de necesitatea de a estima, de asemenea, media, care, pentru teorema limită centrală, are varianța 1 / n. În cazul în care media este cunoscut, estimatorul $S_{n}^{2}$ ${\ displaystyle S_ {n} ^ {2}}$ $S _ {{n}} ^ {2}$ devine corectă. Aceasta se numește „corecție Bessel“.

În cazul în care $X_{i}$ ${\ displaystyle X_ {i}}$ $X_i$ acestea suntvariabile aleatoare normale $N(\mu ,\sigma )$ ${\ displaystyle N (\ mu, \ sigma)}$ $N (\ mu, \ sigma)$ , Estimatorul $S_{n-1}^{2}$ ${\ displaystyle S_ {n-1} ^ {2}}$ $S _ {{n-1}} ^ {2}$ este o variabilă aleatoare cu distribuție $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$ .

Exemplu

Eșantionul de $n=5$ ${\ displaystyle n = 5}$ $n = 5$ elemente $\{-4,-1,1,2,7\}$ ${\ Displaystyle \ {- 4, -1,1,2,7 \}}$ $\ {- 4, -1,1,2,7 \}$ are o probă medie egală cu:

{\bar {x}}={\frac {-4-1+1+2+7}{5}}=1

{\ Displaystyle {\ bar {x}} = {\ frac {+ 1 + -4-1 2 + 7} {5}} = 1}

{\ Bar {x}} = {\ frac {+ 1 + -4-1 2 + 7} {5}} = 1

și estimatori varianța dețin respectiv

S_{n}^{2}={\frac {(-4-1)^{2}+(-1-1)^{2}+(1-1)^{2}+(2-1)^{2}+(7-1)^{2}}{5}}={\frac {25+4+0+1+36}{5}}={\frac {66}{5}}=13,2

{\ Displaystyle S_ {n} ^ {2} = {\ frac {(-4-1) ^ {2} + (- 1-1) ^ {2} + (1-1) ^ {2} + (2 -1) ^ {2} + (7-1) ^ {2}} {5}} = {\ frac {4 + 25 + 0 + 1 + 36} {5}} = {\ frac {66} {5 }} =} 13,2

S_ {n} ^ {2} = {\ frac {(-4-1) ^ {2} + (- 1-1) ^ {2} + (1-1) ^ {2} + (2-1) ^ {2} + (7-1) ^ {2}} {5}} = {\ frac {4 + 25 + 0 + 1 + 36} {5}} = {\ frac {66} {5}} = 13.2

Și

S_{n-1}^{2}={\frac {66}{5-1}}=16,5.

{\ S_ displaystyle {n-1} ^ {2} = {\ frac {66} {5-1}} = 16.5.}

S _ {{n-1}} ^ {2} = {\ frac {66} {5-1}} = 16,5.

Elemente conexe

Alte proiecte

Wikimedia Commons conține imagini sau alte fișiere de pe varianță

linkuri externe

(RO) Varianța , în Enciclopedia Britannica , Encyclopaedia Britannica, Inc.
(RO) IUPAC aur de carte, "variație" , pe goldbook.iupac.org.

Controlul autorității	Thesaurus BNCF 22052 · GND (DE) 4078739-4 · NDL (RO, JA) 00561029

Portalul de matematică

Portal de știință și tehnologie

Portalul de statistici

V · D · M Statistici
Statisticile descriptive	Medii ( aritmetice · geometrice · armonioase · Putere · aritmetice și geometrice · Integrale ) · Mediană · Modă · interval de variație · varianță · Deviație standard · deviație absolută medie · Simetrie · Diferență medie ( absolută · logaritmică ) · Curtosi
Inferință statistică	Test de testare a ipotezei · Semnificație · Ipoteză nulă / alternativă · Eroare I și tip II · Test Q · U test · Test t · Z Test · Probabilitate maximă · Standardizare · valoare p · Analiza variației
Analiza supraviețuirii	Rată de eșec · Estimator Kaplan-Meier · test log-rank
Analiza regresiei	Regresie liniară · Regresie neliniară · variabile instrumentale · metodă generalizată a momentelor · Regresie logistică · Model probit · Model logit

V · D · M Concepte fundamentale de metrologie, statistici și metodologie de cercetare
Definiții de bază	Măsurarea Probabilitate Măsurarea fizică proprietate fizică Cantitatea Parametru statistice Populația adevărata valoare Exemplu de măsurare Precizie Precizia Repetabilitatea Reproductibilitatea Semnificația Toleranță Sensibilitate Rezoluție ( Lateral Rezoluție ) Homoskedasticity Heteroskedasticity statistice Ipoteză · Nul ipoteza · Apropierea · semnificativă figura · variabilă aleatoare · Normalizarea · Standardizare
Eroare de manipulare	Măsurarea incertitudinii de măsurare de eroare sistematică eroare statistică de eroare Sensibilitate eroare de rezultate fals negative fals pozitive absolută de eroare de eroare relativă Eroare de propagare Bias
Minimizarea erorilor	Analitică Blank Calibrare Calibrare Raport semnal zgomot Interlaboratoare de comparare a datelor de calitate Outlier
Prelevarea de probe	Prelevarea de probe de spațiu statistic de eșantionare Plan de eșantionare Motivat Cota de eșantionare de eșantionare de eșantionare aleatorie ( sistematică de eșantionare stratificată de eșantionare Cluster de eșantionare multietajată de eșantionare ) de eșantionare probabilistă
Parametrii de variație	Varianța · Covarianță · Standard Abaterea · Devianță · Intervalul dinamic · Coeficient de variație
Test	Ipoteză Testarea ( parametrică test · neparametrică test ) · Interval de încredere · Valoarea p