Varianța

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Notă despre dezambiguizare.svg Dezambiguizare - Dacă sunteți în căutarea gradului de libertate în termodinamică, consultați Gradul de libertate (chimie) .
Exemplu de probe din două populații cu aceeași medie, dar diferență diferită.
Exemplu de probe din două populații cu aceeași medie, dar diferență diferită. Populația roșie are media 100 și varianța 100 (SD = 10), în timp ce populația albastră are media 100 și varianța 2500 (SD = 50).

În statistică și teoria probabilității, varianța unei variabile statistice sau a unei variabile aleatorii este o funcție , indicată cu sau cu (sau pur și simplu cu dacă variabila este implicită), care oferă o măsură a variabilității valorilor asumate de variabila însăși; în mod specific, măsura în care acestea diferă în mod cvadrat de media aritmetică sau respectiv de valoarea așteptată .

Termenul „varianță” a fost introdus în 1918 de Ronald Fisher și, în timp, a înlocuit termenul „deviație standard pătratică” folosit de Karl Pearson .

Şansă

Definiție

Varianța variabilei aleatorii este definită ca valoarea așteptată a pătratului variabilei aleatorii centrate

Un exemplu de „măsură” a abaterii unei variabile aleatorii de la medie este dat de inegalitatea Čebyšëv care controlează această abatere în ceea ce privește abaterea standard:

unde este

Proprietate

Semn de varianță

Varianța unei variabile aleatorii nu este niciodată negativă și este zero doar atunci când variabila își asumă aproape sigur o singură valoare , adică dacă .

Maximul și minimul varianței au stabilit valorile extreme ale distribuției

Având în vedere un set de unități statistice, unde Și sunt valorile minime și maxime dintre unități, valoarea maximă pe care o poate lua varianța este egală cu

Dacă se cunoaște numai media observațiilor , valoarea este egală cu

Expresia varianței ca diferență între momentul de ordine 2 și pătratul valorii așteptate

Pictogramă lupă mgx2.svg Același subiect în detaliu: Formula computațională pentru varianță .

O formulă alternativă pentru varianță este

Această formulă este mai practică pentru calcularea varianței.

Demonstrație

Varianța este prin definiție egală cu valoarea așteptată a

:

pentru liniaritatea valorii așteptate se obține

.

Invarianța traducerii

Varianța este invariantă de traducere , care lasă distanțele față de media fixă ​​și se modifică în mod cvadrat prin redimensionarea :

Demonstrație

Se profită de liniaritatea valorii așteptate

asa de

Varianța sumei a două variabile independente

Varianța sumei a două variabile independente sau chiar necorelate este egală cu suma variațiilor lor

Demonstrație

De sine , asa de Și

și din moment ce variabilele sunt independente se dovedește

În cazul general, este suficient să se traducă variabilele astfel încât să aibă o valoare nulă așteptată (cum ar fi ); varianța lor nu se modifică deoarece varianța este invariantă de traducere.

Variația diferenței dintre două variabile independente

Folosind cele două afirmații anterioare, putem spune că varianța diferenței dintre două variabile independente este egală cu suma variațiilor lor

Varianța sumei a două variabile neindependente

De sine Și nu sunt independenți, formula este corectată prin covarianța lor,

unde este

Varianța mediei aritmetice a variabilelor independente

În special, media aritmetică din variabilele aleatoare independente având aceeași distribuție, au varianță aritmetică

Variabile aleatorii discrete și continue

Varianța unei variabile aleatorii discrete la valorile dintr-un set este calculat prin funcția sa de probabilitate :

Varianța unei variabile aleatoare continuă la valorile dintr-un set se calculează prin densitatea sa de probabilitate :

Exemplu

O variabilă aleatorie Bernoulli , adică care are probabilitate pentru a da „1” și probabilitate pentru a furniza „0”, are o valoare așteptată

iar varianța sa poate fi calculată ca

sau cum

Statistici

În statistici , varianța este un indice de variabilitate . Având în vedere o distribuție cu caracter cantitativ dintr-o populație de elemente, varianța este media aritmetică a pătratului distanțelor valorilor față de media lor

unde este este media aritmetică a .

Dacă aveți distribuția frecvenței unui caracter , puteți calcula mai ușor varianța folosind următoarea formulă:

unde este reprezintă numărul de moduri în care apare caracterul x , în timp ce Și sunt respectiv modalitatea j-a lui x și frecvența absolută relativă.

Începând de la formula anterioară, amintindu-mi asta , primim și:

unde este este frecvența relativă a modalității j-th.

În cele din urmă, există o formulă simplificată pentru calcularea varianței:

Formulele corespunzătoare celei anterioare care utilizează frecvențele absolute și relative sunt:

Defectul varianței este acela de a nu avea aceeași unitate de măsură ca valorile analizate (dacă, de exemplu, acestea sunt în cm, varianța va fi în cm 2 ), prin urmare în statistici rădăcina pătrată a varianței este de asemenea foarte des folosit și anume abaterea standard (sau abaterea standard sau abaterea standard) . Cu referire la această notație, varianța este, prin urmare, indicată și ca .

Estimatori

În statistici , doi estimatori sunt de obicei folosiți pentru varianța unui eșantion de cardinalitate :

Și

unde este este media eșantionului. Primul se numește varianța eșantionului , în timp ce al doilea se numește varianța eșantionului corect datorită proprietății sale de corectitudine . Într-adevăr, estimatorul este fără distorsiuni , adică valoarea sa așteptată este tocmai varianța:

.
Demonstrație

Dimpotrivă, estimatorul are o valoare așteptată alta decât varianța, .

O explicație a termenului este dată de necesitatea de a estima și media care pentru teorema limitei centrale are varianța 1 / n. Dacă media este cunoscută, estimatorul devine corect. Aceasta se numește „corectare Bessel”.

Dacă suntvariabile aleatorii normale , estimatorul este o variabilă aleatorie cu distribuție .

Exemplu

Eșantionul de elemente are o probă medie egală cu:

și, respectiv, estimatorii de varianță dețin

Și

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 22052 · GND (DE) 4078739-4 · NDL (EN, JA) 00.561.029