Formula computațională pentru varianță

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În teoria probabilității și statisticile , există mai multe formule de calcul pentru varianță care fac posibilă obținerea varianței unei variabile aleatorii . Utilitatea lor depinde de ceea ce se știe deja despre variabila aleatorie; de exemplu, o variabilă aleatorie poate fi definită în funcție de funcția sa de densitate a probabilității sau prin construcție din alte variabile aleatoare. În acest context, intenționăm să obținem expresii algebrice pentru varianța teoretică a unei variabile aleatorii, spre deosebire de întrebările de estimare a varianței unei populații din datele eșantionului pentru care există considerații speciale pentru implementarea algoritmilor de calcul .

În ceea ce privește momentele de origine zero

Dacă momentele de origine zero E ( X ) și E ( X 2 ) ale unei variabile aleatoare X sunt cunoscute (unde E ( X ) este valoarea așteptată a lui X ), atunci Var ( X ) este dat de

Rezultatul se numește formula König - Huygens din literatura franceză [1] și este cunoscută sub numele de teorema de traducere a lui Steiner în Germania . [2]

Există o formulă corespunzătoare de utilizat pentru estimarea varianței din datele eșantionului, care poate fi utilă în calculele manuale. Este o identitate strâns legată, care este structurată pentru a crea o estimare fără părtiniri a varianței populației

Cu toate acestea, utilizarea acestor formule poate fi inconvenientă în practică atunci când se utilizează aritmetica în virgulă mobilă cu precizie limitată: scăderea dintre două valori de o amploare similară poate duce la anularea catastrofală [3] și, astfel, poate provoca o pierdere a sensului atunci când . Există alți algoritmi de varianță stabili numeric pentru utilizare cu aritmetică în virgulă mobilă.

Demonstrație

Formula de calcul pentru varianța populației urmează direct din proprietatea de liniaritate a valorilor așteptate și definiția varianței:

Dovadă pentru estimarea varianței

Generalizare pentru covarianță

Această formulă poate fi generalizată pentru covarianță , cu două variabile aleatorii X i și X j :

precum și pentru matricea covarianțelor n cu n a unui vector aleatoriu de lungime n :

și pentru matricea covarianțelor încrucișate n pentru m între doi vectori aleatori de lungimi n și m :

unde așteptările sunt luate element cu element e Și sunt vectori aleatori cu lungimile respective n și m .

Rețineți că această formulă suferă de aceeași pierdere de semnificație pe care o suferă formula varianței atunci când este utilizată pentru a calcula estimările covarianței.

Notă

  1. ^ În franceză: formule de Koenig - Huygens. A se vedea, de exemplu, Jean-Jacques Martiano, Maths: prépas commerciales , Studyrama, 2006, p. 148, ISBN 978-2-84472-828-9 .
  2. ^ În germană: Verschiebungssatz von Steiner. A se vedea, de exemplu, Gerd Christoph și Horst Hackel, Starthilfe Stochastik: Studium , Springer, 2013, p. 50, ISBN 978-3-322-84799-7 . .
  3. ^ Donald E. Knuth (1998). The Art of Computer Programming , volumul 2: Seminumerical Algorithms , ed. A III-a, P. 232. Boston: Addison-Wesley.

Elemente conexe