De la Wikipedia, enciclopedia liberă.
Legea varianței totale este o teoremă a teoriei probabilității , care afirmă că dacă {\ displaystyle x} Și {\ displaystyle y} sunt variabile aleatorii definite pe același spațiu de probabilitate și varianța lui {\ displaystyle x} s-a terminat, atunci:
- {\ displaystyle \ \ sigma ^ {2} (x) = \ mathbb {E} [\ sigma ^ {2} (x | y)] + \ sigma ^ {2} (\ mathbb {E} [x | y] )}}
unde este {\ displaystyle \ mathbb {E} [x | y]} este așteptarea condiționată a lui x și {\ displaystyle \ sigma ^ {2} (x | y)} varianța condițională, adică:
- {\ displaystyle \ \ sigma ^ {2} (x | y) = \ mathbb {E} [(x- \ mathbb {E} [x | y]) ^ {2} | y]}
Din punctul de vedere al statisticii, mai degrabă decât al teoriei probabilității , primul termen se numește componenta inexplicabilă a varianței totale , iar al doilea este componenta explicată ; această terminologie sugestivă este legată de analiza modelului liniar și, în special , de coeficientul de determinare sau R².
Demonstrație
Legea varianței totale poate fi dovedită imediat prin exploatarea legii așteptărilor iterate , după cum urmează.
- {\ displaystyle \ \ sigma ^ {2} (x) = \ mathbb {E} [x ^ {2}] - (\ mathbb {E} [x]) ^ {2} =}
- {\ displaystyle \ = \ mathbb {E} [\ mathbb {E} [x ^ {2} | y]] - (\ mathbb {E} [E [x | y]]) ^ {2} =}
- {\ displaystyle \ = \ mathbb {E} [\ sigma ^ {2} (x | y)] + \ mathbb {E} [(\ mathbb {E} [x | y]) ^ {2}] - (\ mathbb {E} [E [x | y]]) ^ {2} =}
- {\ displaystyle \ = \ mathbb {E} [\ sigma ^ {2} (x | y)] + \ sigma ^ {2} (E [x | y])}
Relația cu modelul liniar
Legea varianței totale are o relație importantă cu modelul de regresie liniară . În cazul univariat, modelul liniar poate fi declarat ca:
- {\ displaystyle \ \ mathbb {E} [x | y] = \ alpha + \ beta y}
În acest caz, raportul de covarianță :
- {\ displaystyle \ \ beta = {\ frac {\ sigma (y, x)} {\ sigma ^ {2} (y)}}}
Dar apoi, componenta explicată a varianței totale nu este altceva decât:
- {\ displaystyle \ \ sigma ^ {2} (\ mathbb {E} [x | y]) = \ beta ^ {2} \ sigma ^ {2} (y) = {\ frac {\ sigma ^ {2} ( y, x)} {\ sigma ^ {2} (y)}}}
astfel încât relația dintre expresia de mai sus și {\ displaystyle \ \ sigma ^ {2} (x)} este pătratul coeficientului de corelație dintre {\ displaystyle \ x} Și {\ displaystyle \ y} :
- {\ displaystyle \ rho ^ {2} (y, x) = {\ frac {\ sigma ^ {2} (\ mathbb {E} [x | y])} {\ sigma ^ {2} (x)}} = {\ frac {\ sigma ^ {2} (y, x)} {\ sigma ^ {2} (y) \ sigma ^ {2} (x)}}}
Această cantitate corespunde efectiv coeficientului de determinare R². Este posibil să se obțină o relație analogă în cazul multivariat.
Extensii la momentele de ordin superior
Există relații analoage cu legea varianței totale și legea așteptărilor iterate pentru momentele centrale de ordin superior. De exemplu, cu referire la momentul central al comenzii 3, avem:
- {\ displaystyle \ \ mu _ {3} (x) = \ mathbb {E} [\ mu _ {3} (x | y)] + \ mu _ {3} (\ mathbb {E} [x | y] ) +3 \ sigma (\ mathbb {E} [x | y], \ sigma ^ {2} (x | y))}
Elemente conexe