Testul F

În statistici, testul F pentru compararea a două varianțe este un test de ipoteză bazat pe distribuția Fisher-Snedecor F și vizează testarea ipotezei că două populații care urmează ambele distribuții normale au aceeași varianță .

Metodă

Dacă populațiile X și Y respectă distribuțiile normale, respectiv ${\mathcal {N}}(\mu _{X},\sigma _{X}^{2})$ ${\ displaystyle {\ mathcal {N}} (\ mu _ {X}, \ sigma _ {X} ^ {2})}$ ${\ displaystyle {\ mathcal {N}} (\ mu _ {X}, \ sigma _ {X} ^ {2})}$ Și ${\mathcal {N}}(\mu _{Y},\sigma _{Y}^{2})$ ${\ displaystyle {\ mathcal {N}} (\ mu _ {Y}, \ sigma _ {Y} ^ {2})}$ ${\ displaystyle {\ mathcal {N}} (\ mu _ {Y}, \ sigma _ {Y} ^ {2})}$ , asa de

campionii $X_{1},X_{2},\ldots ,X_{n}$ ${\ displaystyle X_ {1}, X_ {2}, \ ldots, X_ {n}}$ ${\ displaystyle X_ {1}, X_ {2}, \ ldots, X_ {n}}$ Și $Y_{1},Y_{2},\ldots ,Y_{m}$ ${\ displaystyle Y_ {1}, Y_ {2}, \ ldots, Y_ {m}}$ ${\ displaystyle Y_ {1}, Y_ {2}, \ ldots, Y_ {m}}$ primul izonomic pentru X și al doilea isonomic pentru Y se presupune că sunt independenți;

estimatorii varianțelor observate $S_{X}^{2}$ ${\ displaystyle S_ {X} ^ {2}}$ ${\ displaystyle S_ {X} ^ {2}}$ Și $S_{Y}^{2}$ ${\ displaystyle S_ {Y} ^ {2}}$ ${\ displaystyle S_ {Y} ^ {2}}$ sunt variabile aleatoare independente;

variabilele aleatorii ${\tfrac {n-1}{\sigma _{X}^{2}}}S_{X}^{2}$ ${\ displaystyle {\ tfrac {n-1} {\ sigma _ {X} ^ {2}}} S_ {X} ^ {2}}$ ${\ displaystyle {\ tfrac {n-1} {\ sigma _ {X} ^ {2}}} S_ {X} ^ {2}}$ Și ${\tfrac {m-1}{\sigma _{Y}^{2}}}S_{Y}^{2}$ ${\ displaystyle {\ tfrac {m-1} {\ sigma _ {Y} ^ {2}}} S_ {Y} ^ {2}}$ ${\ displaystyle {\ tfrac {m-1} {\ sigma _ {Y} ^ {2}}} S_ {Y} ^ {2}}$ urmează respectiv distribuțiile chi-pătrat $\chi ^{2}(n-1)$ ${\ displaystyle \ chi ^ {2} (n-1)}$ ${\ displaystyle \ chi ^ {2} (n-1)}$ Și $\chi ^{2}(m-1)$ ${\ displaystyle \ chi ^ {2} (m-1)}$ ${\ displaystyle \ chi ^ {2} (m-1)}$ ;

raportul $F={\tfrac {\sigma _{Y}^{2}}{\sigma _{X}^{2}}}{\frac {S_{X}^{2}}{S_{Y}^{2}}}$ ${\ displaystyle F = {\ tfrac {\ sigma _ {Y} ^ {2}} {\ sigma _ {X} ^ {2}}} {\ frac {S_ {X} ^ {2}} {S_ {Y } ^ {2}}}}$ ${\ displaystyle F = {\ tfrac {\ sigma _ {Y} ^ {2}} {\ sigma _ {X} ^ {2}}} {\ frac {S_ {X} ^ {2}} {S_ {Y } ^ {2}}}}$ urmează distribuția Fisher-Snedecor ${\mathcal {F}}(n-1,m-1)$ ${\ displaystyle {\ mathcal {F}} (n-1, m-1)}$ ${\ displaystyle {\ mathcal {F}} (n-1, m-1)}$ .

Variabilă de decizie

Sub ipoteza $H_{0}=(\sigma _{X}^{2}=\sigma _{Y}^{2})$ ${\ displaystyle H_ {0} = (\ sigma _ {X} ^ {2} = \ sigma _ {Y} ^ {2})}$ ${\ displaystyle H_ {0} = (\ sigma _ {X} ^ {2} = \ sigma _ {Y} ^ {2})}$ , adică dacă cele două populații au aceeași varianță, atunci variabila aleatorie

F={\frac {S_{X}^{2}}{S_{Y}^{2}}}

{\ displaystyle F = {\ frac {S_ {X} ^ {2}} {S_ {Y} ^ {2}}}}

{\ displaystyle F = {\ frac {S_ {X} ^ {2}} {S_ {Y} ^ {2}}}}

urmează distribuția Fisher-Snedecor

{\mathcal {F}}(n-1,m-1)

{\ displaystyle {\ mathcal {F}} (n-1, m-1)}

{\ displaystyle {\ mathcal {F}} (n-1, m-1)}

parametrilor n-1 și m-1 , unde n și m sunt numerele celor două eșantioane.

Alegerea numărătorului nu influențează testul: sub ipoteza nulă variabila aleatorie $1/F$ ${\ displaystyle 1 / F}$ ${\ displaystyle 1 / F}$ urmează distribuția ${\mathcal {F}}(m-1,n-1)$ ${\ displaystyle {\ mathcal {F}} (m-1, n-1)}$ ${\ displaystyle {\ mathcal {F}} (m-1, n-1)}$ .

Testul

Ca regiune de acceptare, la nivelul de semnificație α, se ia intervalul dintre cuantilele ordinii ${\frac {\alpha }{2}}$ ${\ displaystyle {\ frac {\ alpha} {2}}}$ ${\ frac {\ alpha} {2}}$ Și $1-{\frac {\alpha }{2}}$ ${\ displaystyle 1 - {\ frac {\ alpha} {2}}}$ ${\ displaystyle 1 - {\ frac {\ alpha} {2}}}$ , în timp ce regiunea de respingere este cea exclusă:

{\mathcal {A}}=]f_{\frac {\alpha }{2}},f_{1-{\frac {\alpha }{2}}}[;\qquad {\mathcal {R}}=]0,f_{\frac {\alpha }{2}}[\ \cup \ ]f_{1-{\frac {\alpha }{2}}},\infty [

{\ displaystyle {\ mathcal {A}} =] f _ {\ frac {\ alpha} {2}}, f_ {1 - {\ frac {\ alpha} {2}}} [; \ qquad {\ mathcal { R}} =] 0, f _ {\ frac {\ alpha} {2}} [\ \ cup \] f_ {1 - {\ frac {\ alpha} {2}}}, \ infty [}

{\ displaystyle {\ mathcal {A}} =] f _ {\ frac {\ alpha} {2}}, f_ {1 - {\ frac {\ alpha} {2}}} [; \ qquad {\ mathcal { R}} =] 0, f _ {\ frac {\ alpha} {2}} [\ \ cup \] f_ {1 - {\ frac {\ alpha} {2}}}, \ infty [}

O valoare aparținând gamei $]0,f_{\frac {\alpha }{2}}[$ ${\ displaystyle] 0, f _ {\ frac {\ alpha} {2}} [}$ ${\ displaystyle] 0, f _ {\ frac {\ alpha} {2}} [}$ sugerează că varianța lui X este mai mică decât varianța lui Y , în timp ce o valoare aparținând intervalului $]f_{1-{\frac {\alpha }{2}}},\infty [$ ${\ displaystyle] f_ {1 - {\ frac {\ alpha} {2}}}, \ infty [}$ ${\ displaystyle] f_ {1 - {\ frac {\ alpha} {2}}}, \ infty [}$ sugerează inversul.

Econometrie

În multe cazuri, statistica F poate fi calculată cu un proces mai simplu:

F={\frac {\left({\frac {{\mbox{SSR}}_{1}-{\mbox{SSR}}_{2}}{p_{2}-p_{1}}}\right)}{\left({\frac {{\mbox{SSR}}_{2}}{n-p_{2}}}\right)}}

{\ displaystyle F = {\ frac {\ left ({\ frac {{\ mbox {SSR}} _ {1} - {\ mbox {SSR}} _ {2}} {p_ {2} -p_ {1} }} \ right)} {\ left ({\ frac {{\ mbox {SSR}} _ {2}} {n-p_ {2}}} \ right)}}}

{\ displaystyle F = {\ frac {\ left ({\ frac {{\ mbox {SSR}} _ {1} - {\ mbox {SSR}} _ {2}} {p_ {2} -p_ {1} }} \ right)} {\ left ({\ frac {{\ mbox {SSR}} _ {2}} {n-p_ {2}}} \ right)}}}

^[1]

unde SSR _i este suma pătratelor reziduale (Suma reziduurilor pătrate ) ale modelului i .

În econometrie se aplică și următoarea formulă de multiplicare a matricii :

F={\frac {(R{\hat {\beta }}-r)({\hat {RVar({\widehat {\beta }})R'}})^{-1}(R{\hat {\beta }}-r)}{q}}

{\ displaystyle F = {\ frac {(R {\ hat {\ beta}} - r) ({\ hat {RVar ({\ widehat {\ beta}}) R '}}) ^ {- 1} (R {\ hat {\ beta}} - r)} {q}}}

{\ displaystyle F = {\ frac {(R {\ hat {\ beta}} - r) ({\ hat {RVar ({\ widehat {\ beta}}) R '}}) ^ {- 1} (R {\ hat {\ beta}} - r)} {q}}}

unde este:

$R.$ ${\ displaystyle R}$ $R.$ este matricea constrângerilor;
$r$ ${\ displaystyle r}$ $r$ este parametrul egalității;
$({\hat {RVar({\widehat {\beta }})R'}})^{-1}$ ${\ displaystyle ({\ hat {RVar ({\ widehat {\ beta}}) R '}}) ^ {- 1}}$ ${\ displaystyle ({\ hat {RVar ({\ widehat {\ beta}}) R '}}) ^ {- 1}}$ este inversul matricei cu covarianțele ;
$q$ ${\ displaystyle q}$ $q$ este numărul de constrângeri ale $H_{0}$ ${\ displaystyle H_ {0}}$ $H_ {0}$ .

Instrumentele sunt de obicei relevante dacă F ≥ 10

Un tabel cu valorile critice ale testului F poate fi găsit aici .

Aplicarea la compararea diferitelor statistici $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$

În analiza datelor, testul F este frecvent utilizat pentru a compara rezultatele obținute cu două metode diferite și evaluate cu estimatorul $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$ . ^[2] Dacă aveți două variabile $\chi _{1}^{2}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ Și $\chi _{2}^{2}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ în urma distribuției de $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$ la $\nu _{1}$ ${\ displaystyle \ nu _ {1}}$ $\ nu _ {1}$ Și $\nu _{2}$ ${\ displaystyle \ nu _ {2}}$ $\ nu _ {2}$ grade de libertate, respectiv, putem construi variabila $f$ ${\ displaystyle f}$ $f$ :

$f={\frac {\chi _{1}^{2}/\nu _{1}}{\chi _{2}^{2}/\nu _{2}}}$ ${\ displaystyle f = {\ frac {\ chi _ {1} ^ {2} / \ nu _ {1}} {\ chi _ {2} ^ {2} / \ nu _ {2}}}}$ ${\ displaystyle f = {\ frac {\ chi _ {1} ^ {2} / \ nu _ {1}} {\ chi _ {2} ^ {2} / \ nu _ {2}}}}$

care va fi distribuit conform Distribuției F :

$p(f;\nu _{1},\nu _{2})={\frac {\Gamma [(\nu _{1}+\nu _{2})/2]}{\Gamma [\nu _{1}/2]\Gamma [\nu _{2}/2]}}\left({\frac {\nu _{1}}{\nu _{2}}}\right)^{\nu _{1}/2}{\frac {f^{1/2(\nu _{1}-2)}}{(1+f\nu _{1}/\nu _{2})^{1/2(\nu _{1}+\nu _{2})}}}\quad$ ${\ displaystyle p (f; \ nu _ {1}, \ nu _ {2}) = {\ frac {\ Gamma [(\ nu _ {1} + \ nu _ {2}) / 2]} {\ Gamma [\ nu _ {1} / 2] \ Gamma [\ nu _ {2} / 2]}} \ left ({\ frac {\ nu _ {1}} {\ nu _ {2}}} \ right ) ^ {\ nu _ {1} / 2} {\ frac {f ^ {1/2 (\ nu _ {1} -2)}} {(1 + f \ nu _ {1} / \ nu _ { 2}) ^ {1/2 (\ nu _ {1} + \ nu _ {2})}}} \ quad}$ ${\ displaystyle p (f; \ nu _ {1}, \ nu _ {2}) = {\ frac {\ Gamma [(\ nu _ {1} + \ nu _ {2}) / 2]} {\ Gamma [\ nu _ {1} / 2] \ Gamma [\ nu _ {2} / 2]}} \ left ({\ frac {\ nu _ {1}} {\ nu _ {2}}} \ right ) ^ {\ nu _ {1} / 2} {\ frac {f ^ {1/2 (\ nu _ {1} -2)}} {(1 + f \ nu _ {1} / \ nu _ { 2}) ^ {1/2 (\ nu _ {1} + \ nu _ {2})}}} \ quad}$ .

Pentru a înțelege dacă $\chi _{1}^{2}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ Și $\chi _{2}^{2}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ sunt consecvente, prin urmare, folosim integralul distribuției probabilității pentru $f$ ${\ displaystyle f}$ $f$ :

$P_{f}({f^{0};\nu _{1},\nu _{2}})=\int _{f^{0}}^{\infty }p(f,\nu _{1},\nu _{2})df$ ${\ displaystyle P_ {f} ({f ^ {0}; \ nu _ {1}, \ nu _ {2}}) = \ int _ {f ^ {0}} ^ {\ infty} p (f, \ nu _ {1}, \ nu _ {2}) df}$ ${\ displaystyle P_ {f} ({f ^ {0}; \ nu _ {1}, \ nu _ {2}}) = \ int _ {f ^ {0}} ^ {\ infty} p (f, \ nu _ {1}, \ nu _ {2}) df}$

unde este $f^{0}$ ${\ displaystyle f ^ {0}}$ ${\ displaystyle f ^ {0}}$ este valoarea specială a $f$ ${\ displaystyle f}$ $f$ obținut.

Valoarea a $P_{f}$ ${\ displaystyle P_ {f}}$ ${\ displaystyle P_ {f}}$ dă probabilitatea de a găsi o valoare de $f$ ${\ displaystyle f}$ $f$ egal cu $f^{0}$ ${\ displaystyle f ^ {0}}$ ${\ displaystyle f ^ {0}}$ sau mai mare din datele aleatorii dacă $\chi _{1}^{2}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ ${\ displaystyle \ chi _ {1} ^ {2}}$ Și $\chi _{2}^{2}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ ${\ displaystyle \ chi _ {2} ^ {2}}$ Sunt de acord.

De obicei testul F utilizat pentru i $\chi ^{2}$ ${\ displaystyle \ chi ^ {2}}$ $\ cine ^ {2}$ comparați două potriviri aplicate acelorași date pentru a înțelege dacă una este mai bună decât cealaltă. Dacă valoarea lui $P_{f}$ ${\ displaystyle P_ {f}}$ ${\ displaystyle P_ {f}}$ este mai mic decât nivelul de încredere ales (de exemplu, 5%), există o diferență semnificativă în bunătatea celor două potriviri.

Notă

^ GraphPad Software Inc, Cum funcționează testul F pentru a compara modelele , pe graphpad.com , GraphPad Software Inc, 2007/10/11.
^ Bevington, PR Robinson, DK - Reducerea datelor și analiza erorilor pentru științele fizice, Mc Graw Hill

linkuri externe

( EN ) Test F , în Encyclopedia Britannica , Encyclopædia Britannica, Inc.

Portalul de matematică

Portalul de statistici

[1] GraphPad Software Inc, Cum funcționează testul F pentru a compara modelele , pe graphpad.com , GraphPad Software Inc, 2007/10/11.

[2] Bevington, PR Robinson, DK - Reducerea datelor și analiza erorilor pentru științele fizice, Mc Graw Hill

[1]

[2]