Testează t

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Testul t (sau, din engleză , testul t ) este un test statistic parametric cu scopul de a verifica dacă valoarea medie a unei distribuții diferă semnificativ de o anumită valoare de referință. Diferă de testul z prin faptul că varianța este necunoscut.

Testul t al studentului pentru testarea ipotezelor pe o valoare medie

Dacă varianța populației nu este cunoscută, testul ipotezei asupra mediei populației se efectuează prin substituirea varianței universului cu estimarea sa obținută din estimatorul de varianță corectat prin eșantion:

În acest fel, statistica testului este:

a cărui distribuție este cea a de Student cu grade de libertate . Cu toate acestea, pe măsură ce gradele de libertate cresc, prin teorema limitei centrale , variabila aleatorie tinde spre distribuție normală și deci spre puteți înlocui de obicei pentru un prag de eșantion mai mare de 30. Dacă testul este bidirecțional, va respinge ipoteza nulă dacă empiric este mai mare decât teoretic de cu vor fi acceptate gradele de libertate și ipoteza alternativă cu o eroare din I specii.

Statistici în econometrie are următoarea formă:

Exemplu în R

Folosind limbajul de programare R și software-ul RStudio, vrem să verificăm dacă venitul mediu al familiei bărbaților din SUA (variabila coninc) este mai mare decât cel al femeilor. Setul de date utilizat a fost obținut prin „General Social Surveys”, un chestionar trimis persoanelor intervievate în vârstă de 18 ani sau peste care vorbeau engleza în Statele Unite ale Americii. În total, au fost 57.061 de interviuri reprezentând mai puțin de 10% din populația americană. Aceste interviuri au fost realizate între 1972 și 2014 și fiecare conține 114 variabile, dintre care unele sunt numerice, iar altele categorice. Analiza efectuată este observațională și nu experimentală, prin urmare nu este posibil să se stabilească relații aleatorii între variabile.

Fiecare observație din grupul masculin nu are o potrivire specială cu exact o observație din grupul feminin, astfel încât datele nu sunt asociate. Dimensiunile eșantionului sunt 25146 pentru bărbați și 31915 pentru femei, deci sunt foarte mari. Ne putem relaxa la cerința unei distribuții aproape normale și putem folosi distribuția t, deși fiecare dintre cele 2 distribuții este puternic părtinitoare.

 bibliotecă (statsr)
 
 g <- GSS%>%
  filtru (! is.na (sex)! is.na (Coninc))

 inferență ( y = coninc , x = sex , date = g , statistic = "medie" , tip = "ht" , nul = 0 ,
          alternativ = „mai mare“, metoda = „teoretică“)
Variabilă de răspuns: numerică
Variabilă explicativă: categorică (2 niveluri) 
n_Male = 23043, y_bar_Male = 48763.6453, s_Male = 36916.3394
n_Female = 28189, y_bar_Female = 41020.2199, s_Female = 34728.8358
H0: mu_Male = mu_Female
HA: mu_Male> mu_Female
t = 24,2541, df = 23042
p_value = <0,0001

Respingem ipoteza nulă H0 deoarece p_value <0,05. Datele oferă dovezi puternice că venitul gospodăriei raportat de bărbații din SUA este mai mare decât cel raportat de femeile din SUA.

Elemente conexe

linkuri externe

Controlul autorității GND ( DE ) 4420602-1
Statistici Portal de statistici : accesați intrările Wikipedia care se ocupă de statistici