Distribuția t a studentului

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
distribuție de Student
Funcția densității probabilității
Funcția densității probabilității
Funcția de distribuție
Funcția de distribuție
Parametrii ( grade de libertate )
A sustine
Funcția de densitate
Funcția de distribuție


unde este este funcția beta

Valorea estimata de sine
nedefinit altfel
Median
Modă
Varianța de sine
altfel infinit
Indicele de asimetrie de sine
nedefinit altfel
Curios de sine
altfel infinit
Entropie

unde este este funcția digamă și este funcția beta

Funcția caracteristică [1]

unde este este o funcție Bessel

În teoria probabilității distribuția lui Student , sau t-ul lui Student , este o distribuție continuă a probabilității care guvernează relația dintre două variabile aleatorii , prima cu o distribuție normală și a doua, pătrată, urmând o distribuție chi-pătrată .

Această distribuție intervine în estimarea mediei unei populații care urmează distribuției normale și este utilizată în testul t al Studentului omonim pentru semnificație și pentru fiecare interval de încredere al diferenței dintre două medii .

fundal

Distribuția a fost descrisă în 1908 de William Sealy Gosset , care și-a publicat rezultatul sub pseudonimul „Student” deoarece fabrica de bere Guinness unde era angajat interzicea angajaților săi să publice articole, astfel încât să nu divulge secretele producției. Numele distribuției studentului a fost introdus ulterior de Ronald Fisher . [2] [3]

Definiție

Distribuția Student cu parametru ( grade de libertate ) guvernează variabila aleatorie

unde este Și sunt două variabile aleatoare independente care respectă distribuția normală standard și distribuția chi-pătrat cu grade de libertate.

Estimatori

Media și varianța a unei populații poate fi estimat printr-un eșantion de elemente, cu estimatori

Să presupunem variabilele aleatorii care alcătuiesc eșantionul sunt independente și distribuite în mod normal , atunci este o variabilă normală cu valoarea așteptată și varianță . Prin urmare variabila atât de definit

va urma o distribuție normală standard, . Problema este că adesea nu se știe , prin urmare va trebui să avem de-a face cu un estimator al varianței cum ar fi .

Vom demonstra că următoarea variabilă aleatorie

urmează o distribuție chi-pătrat cu grade de libertate, .

Cele două variabile aleatorii Și sunt independenți , conform teoremei lui Cochran .

Prin urmare, variabila aleatorie este definită

Această variabilă aleatorie urmează o distribuție de probabilitate numită "Student's t".

Găsiți distribuția t

Să începem prin a demonstra asta este o variabilă aleatorie chi-pătrat. Reamintim că o distribuție este o anumită variabilă gamma definită după cum urmează

Unde este este funcția Euler Gamma definită ca cu

O variabilă chi-pătrat cu grade de libertate se obține prin adăugare variabile normale standard pătrat. Acestea fiind spuse, să începem cu definiția varianței eșantionului și să adunăm și să scădem în argumentul însumării , valoarea așteptată a variabilei aleatorii care coincide cu cea a variabilei aleatorii .

Să definim parametrii Și ca și rescrieți formula anterioară

Acum putem explica explicit din rezumări toți termenii care nu depind de , adică Și

știind că suma pe toate este egal cu . Acum împărțind stânga și dreapta la ajungem în dreapta variabilelor normale

Prin urmare, am obținut în stânga o variabilă cu care am indicat anterior , în timp ce în dreapta avem sume ale variabilelor normale standard pătrate, care coincid cu o variabilă chi la pătrat cu grade de libertate și o altă variabilă normală, de asemenea, pătrată standard, adică o variabilă chi-pătrat cu un singur grad de libertate. Știind că sume de variabile chi-pătrate cu Și grade de libertate încă corespund unei variabile chi-pătrat cu grade de libertate obținem că funcția densității probabilității de este chi-pătrat cu grade de libertate.

Prin urmare, acum să începem să spunem asta

unde este este numărul de grade de libertate și asta

Cunoscută variabila aleatorie , de fapt, este redus la un parametru multiplicativ pentru normal. Din definiția probabilității condiționale pe care o avem

unde este

este o distribuție chi-pătrat cu grade de libertate. Prin urmare

Observăm că funcția de distribuție dorită nu este altceva decât o funcție marginală a , de aceea avem

Plasând o substituție cu argumentul exponențial, dar menținându-l negativ

noi obținem

integralul definit are ca rezultat funcția Euler Gamma în sine

Prin urmare, obținem rezultatul nostru în cele din urmă

Observăm că limita acestei secvențe de funcții este pentru Și

Știind că prima limită are ca rezultat iar al doilea tinde să .

În practică, luând o populație mare foarte mare, variabila aleatorie t tinde să fie un standard normal.

Caracteristici

Distribuția elevului cu gradele de libertate sunt simetrice , deoarece distribuția normală standard este, în timp ce distribuția chi-pătrat care acționează ca un „parametru aleatoriu la scară” nu produce efecte de distorsiune ale acestei simetrii.

Funcția sa de densitate a probabilității este

,

unde este funcția beta .

Funcția sa de distribuție este

unde este este funcția beta incompletă regularizată cu

Pentru momentele (simple sau centrale, deoarece coincid pentru un pdf simetric) de ordine de distribuție sunt

de sine e ciudat,
de sine este chiar.

În special, pe lângă speranța matematică și indicele de asimetrie (pentru ) prezis de simetria distribuției, găsim:

  • varianța pentru
  • indicele kurtosis pentru

În cele din urmă, să luăm în considerare un ultim parametru, FWHM , care este lățimea la jumătatea înălțimii. Pentru o variabilă de Student avem că vârful funcției este în valoarea sa așteptată, adică în, în care distribuția are valoare maximă . Deci găsim valorile pentru care presupune înălțime egală cu jumătate din maximul absolut.

Pentru care

care echivalează cu unde este are două soluții, așa cum ne-am așteptat de la simetria funcției, coincizând a

Deci lățimea la jumătate de înălțime a funcției este dată de

Rularea limitei pentru găsim o expresie convergentă a

care este echivalentul FWHM al standardului normal. Viceversa pt obținem un FWHM = 2. De fapt pentru distribuția Student t coincide cu o distribuție a parametrilor Lorentz-Cauchy unde FWHM este exact egal cu .

Statistici

Interval de încredere

Distribuția Student este utilizată pentru a defini intervalele de încredere pentru media unei populații, pe baza estimatorilor de puncte Și media și varianța acestuia. Din ecuație

intr-adevar

.

Prin urmare, alegerea cuantilelor pentru distribuirea elevilor cu grade de libertate, da

,

adică un interval de încredere pentru medie cu nivel de încredere Și:

.

Dacă sunt luate în considerare intervale simetrice, se poate utiliza indicele definit de

,

adică

,

și obținem intervalul de încredere pentru cu nivel de încredere

.

Alte distribuții

Distribuția Student cu parametru corespunde distribuției Cauchy a parametrilor : ambele reglează raportul între două variabile aleatoare independente cu distribuție normală standard.

Deoarece n tinde spre infinit, distribuția Student cu n grade de libertate converge la distribuția normală standard .

De sine este o variabilă aleatorie cu distribuția t Student ca parametru , asa de urmează distribuția parametrilor Fisher-Snedecor .

Masa cuantilă

Următorul tabel [4] exprimă, în funcție de parametrul n (rând) și valorile particulare ale (coloană), cuantilele pentru distribuția Student a parametrului n :

.

Ultima linie, notată cu „∞”, se referă la o distribuție normală standard.

n \ α 0,90 0,95 0,975 0,99 0,995 0,9975 0,999 0,9995
1 3,078 6.314 12.706 31,821 63.657 127,321 318.309 636.619
2 1,886 2.920 4.303 6,965 9,925 14.089 22.327 31.599
3 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 1,533 2.132 2,776 3,747 4.604 5.598 7.173 8.610
5 1,476 2.015 2.571 3.365 4.032 4.773 5.893 6,869
6 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 1.415 1,895 2.365 2.998 3.499 4.029 4.785 5.408
8 1,397 1,860 2.306 2.896 3.355 3.833 4.501 5.041
9 1,383 1,833 2.262 2.821 3.250 3,690 4.297 4.781
10 1,372 1.812 2.228 2.764 3.169 3,581 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 3,497 4.025 4.437
12 1,356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3,372 3,852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.326 3,787 4.140
15 1,341 1,753 2.131 2.602 2.947 3.286 3.733 4.073
16 1.337 1.746 2.120 2,583 2.921 3.252 3,686 4.015
17 1.333 1.740 2.110 2,567 2.898 3.222 3,646 3,965
18 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3,922
19 1.328 1.729 2.093 2.539 2.861 3.174 3,579 3,883
20 1.325 1,725 2.086 2.528 2.845 3.153 3,552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.135 3,527 3.819
22 1.321 1.717 2,074 2.508 2.819 3.119 3.505 3,792
23 1.319 1.714 2.069 2.500 2.807 3.104 3,485 3,768
24 1.318 1.711 2.064 2.492 2,797 3.091 3.467 3,745
25 1.316 1,708 2.060 2.485 2,787 3,078 3.450 3,725
26 1.315 1,706 2.056 2,479 2,779 3,067 3.435 3.707
27 1.314 1,703 2.052 2.473 2,771 3.057 3.421 3,690
28 1.313 1,701 2.048 2.467 2.763 3.047 3.408 3,674
29 1.311 1.699 2.045 2.462 2.756 3.038 3,396 3.659
30 1.310 1,697 2.042 2.457 2.750 3.030 3,385 3,646
40 1.303 1,684 2.021 2.423 2.704 2.971 3.307 3,551
50 1.299 1,676 2.009 2.403 2,678 2.937 3.261 3,496
60 1.296 1,671 2.000 2.390 2.660 2,915 3.232 3.460
100 1.290 1.660 1.984 2,364 2.626 2.871 3.174 3.390
1.282 1.645 1.960 2.326 2,576 2.807 3.090 3.291

Notă

  1. ^ ( EN ) Simon Hurst, The Characteristic Function of the Student-t Distribution , in Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95 (archiviato dall' url originale il 18 febbraio 2010) .
  2. ^ ( EN ) Student ( William Sealy Gosset ), The probable error of a mean ( PDF ), in Biometrika , vol. 6, n. 1, marzo 1908, pp. 1–-25, DOI : 10.1093/biomet/6.1.1 .
  3. ^ ( EN ) Ronald Fisher , Applications of "Student's" distribution ( PDF ), in Metron , vol. 5, 1925, pp. 90-–104 (archiviato dall' url originale il 13 aprile 2011) .
  4. ^ Valori critici calcolati con la funzione qt(p,g) di R .

Voci correlate

Altri progetti

Collegamenti esterni

Matematica Portale Matematica : accedi alle voci di Wikipedia che trattano di matematica