Semnificaţie

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În statistici , semnificația este posibilitatea relevantă ca o anumită valoare să apară. De asemenea, este denumit statistic diferit de zero ; acest lucru nu înseamnă că „semnificația” este relevantă sau vastă, deoarece cuvântul l-ar determina pe cineva să gândească. Dar este doar diferit de numărul limită.

Nivelul de semnificație

Pictogramă lupă mgx2.svg Același subiect în detaliu: Nivelul de semnificație .

Nivelul de semnificație al unui test este de obicei dat de un test al testului de ipoteză . În cel mai simplu caz este definit ca probabilitatea de a accepta sau respinge ipoteza nulă.

Folosiți în practică

Nivelurile de semnificație sunt de obicei reprezentate cu litera greacă α (alfa). Cele mai utilizate niveluri sunt 5% (α = 0,05) și 1% (α = 0,01); în cazul ipotezelor cu caracter predominant exploratoriu, se obișnuiește să se utilizeze un nivel de semnificație de 10% (α = 0,1). Dacă testul ipotezei dă o valoare p mai mică decât nivelul α, ipoteza nulă este respinsă. Aceste rezultate sunt raportate informal ca „semnificative statistic”. De exemplu, dacă se susține că există o singură șansă dintr-o mie ca acest lucru să se întâmple prin coincidență, se utilizează un nivel de semnificație de 0,1%. Cu cât nivelul de semnificație este mai mic, cu atât sunt mai mari dovezile. În unele situații este convenabil să se exprime semnificația statistică cu 1 - α. În general, atunci când interpretăm o semnificație stabilită, trebuie să fim atenți la indicarea a ceea ce a fost testat statistic.

Diferite niveluri de α au avantaje și dezavantaje diferite. Nivelurile α mai scăzute oferă o încredere mai mare în determinarea semnificației, dar prezintă un risc mai mare de eroare de a nu respinge o ipoteză nulă falsă (o eroare de tip II sau o determinare negativă falsă ) și, astfel, au o putere statistică mai mare. Selectarea unui nivel α implică inevitabil un compromis între semnificație și putere și, în consecință, între eroarea de tip I și eroarea de tip II .

În unele domenii, de exemplu în fizica nucleară și a particulelor, semnificația statistică este exprimată în unități de „σ” (sigma), abaterea standard a unei distribuții gaussiene . O semnificație statistică a „ "poate fi convertit la o valoare α utilizând funcția de eroare :

Utilizarea lui σ este motivată de omniprezența distribuției gaussiene în măsurarea incertitudinilor. De exemplu, dacă o teorie prezice că un parametru are o valoare, de exemplu 100, iar la o măsurătoare indică faptul că parametrul este 100 ± 3, atunci măsurarea trebuie raportată ca o abatere de 3σ față de prognoza teoretică. în termeni de α, această situație este echivalentă cu a spune că presupunând că teoria este adevărată, posibilitatea de a obține că rezultatul experimental coincide este de 0,27% (din moment ce 1 - erf (3 / √2) = 0,0027). Nivelurile de semnificație fixe, precum cele menționate mai jos, pot fi considerate utile în analizele exploratorii de date. Cu toate acestea, statisticile moderne sunt de părere că acolo unde rezultatul unui test este în esență rezultatul final al unui experiment sau al altui studiu, valoarea p trebuie luată în considerare în mod explicit. Mai mult, și este important, trebuie să ne gândim dacă și cum valoarea p este semnificativă sau nu. Acest lucru vă oferă acces la maximum de informații care trebuie transferate dintr-un rezumat al studiului în metaanalize .

Capcane

O concepție greșită obișnuită este că un rezultat semnificativ statistic are întotdeauna o semnificație practică sau demonstrează un efect mare asupra populației. Din păcate, această problemă este întâlnită pe scară largă în scrierile științifice. Având în vedere un eșantion suficient de mare, de exemplu, se poate constata că diferențele extrem de mici și invizibile sunt semnificative statistic, dar semnificația statistică nu spune nimic despre o semnificație practică a unei diferențe.

Una dintre cele mai frecvente probleme în testarea semnificației este tendința comparațiilor multiple de a tinde spre diferențe false false chiar și atunci când ipoteza nulă este adevărată. De exemplu, într-un studiu de douăzeci de comparații, utilizând un nivel α de 5%, o comparație poate produce efectiv un rezultat semnificativ, în ciuda faptului că ipoteza nulității este adevărată. în aceste cazuri, valorile p sunt corectate pentru a verifica fie valoarea falsă, fie eroarea familiară .

O problemă suplimentară este că analizele frecventiste ale valorilor p sunt considerate a exagera „ semnificația statistică ”. [1] [2] Pentru detalii, consultați factorul Bayes .

J. Scott Armstrong, în articolele „Testele de semnificație, dăunează progresul în prognoză” [3] și „Testele de semnificație statistică sunt inutile chiar și atunci când sunt efectuate corespunzător” [4] își expune poziția că, în unele cazuri, chiar dacă sunt efectuate corect, testele de semnificație statistică nu ar fi utile. În opinia sa, o serie de încercări nu au reușit să găsească dovezi empirice care să susțină utilizarea testelor de semnificație, iar testele statistice de semnificație utilizate singure ar putea fi în detrimentul dezvoltării cunoștințelor științifice, deoarece ar distrage cercetătorii de la utilizarea metodelor statistice în unele cazuri. mai potrivit. Prin urmare, Armstrong sugerează că el crede că cercetătorii ar trebui să evite testele de semnificație statistică și ar trebui să folosească mai degrabă instrumente pentru zona de efect , intervalele de încredere , repetări / extensii și meta-analize .

Conceptualizarea semnificației în domeniul zgomotului și semnalului

Semnificația statistică poate fi considerată ca încrederea pe care o avem într-un rezultat dat. Într-un studiu comparativ, depinde de diferența relativă dintre grupurile comparate, cantitatea măsurătorilor și zgomotul asociat cu măsurătorile. Cu alte cuvinte, încrederea că un rezultat dat este non-aleatoriu (adică nu este o consecință a întâmplării ) depinde de raportul semnal-zgomot (SNR) și de măsurarea eșantionului. Exprimată matematic, încrederea că un rezultat nu este aleatoriu este dată de următoarea formulă Sackett: [5]

Pentru claritate, formula de mai sus este reprezentată tabelar mai jos.

Dependența de încredere cu zgomotul, semnalul și măsurarea eșantionului (formă tabelară)

Parametru Parametru crescător Parametru descendent
Zgomot Scăderea încrederii Creșterea încrederii
Semnal Creșterea încrederii Scăderea încrederii
Măsurarea probei Creșterea încrederii Scăderea încrederii

În cuvinte, dependența unui trust este mai mare dacă zgomotul este redus sau măsurarea eșantionului este mare sau amplitudinea efectivă (a semnalului) este mare. Încrederea unui rezultat (și intervalul de încredere asociat) nu depinde numai de efectele amplitudinii reale a semnalului. Dacă măsurarea eșantionului este mare și zgomotul este mic, o amplitudine eficientă a semnalului poate fi măsurată cu mare încredere. Deși o magnitudine reală este considerată importantă, aceasta depinde în contextul evenimentelor comparative.

În medicină, amplitudinile eficiente mici (reflectate de creșteri mici ale riscului) sunt adesea considerate relevante din punct de vedere clinic și sunt frecvent utilizate pentru a ghida deciziile de tratament (dacă există o mare încredere în ele). Deși un tratament dat este considerat o încercare echitabilă, depinde de riscuri, beneficii și costuri.

Notă

  1. ^ Goodman S, Către statistici medicale bazate pe dovezi. 1: Eroarea valorii P. , în Ann Intern Med , vol. 130, nr. 12, 1999, pp. 995-1004, PMID 10383371 .
  2. ^ Goodman S, Către statistici medicale bazate pe dovezi. 2: Factorul Bayes. , în Ann Intern Med , vol. 130, nr. 12, 1999, pp. 1005-13, PMID 10383350 .
  3. ^ Armstrong, J. Scott, Testele de semnificație dăunează progresului prognozării , în International Journal of Forecasting , vol. 23, 2007, pp. 321-327, DOI : 10.1016 / j.ijforecast.2007.03.004 . Text complet
  4. ^ Armstrong, J. Scott, Testele de semnificație statistică sunt inutile chiar și atunci când sunt efectuate corespunzător , în International Journal of Forecasting , vol. 23, 2007, pp. 335–336, DOI : 10.1016 / j.ijforecast.2007.01.010 . Text complet
  5. ^ Sackett DL. De ce studiile randomizate controlate eșuează, dar nu trebuie: 2. Eșecul de a utiliza statistici fiziologice sau singura formulă de care un clinician-trialist este probabil probabil să aibă nevoie (sau să înțeleagă!). CMAJ. 30 octombrie 2001; 165 (9): 1226-37. PMID 11706914 . Text complet gratuit .

Elemente conexe

linkuri externe