Valoarea P

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În statistica inferențială , în special în testarea ipotezelor de testare , valoarea P- (sau o valoare de probabilitate; mai frecvent numita valoare P-). Este probabilitatea de a obține rezultate egale cu sau mai puțin probabile decât cele observate în timpul testului, presupusă a fi adevărată nulă ipoteză . [1] [2] Cu alte cuvinte, valoarea p ajută la înțelegerea dacă diferența dintre rezultatul observat și rezultatul ipotezat se datorează randomității introduse de eșantionare sau dacă această diferență este semnificativă statistic , adică este dificil de explicat prin intermediul aleatoriei datorate eșantionării. Utilizarea valorii p în testarea ipotezelor este comună în multe domenii de cercetare [3], cum ar fi fizică , economie , finanțe , științe politice , psihologie , [4] biologie , criminologie și sociologie . [5] Se mai numește uneori și nivelul de semnificație observat .

Nivelul de semnificație

Coordonata verticală este densitatea probabilității fiecărui rezultat, calculată presupunând că ipoteza nulă este adevărată. Valoarea p este aria subtendută de curbă pornind de la datele observate.

Când se efectuează un test de ipoteză, se stabilește o ipoteză nulă și o valoare prag α (prin convenție de obicei 0,05) care indică nivelul de semnificație al testului. Odată ce valoarea p- relativă la datele observate a fost calculată, este posibil să vă comportați după cum urmează:

  • dacă valoarea p > α dovezile empirice nu sunt suficient de contrare ipotezei nule care, prin urmare, nu pot fi respinse;
  • dacă valoarea p ≤ α, dovada empirică este puternic contrară ipotezei nule, care trebuie deci respinsă. În acest caz, datele observate sunt considerate semnificative statistic .

Cu toate acestea, dacă p- valoarea ≈ α, adică este aproape de valoarea pragului, este necesară atenție. Valoarea p este utilizată pentru a furniza mai multe informații despre un test decât acceptarea sau respingerea pentru un anumit nivel de semnificație. Din acest motiv, analizele statistice trebuie să raporteze întotdeauna valoarea valorii p observate, permițând cititorilor să tragă propriile concluzii.

Pentru a efectua un test statistic este important să se stabilească nivelul de semnificație (de obicei indicat de litera greacă α, alfa) înainte de a calcula valoarea p- . Dacă valoarea p- ar fi calculată mai întâi, experimentatorul ar ști ce valori pentru acel nivel de semnificație duc la acceptarea sau respingerea ipotezei nule și ar putea alege nivelul în funcție de rezultatul dorit.

Definiție

Este presupunerea că valoarea din datele observate este extras dintr-o anumită variabilă aleatorie Notă. Valoarea p- este definită ca probabilitate, presupunând ipoteza , pentru a obține un rezultat (din datele observate) egal sau „mai extrem” decât cel observat efectiv. Ce se înțelege exact prin „mai extrem” depinde de tipul de test pe care intenționați să îl efectuați. Dacă testul este bilateral, atunci rezultatele cele mai extreme sunt valorile lui pentru care sau . Dacă testul este corect unilateral, atunci cele mai extreme rezultate sunt valorile lui pentru care . Dacă testul este pe partea stângă, rezultatele cele mai extreme sunt valorile lui pentru care . Prin urmare, valoarea p este dată de:

  • pentru teste unilaterale la dreapta;
  • pentru testarea revendicărilor unilaterale;
  • pentru teste bilaterale.

Cu cât valoarea p- este mai mică, cu atât este mai mare semnificația, deoarece rezultatul ne spune că ipoteza considerat nu explică în mod adecvat datele observate, adică nu este foarte credibil faptul că valoarea observată a fost extrasă efectiv din variabila aleatorie .

Exemplu

De exemplu, să fie 0,03 valoarea p- a unui test. Testul efectuat cu un nivel de semnificație de 0,05 conduce apoi la respingerea ipotezei nule, în timp ce același test efectuat cu un risc de eroare de 0,02 duce la refuzarea ipotezei nule. Concluzia „valoarea p este 0,03” conține mai multe informații decât „ipoteza respinsă cu semnificație 0,05” sau „nea respinsă cu semnificația 0,02”.

Greșeli comune

Există mai multe greșeli comune în ceea ce privește utilizarea valorii p .

  • Valoarea p nu este probabilitatea ca ipoteza nulă să fie adevărată sau probabilitatea ca ipoteza nulă să fie falsă. Nu este conectat cu niciunul dintre ei.
  • Valoarea p nu este probabilitatea ca o observație să fie o șansă . Calculul valorii p se bazează pe ipoteza că fiecare observație este un caz, un rezultat aleatoriu. Prin propoziție , rezultatul se datorează întâmplării , de obicei vrem să spunem că ipoteza nulă este probabil corectă. Dar nu uitați că valoarea p nu poate fi utilizată pentru a reprezenta probabilitatea ca o ipoteză să fie adevărată.
  • Valoarea p nu este probabilitatea de a respinge ipoteza nulă atunci când este adevărată.
  • Valoarea p nu este probabilitatea ca replicarea experimentului să conducă la aceeași concluzie. Pentru a cuantifica replicabilitatea unui experiment, a fost introdus conceptul de p-rep .
  • Nivelul de semnificație α nu este determinat de valoarea p . Nivelul de semnificație este decis de persoana care conduce experimentul înainte de a vedea datele.

Notă

  1. ^ Christie Aschwanden, Nici măcar oamenii de știință nu pot explica cu ușurință valorile P , pe FiveThirtyEight , 24 noiembrie 2015. Accesat la 11 octombrie 2019 (arhivat dinoriginal la 25 septembrie 2019) .
  2. ^ Ronald L. Wasserstein și Nicole A. Lazar, Declarația ASA privind valorile p: context, proces și scop , în The American Statistician , vol. 70, nr. 2, 7 martie 2016, pp. 129–133, DOI : 10.1080 / 00031305.2016.1154108 .
  3. ^ Bhaskar Bhattacharya și DeSale Habtzghi, Median of the value under the alternative hypothesis , în The American Statistician , vol. 56, nr. 3, 2002, pp. 202-6, DOI : 10.1198 / 000313002146 .
  4. ^ R. Wetzels, D. Matzke, MD Lee, JN Rouder, GJ Iverson și E. -J. Wagenmakers, Dovezi statistice în psihologia experimentală: o comparație empirică folosind teste 855 t , în Perspectives on Psychological Science , vol. 6, nr. 3, 2011, pp. 291–298, DOI : 10.1177 / 1745691611406923 , PMID 26168519 .
  5. ^ E. Babble, Practica cercetării sociale , ediția a XI-a, Belmont, Thomson Wadsworth, 2007.

Elemente conexe

Alte proiecte

linkuri externe