Interval de încredere

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În statistici , atunci când se estimează un parametru, este adesea insuficient să se identifice o singură valoare. Prin urmare, este recomandabil să însoțiți estimarea cu un interval de valori plauzibile pentru acel parametru, definit ca intervalul de încredere (sau intervalul de încredere sau intervalul de încredere ). [1] Trebuie remarcat faptul că expresia interval de încredere , acum intrat în mod ireversibil în utilizarea italiană, este o traducere pietonală a expresiei de încredere în engleză, în care însă încrederea înseamnă încredere .

De sine Și sunt variabile aleatorii cu distribuții de probabilitate care depind de un anumit parametru Și (unde este este un număr între 0 și 1), apoi intervalul aleatoriu este un interval de încredere la pentru . Valorile extreme ale intervalului de încredere se numesc limite de încredere .

Acest interval de încredere este, prin urmare, asociat cu o valoare de probabilitate cumulată care caracterizează, indirect din punct de vedere al probabilității, amplitudinea sa față de valorile maxime care pot fi asumate de variabila aleatorie. Adică, valoarea probabilității cumulative indică probabilitatea ca evenimentul aleatoriu descris de variabila aleatorie să se încadreze în intervalul de încredere menționat anterior, egal grafic cu aria subtendută de curba de distribuție a probabilității variabilei aleatorii în intervalul considerat.

Este bine să nu confundați intervalul de încredere cu probabilitatea. De aici și expresia „există un nivel de încredere de 95% care este în intervalul ", nu indică probabilitatea ca intervalul obținut să conțină [2]

Introducere

Să presupunem că doriți să calculați vârsta medie a locuitorilor unui loc. Să presupunem că nu se cunoaște vârsta fiecărui locuitor. Se extrage apoi un eșantion aleatoriu de locuitori a cărui vârstă este posibil să se cunoască, iar din eșantion se încearcă deducerea („prezicerea”) vârstei medii pentru întreaga populație rezidentă și variabilitatea acestor date.

Acest lucru se poate face în diferite moduri, de exemplu, prin calcularea vârstei medii a persoanelor din eșantion și presupunând că această valoare coincide cu vârsta medie a întregii populații, inclusiv cea care nu a fost aleasă în eșantion. În acest caz s-a făcut o „estimare punctuală”.

Alternativ, începând de la vârstele persoanelor din eșantion, este posibil să se calculeze o gamă de valori în cadrul cărora se crede că există valoarea mediei întregii populații și, dacă procedura se desfășoară în într-o manieră riguroasă și statistic corectă, este posibil să se stabilească o valoare de „încredere” a cât de „credibil” este că intervalul obținut conține de fapt valoarea căutată. În acest caz s-a făcut o „estimare pe intervale” și intervalul obținut se numește interval de încredere .

Pe scurt: estimarea punctuală oferă o singură valoare care variază în funcție de eșantion și nu coincide cu adevărata valoare a populației; estimarea pe intervale oferă un set de valori (interval) care cu o anumită „încredere” conține adevărata valoare a populației [3] .

De sine este o variabilă aleatorie a mediei și varianță cu indicăm variabila eșantion corespunzătoare care are media aritmetică a datele observate în eșantion

și abaterea standard

Nivelul de încredere este stabilit de cercetător. Cea mai frecvent aleasă valoare este 95% [4] . Cu toate acestea, mai rar, se alege și un nivel de încredere de 90% sau 99%.

Dacă valoarea lui nu diferă mult de variabilitate din populație, poate fi presupus ca estimator al acesteia (de exemplu, cu un număr de subiecți observați și replici generale mai mari de 60; alternativ, se presupune o distribuție t Student caracterizată printr-o dispersie mai mare decât standardul normal) [5] . În această primă ipoteză, intervalul de încredere pentru medie ( media adevărată , a populației [3] ) până la 99% (la nivel ), este dat de:

La 95% este dat de:

Înainte de răspândirea computerelor, s-au încercat să se utilizeze aproximarea normală ori de câte ori este posibil. Acum nu mai este strict necesar, iar percentilele altor distribuții pot fi utilizate în formulă, referindu-se la dimensiuni mai mici ale eșantionului) [5] .

Din formule rezultă că cele două intervale de încredere pot fi scrise numai în funcție de datele eșantionului .

Pe lângă scăderea cu încredere, lățimea intervalului depinde de eroarea estimării și scade dacă:

  • variabilitatea eșantionului scade.
  • numărul crește a probei (cu a doua putere): pentru a înjumătăți lățimea intervalului, proba trebuie să fie de patru ori.

Dacă populația nu urmează modelul Gaussian , dacă eșantionul este suficient de mare, variabila eșantion tinde să urmeze o lege normală ( teorema limitei centrale ). Cu alte cuvinte, precedentele două formule pentru intervalul de încredere pot fi folosite și dacă legea probabilității sale nu este cunoscută.

Nivelul de încredere sau acoperire este complementul cuiva al nivelului de semnificație : de exemplu, un interval de încredere la corespunde unui nivel de semnificație de [6] .

Interpretări greșite

Intervalele de încredere sunt adesea confundate cu alte concepte statistice și sunt uneori interpretate greșit chiar de către cercetătorii profesioniști [7] [8] [9] [10] . Câteva greșeli frecvente:

  • un interval de încredere de 95% nu înseamnă că există o probabilitate de 95% ca parametrul populației (de exemplu, procentul de voturi pentru un partid în toată Italia) să fie inclus în cele două extreme ale intervalului. Intervalul poate sau nu „conține” valoarea parametrului. Nu este o chestiune de probabilitate. Încrederea de 95% se referă la fiabilitatea metodei de estimare, dar nu a intervalului particular calculat [11] . În ceea ce privește bunătatea metodei de estimare, se pot evalua, după caz, următoarele: dimensiunea și reprezentativitatea eșantionului, randomizarea metodei de eșantionare, controlul preventiv al ipotezelor de independență și distribuție identică, absența autocorelării între datele observate, posibila eliminare de alungare din toleranță.
  • în mod similar pentru eșantionul unic, un interval de încredere de 95% nu înseamnă că 95% din valorile eșantionate se încadrează în interval.
  • dacă intervalul de încredere este un set de valori probabile pentru întreaga populație, acest lucru nu se aplică eșantioanelor individuale.

Setare Neyman

Intervalele de încredere au fost introduse de Jerzy Neyman într-un articol publicat în 1937 [12] .

Există o metodă ușoară pentru calcularea intervalelor de încredere prin testul ipotezei (conform abordării lui Neyman).

Intervalul de încredere (sau încredere) va fi doar un parametru care se obține prin determinarea mai întâi a unui test (cu nivel de semnificație ) pentru a testa ipoteza = împotriva ipotezei . Setul tuturor valorilor pentru care ar fi acceptată ipoteza nulă constituie un interval de încredere de nivel

Prin urmare, un interval de încredere de 95% poate fi derivat dintr-un test de ipoteză de semnificație de 5%.

Notă

  1. ^ Ross , p. 239 .
  2. ^ Ross , p. 244 .
  3. ^ a b Note scurte despre intervalul de încredere ( PDF ), pe univr.it . Adus la 10 mai 2018 (arhivat din original la 18 septembrie 2017) .
  4. ^ (EN) JH Zar, Analiza biostatistică. , Prentice-Hall International (New Jersey), 1984, pp. 43 –45.
  5. ^ a b G. Verlato și R. de Marco, Interval de încredere ( PDF ), pe Secțiunea de epidemiologie și statistici medicale, Universitatea din Verona , p. 9. Accesat la 10 mai 2018 .
  6. ^ (EN) Andy Field, Discovering statistics using SPSS, Londra, SAGE, 2013.
  7. ^ [1]
  8. ^ Copie arhivată ( PDF ), la irt.com.ne.kr. Adus la 8 mai 2018 (arhivat din original la 4 martie 2016) .
  9. ^ Hoekstra, R., RD ​​Morey, JN Rouder și EJ. Wagenmakers, 2014. Interpretare greșită robustă a intervalelor de încredere. Psychonomic Bulletin Review, în presă. [2]
  10. ^ Înțelegerea de către oamenii de știință a intervalelor de încredere nu inspiră încredere , Science News , 3 iulie 2014
  11. ^ ( RO ) 1.3.5.2. Limite de încredere pentru medie , la nist.gov . Adus la 8 mai 2018 (arhivat din original la 5 februarie 2008) .
  12. ^ (EN) J. Neyman, Schița unei teorii a estimării statistice bazată pe teoria clasică a probabilității , în Tranzacțiile filozofice ale Societății Regale din Londra. Seria A, Științe matematice și fizice , vol. 236, nr. 767, Royal Society, 30 august 1937, pp. 333-380.

Bibliografie

  • Sheldon M. Ross, Probabilitate și statistici pentru inginerie și știință , Trento, Apogeo, 2003, ISBN 88-7303-897-2 .

Alte proiecte

linkuri externe

Controlul autorității Thesaurus BNCF 52493 · LCCN (EN) sh85030927