Distributie normala

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Variabilă aleatorie normală (sau gaussiană)
Funcția de densitate
Funcția de densitate a unei variabile aleatoare normale
Linia roșie se referă la variabila normală aleatorie standardizată
Funcția de distribuție
Funcția de distribuție a unei variabile aleatoare Gauss normale sau semi-clopot
Culorile corespund celor cu densitățile din figura anterioară
Parametrii ,
A sustine
Funcția de densitate
Funcția de distribuție
Valorea estimata
Median
Modă
Varianța
Indicele de asimetrie
Curios
Entropie
Funcție generatoare de momente
Funcția caracteristică

Distribuția normală (sau distribuția Gauss numită după matematicianul german Carl Friedrich Gauss ), în teoria probabilității , este o distribuție continuă a probabilității care este adesea utilizată ca o primă aproximare pentru a descrie variabile aleatorii cu valoare reală care tind să se concentreze în jurul unei singure valori medii .

Graficul funcției densității probabilității asociate este simetric și are o formă de clopot, cunoscut sub numele de clopot Gaussian (sau, de asemenea, ca o curbă de eroare , curbă de clopot , ogivă ).

Descriere

Distribuția normală este considerată cazul de bază al distribuțiilor continue de probabilitate datorită rolului său în teorema limitei centrale . Un set dat de valori ar putea fi normal: un test de normalitate poate fi folosit pentru a stabili acest lucru. Mai precis, presupunând anumite condiții, suma a n variabile aleatorii cu medie finită și varianță tinde spre o distribuție normală, deoarece n tinde spre infinit. Datorită acestei teoreme, distribuția normală este adesea întâlnită în aplicații practice, fiind utilizată în statistici și în științele naturale și sociale [1] ca model simplu pentru fenomene complexe.

Distribuția normală depinde de doi parametri, media μ și varianța σ 2 și este indicată în mod tradițional cu:

[2]

Metodologie

Distribuția normală se caracterizează prin următoarea funcție de densitate a probabilității , care este adesea denumită curba Gaussiană sau Gaussiană :

Unde este este valoarea așteptată e varianța .

Pentru a demonstra asta este de fapt o funcție de densitate a probabilității , în primul rând apelăm la standardizarea (statistică) a variabilei aleatorii, adică la transformarea astfel încât să rezulte:

,

unde variabila rezultată are și o distribuție normală cu parametri Și . Integrala funcției densității probabilității variabilei aleatorii standardizate este următorul:

Deoarece condiția trebuie să se aplice în mod necesar , apoi se dovedește, de asemenea asa de:

unde și variabila aleatorie are distribuție normală standard. Coordonatele polare sunt utilizate pentru a rezolva această integrală dublă Și , unde este Și . Matricea iacobiană de transformare este

,

al cărei determinant este egal cu . Înlocuind integralul de mai sus, obținem:

Funcția sa generatoare de momente este

Valoarea așteptată și varianța (care sunt singurii doi parametri ai acestei variabile aleatorii) sunt exact μ și σ².

Deoarece nu este posibil să se exprime integralul în formă închisă prin intermediul funcțiilor elementare , este necesar să se facă valorile funcției sale de distribuție disponibile sub formă de tabel. Cele mai utilizate sunt:

68,3% = P {μ - 1,00 σ <X <μ + 1,00 σ}
95,0% = P {μ - 1,96 σ <X <μ + 1,96 σ}
95,5% = P {μ - 2,00 σ <X <μ + 2,00 σ}
99,0% = P {μ - 2,58 σ <X <μ + 2,58 σ}
99,7% = P {μ - 3,00 σ <X <μ + 3,00 σ}

Fiind o funcție simetrică este suficientă pentru a cunoaște funcția de distribuție a valorilor pozitive, pentru a cunoaște și cea a valorilor negative (și invers).

Alte variabile aleatoare pot fi obținute din variabila aleatoare normală, cum ar fi Student's t , Chi-pătrat și Fisher-Snedecor F , precum și „variantele” lor non-centrale ( t non-central, chi-pătrat non-central și non -F central ).

Teoreme

Combinație liniară de variabile gaussiene

De sine
X 1 , X 2 , ..., X n sunt n variabile aleatoare normale independente una de cealaltă, fiecare cu valoarea așteptată μ i și varianța σ² i ,
asa de
variabila aleatoare Y = α 1 X 1 + α 2 X 2 + ... + α n X n este la rândul ei o variabilă aleatorie normală cu valoarea așteptată μ = α 1 μ 1 + α 2 μ 2 + ... + α n μ n și varianța σ² = α² 1 σ² 1 + α² 2 σ² 2 + ... + α² n σ² n .

Alte teoreme: teorema lui Cochran .

Relații cu alte variabile aleatorii

Normalul ca derivare din alte voci

Teoremele limitei centrale sunt o familie de teoreme care au în comun afirmația că suma (normalizată) a unui număr mare de variabile aleatorii este distribuită aproximativ ca o variabilă normală aleatoare.


Dacă X este distribuit ca o variabilă aleatoare binomială cu n foarte mare (pentru a da o idee despre cât de mare, putem spune că trebuie să fie n> 30) și aproximativ np > 10, atunci binomul poate fi aproximat cu un Normal cu valoare așteptată egală cu np și varianță egală cu npq : N ( np ; npq ).


Dacă X este distribuit ca o variabilă aleatorie Poissoniană cu parametrul λ foarte mare (indicativ λ> 10), atunci Poissonianul poate fi aproximat cu un Normal cu o valoare așteptată și o varianță egală cu λ: N (λ; λ).

Variabile aleatorii derivate din Normal

Dat fiind n distribuții normale Z 1 (0; 1); Z 2 (0; 1); ... Z n (0; 1) cu medie zero și varianță de unitate independentă una de cealaltă. Atunci

χ² n = Z 1 ² + Z 2 ² + .... + Z n ²

este o variabilă aleatorie cu care se pătrează grade de libertate.


Fie Z 1 , Z 2 , Z 3 ..., Z n variabile aleatoare independente distribuite ca o Normală cu medie zero și varianță de unitate și să fie 1 , a 2 , a 3 ..., a n constante astfel încât

apoi indicăm cu χ'² variabila aleatorie chi pătrat necentral cu n grade de libertate construite ca


Dacă Z ~ N (0; 1) și X ~ χ² n , atunci T = Z / √X / n este distribuit ca un t student cu n grade de libertate.


Dacă Z ~ N (0; 1) e , atunci T este un Birnbaum-Saunders vc cu parametri Și .

Normalul din inferența bayesiană

Gamma variabilă aleatorie ca priori conjugați ai normalului

În contextul inferenței bayesiene găsim următoarea relație între distribuția normală și distribuția Gamma .

Dacă X este o distribuție normală cu parametrii μ și 1 / θ

iar parametrul θ are o distribuție Γ cu parametrii a și b

atunci parametrul θ este distribuit și în spate ca un interval variabil aleatoriu, dar cu parametrii a + 1/2 și + b (x-μ) 2/2

Conjugat normal înainte de unul normal

Dacă X este distribuit ca un vc normal cu parametrii m și σ 2

iar parametrul m este distribuit a priori ca un vc normal cu parametrii μ și σ 2

atunci parametrul m este distribuit și a posteriori ca un Vc normal, dar cu parametri Și

Istorie

Abraham de Moivre , în contextul studiilor sale asupra probabilității, a introdus pentru prima dată distribuția normală într-un articol din 1733. Gauss , care la acea vreme nu era încă născut, a fost în schimb un mare utilizator: a propus „distribuția normală” „prin studierea mișcării corpurilor cerești [3] . Alții l-au folosit pentru a descrie fenomene foarte diferite, cum ar fi ghinionul în jocurile de noroc sau distribuirea de fotografii în jurul țintelor. De aici și numele „curba Gauss” și „curba de eroare”.

În 1809, matematicianul american Adrain a publicat două derivări ale legii normale a probabilității, simultan și independent de Gauss [4] Lucrările sale au rămas în mare parte ignorate de comunitatea științifică până în 1871, când au fost „redescoperite” de Cleveland Abbe . [5] .

În 1835 Quételet a publicat o lucrare în care, printre altele, existau date referitoare la mărimea pieptului soldaților scoțieni și la statura recruților francezi. Quételet a arătat cum astfel de date s-au distribuit ca „gaussiene”, dar nu au mers mai departe.

Galton a fost cel care a ghicit că curba în cauză, pe care el o numea și „ogivă”, putea fi aplicată unor fenomene foarte diferite și nu numai „erorilor”. Această idee a unei curbe pentru a descrie „date” în general a condus la utilizarea termenului „Normal”, deoarece reprezenta un substrat „normal” sau „normă” pentru orice distribuție naturală.

În încercarea de a compara diferite curbe, Galton - în absența unor instrumente adecvate - s-a limitat la utilizarea a doar doi parametri: media și varianța , începând astfel statisticile parametrice .

Notă

  1. ^ Enciclopedia Gale de psihologie - distribuție normală
  2. ^ Ross , p. 170 .
  3. ^ Tony Crilly, 50 de idei grozave în matematică , DEDALO EDITIONS, 1 ianuarie 2009, ISBN 9788822068095 . Adus la 26 februarie 2017 .
  4. ^ (EN) Stephen M. Stigler, Mathematical Statistics in the Early States , în The Annals of Statistics, vol. 6, nr. 2, 1978, pp. 239-265, DOI : 10.1214 / aos / 1176344123 . , p. 243
  5. ^ Stephen M. Stigler, Mathematical Statistics in the Early States , 1978, p. 244

Bibliografie

  • M. Sheldon Ross, Probabilități și statistici pentru inginerie și știință ” , Apogeo Trento, 2003
  • M. Stephen Stigler, Mathematical Statistics in the Early States , The Annals of Statistics v. 6 n.2 pp. 239-265, 1978

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 57810 · LCCN (EN) sh85053556 · BNF (FR) cb119421818 (data)
Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică