Deviația pătrată medie

O serie de date cu o medie de 50 (în albastru) și o deviație standard (σ) de 20.

Abaterea standard (sau abaterea standard, sau abaterea standard, ^[1] sau deviația pătrată medie) este un indice de dispersie statistic , și anume o estimare a variabilității unei populații de date sau a unei variabile aleatorii .

Este una dintre modalitățile de exprimare a dispersiei datelor în jurul unui indice de poziție , care poate fi, de exemplu, media aritmetică sau o estimare a acestuia. Prin urmare, are aceeași unitate de măsură ca valorile observate (spre deosebire de varianța care are pătratul unității de măsură a valorilor de referință ca unitatea sa de măsură). În statistici , precizia poate fi exprimată ca deviație standard.

Termenul „ deviație standard ” a fost introdus în statistici de Pearson ^[2] în 1894 împreună cu litera greacă $\sigma$ ${\ displaystyle \ sigma}$ $\ sigma$ ( sigma ) care o reprezintă. Termenul italian „deviație standard” este cea mai folosită traducere în limba comună; termenul Organismului Național de Unificare Italiană este totuși „deviație standard”, definit ca rădăcina pătrată pozitivă a varianței cel puțin din 1984 ^[3] .

Dacă nu se indică altfel, deviația standard este rădăcina pătrată a varianței , ^[4] care este reprezentată în mod constant cu pătratul sigmei: $\sigma ^{2}$ ${\ displaystyle \ sigma ^ {2}}$ $\ sigma ^ {2}$ .

Statistici

În statistici, abaterea standard a unui personaj găsit la o populație de $Nu.$ ${\ displaystyle N}$ $Nu.$ unitățile statistice sunt definite în mod explicit ca: ^[5]

\sigma _{X}={\sqrt {\frac {\sum \limits _{i=1}^{N}(x_{i}-{\bar {x}})^{2}}{N}}},

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ frac {\ sum \ limits _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2}} {N}}},}

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ frac {\ sum \ limits _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2}} {N}}},}

unde este ${\bar {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}$ ${\ displaystyle {\ bar {x}} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i}}$ ${\ displaystyle {\ bar {x}} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i}}$ este media aritmetică a $X$ ${\ displaystyle X}$ $X$ .

În mod formal, deviația pătrată medie a unei variabile poate fi calculată începând cu funcția generatoare de moment , în special este rădăcina pătrată a diferenței dintre al doilea moment și primul moment pătrat.

Pornind de la deviația pătrată medie, coeficientul de variație ^[6] sau deviația standard relativă este, de asemenea, definit ca raportul dintre abaterea standard $\sigma _{X}$ ${\ displaystyle \ sigma _ {X}}$ ${\ displaystyle \ sigma _ {X}}$ și valoarea absolută a mediei aritmetice a variabilei în cauză cu condiția ca media să fie diferită de zero:

\sigma _{X}^{*}={\frac {\sigma _{X}}{|{\bar {x}}|}}

{\ displaystyle \ sigma _ {X} ^ {*} = {\ frac {\ sigma _ {X}} {| {\ bar {x}} |}}}

{\ displaystyle \ sigma _ {X} ^ {*} = {\ frac {\ sigma _ {X}} {| {\ bar {x}} |}}}

Acest indice relativ (care este adesea exprimat în termeni procentuali ^[7] ) permite efectuarea de comparații între dispersiile de date de diferite tipuri, indiferent de cantitățile lor absolute.

Abaterea standard corectată

În contextul statisticilor inferențiale (unde se cunoaște doar un eșantion din populație), în special în contextul teoriei estimării , numitorul este uneori înlocuit $Nu.$ ${\ displaystyle N}$ $Nu.$ cu $N-1$ ${\ displaystyle N-1}$ $N-1$ obținerea:

{\bar {s}}_{X}={\sqrt {\frac {\sum \limits _{i=1}^{N}(x_{i}-{\bar {x}})^{2}}{N-1}}}.

{\ displaystyle {\ bar {s}} _ {X} = {\ sqrt {\ frac {\ sum \ limits _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2}} {N-1}}}.}

{\ displaystyle {\ bar {s}} _ {X} = {\ sqrt {\ frac {\ sum \ limits _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2}} {N-1}}}.}

Practic, deoarece media întregii populații nu este cunoscută, ci doar o estimare a acesteia (media eșantionului), este necesar să se utilizeze $N-1$ ${\ displaystyle N-1}$ $N-1$ pentru a obține un estimator corect ${\bar {s}}_{X}^{2}$ ${\ displaystyle {\ bar {s}} _ {X} ^ {2}}$ ${\ displaystyle {\ bar {s}} _ {X} ^ {2}}$ a varianței necunoscute $\sigma _{X}$ ${\ displaystyle \ sigma _ {X}}$ ${\ displaystyle \ sigma _ {X}}$ din $X$ ${\ displaystyle X}$ $X$ pe întreaga populație pornind de la datele eșantionului. Rădăcina sa pătrată devine deviația standard „corectă”.

Această corecție a numitorului face ca noua definiție să fie puțin mai mare decât cea precedentă, corectând astfel tendința celei anterioare de a subestima incertitudinile, mai ales în cazul în care lucrați cu puține date ( $Nu.$ ${\ displaystyle N}$ $Nu.$ mic) ^[8] .

Să ne uităm la cazul limită al $N=1$ ${\ displaystyle N = 1}$ $N = 1$ , adică atunci când există un eșantion de un singur element: prima definiție dă rezultatul $\sigma _{X}=0$ ${\ displaystyle \ sigma _ {X} = 0}$ ${\ displaystyle \ sigma _ {X} = 0}$ , ceea ce evident nu este foarte rezonabil în contextul statisticilor inferențiale, în timp ce cea „corectă” dă un rezultat nedefinit al tipului ${\bar {s}}_{X}={\frac {0}{0}}$ ${\ displaystyle {\ bar {s}} _ {X} = {\ frac {0} {0}}}$ ${\ displaystyle {\ bar {s}} _ {X} = {\ frac {0} {0}}}$ , reflectând astfel ignoranța totală inerentă incertitudinii cu privire la o singură măsură. În acest sens, se spune că statisticile nu spun nimic despre cazul individual.

Observăm că diferența dintre cele două definiții pentru eșantioane foarte mari este adesea nesemnificativă numeric.

Simplificarea formulei

Calculul poate fi simplificat după cum urmează:

{\begin{aligned}\sum _{i=1}^{N}(x_{i}-{\bar {x}})^{2}&={}\sum _{i=1}^{N}(x_{i}^{2}-2x_{i}{\bar {x}}+{\bar {x}}^{2})\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-\left(2{\bar {x}}\sum _{i=1}^{N}x_{i}\right)+N{\bar {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-2{\bar {x}}(N{\bar {x}})+N{\bar {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-2N{\bar {x}}^{2}+N{\bar {x}}^{2}\\&{}=\left(\sum _{i=1}^{N}x_{i}^{2}\right)-N{\bar {x}}^{2}.\end{aligned}}

{\ displaystyle {\ begin {align} \ sum _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2} & = {} \ sum _ {i = 1 } ^ {N} (x_ {i} ^ {2} -2x_ {i} {\ bar {x}} + {\ bar {x}} ^ {2}) \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) - \ left (2 {\ bar {x}} \ sum _ {i = 1} ^ {N} x_ {i} \ dreapta) + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) -2 { \ bar {x}} (N {\ bar {x}}) + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) -2N {\ bar {x}} ^ {2} + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ { i = 1} ^ {N} x_ {i} ^ {2} \ right) -N {\ bar {x}} ^ {2}. \ end {align}}}

{\ displaystyle {\ begin {align} \ sum _ {i = 1} ^ {N} (x_ {i} - {\ bar {x}}) ^ {2} & = {} \ sum _ {i = 1 } ^ {N} (x_ {i} ^ {2} -2x_ {i} {\ bar {x}} + {\ bar {x}} ^ {2}) \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) - \ left (2 {\ bar {x}} \ sum _ {i = 1} ^ {N} x_ {i} \ dreapta) + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) -2 { \ bar {x}} (N {\ bar {x}}) + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} \ right) -2N {\ bar {x}} ^ {2} + N {\ bar {x}} ^ {2} \\ & {} = \ left (\ sum _ { i = 1} ^ {N} x_ {i} ^ {2} \ right) -N {\ bar {x}} ^ {2}. \ end {align}}}

adică aplicarea întregului la formula originală:

\sigma _{X}={\sqrt {{\frac {1}{N}}\left(\sum _{i=1}^{N}x_{i}^{2}-N{\bar {x}}^{2}\right)}}={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}-{\bar {x}}^{2}}}.

{\ displaystyle \ sigma _ {X} = {\ sqrt {{\ frac {1} {N}} \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} -N { \ bar {x}} ^ {2} \ right)}} = {\ sqrt {{\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i} ^ {2} - {\ bar {x}} ^ {2}}}.}

{\ displaystyle \ sigma _ {X} = {\ sqrt {{\ frac {1} {N}} \ left (\ sum _ {i = 1} ^ {N} x_ {i} ^ {2} -N { \ bar {x}} ^ {2} \ right)}} = {\ sqrt {{\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i} ^ {2} - {\ bar {x}} ^ {2}}}.}

Şansă

Este $X$ ${\ displaystyle X}$ $X$ o variabilă aleatorie , abaterea standard este definită ca rădăcina pătrată a varianței lui $X$ ${\ displaystyle X}$ $X$

\sigma _{X}={\sqrt {\sigma _{X}^{2}}}.

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}.}

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ sigma _ {X} ^ {2}}}.}

În mod formal, deviația pătrată medie a unei variabile aleatorii poate fi calculată începând cu funcția generatoare de moment , în special este rădăcina pătrată a diferenței dintre al doilea moment și primul moment pătrat, adică

\sigma _{X}={\sqrt {\mathbb {E} [x^{2}]-(\mathbb {E} [x])^{2}}},

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ mathbb {E} [x ^ {2}] - (\ mathbb {E} [x]) ^ {2}}},}

{\ displaystyle \ sigma _ {X} = {\ sqrt {\ mathbb {E} [x ^ {2}] - (\ mathbb {E} [x]) ^ {2}}},}

unde este $\mathbb {E} [X]$ ${\ displaystyle \ mathbb {E} [X]}$ ${\ mathbb {E}} [X]$ este valoarea așteptată a $X$ ${\ displaystyle X}$ $X$ .

Aplicații

În domeniul financiar , abaterea standard este utilizată pentru a indica variabilitatea unui activ financiar și plățile ( randamentele ) acestuia. Prin urmare, oferă, implicit, o măsură a volatilității activului, deci a riscului acestuia.

În fizică , este un indice excelent al erorii aleatorii la măsurarea unei mărimi fizice.

În sport este folosit pentru a evalua performanța unui jucător de bowling cu referire la un anumit număr de jocuri. Valoarea găsită nu afectează scorul, dar rezumă abilitățile și îmbunătățirile jucătorului.

În inginerie, este unul dintre parametrii care trebuie luați în considerare pentru a evalua capacitatea unui proces de producție.

În aplicațiile informatice, uneori este convenabil să se utilizeze formula

\operatorname {\sigma _{x}} ={\frac {1}{N}}{\sqrt {N\sum _{i=1}^{N}x_{i}^{2}-\left(\sum _{i=1}^{N}x_{i}\right)^{2}}}

{\ displaystyle \ operatorname {\ sigma _ {x}} = {\ frac {1} {N}} {\ sqrt {N \ sum _ {i = 1} ^ {N} x_ {i} ^ {2} - \ left (\ sum _ {i = 1} ^ {N} x_ {i} \ right) ^ {2}}}}

{\ displaystyle \ operatorname {\ sigma _ {x}} = {\ frac {1} {N}} {\ sqrt {N \ sum _ {i = 1} ^ {N} x_ {i} ^ {2} - \ left (\ sum _ {i = 1} ^ {N} x_ {i} \ right) ^ {2}}}}

ceea ce permite, cu doar trei variabile $\left(N,\ \sum x_{i},\ \sum x_{i}^{2}\right)$ ${\ displaystyle \ left (N, \ \ sum x_ {i}, \ \ sum x_ {i} ^ {2} \ right)}$ ${\ displaystyle \ left (N, \ \ sum x_ {i}, \ \ sum x_ {i} ^ {2} \ right)}$ , pentru a calcula abaterea standard, precum și media , unui flux de numere de lungime $Nu.$ ${\ displaystyle N}$ $Nu.$ fără a fi nevoie să recurgă la o memorare a aceluiași.

Notă

^ Standardul UNI italian UNI ISO 3534-1 : 2000 Statistici - Vocabular și simboluri, probabilitate și termeni statistici generali . Milano: UNI, 2000, definiție 1.23.
^ Karl Pearson , Despre disecția curbelor de frecvență asimetrice , 1894
^ UNI, standardul italian UNI 4723: 1984, Metode statistice pentru controlul calității. Termeni, simboluri și definiții . Milano: UNI, 1984. înlocuit de standardul menționat mai sus UNI ISO 3534-1 în februarie 2000.
^ Glosar Istat , pe www3.istat.it (arhivat de la adresa URL originală la 31 decembrie 2011) .
^ Sheldon , p. 96.
^ UNI , standardul italian UNI ISO 3534-1: 2000, Statistică - Vocabular și simboluri, Probabilitate și termeni statistici generali . Milano: UNI, 2000, definiție 1.24 și 2.35.
^ Domenico Piccolo, Statistics , Il Mulino, Bologna, 1998, p. 123.
^ În aplicații practice, un eșantion format din mai puțin de 30 de elemente (N <30) este considerat „mic”.

Bibliografie

M. Ross Sheldon, Introducere în statistici , ediția a II-a, Maggioli Editore, 2014, ISBN 88-916-0267-1 .
Thomas H. Wannacott, Introducere în statistici , ediția a 19-a, Franco Angeli, 2009, ISBN 978-88-568-1260-2 .

Elemente conexe

Alte proiecte

Wikimedia Commons conține imagini sau alte fișiere cu deviație standard

linkuri externe

( EN ) Deviația pătrată medie , în Encyclopedia Britannica , Encyclopædia Britannica, Inc.
( EN ) Deviația pătrată medie , pe goldbook.iupac.org .

Controlul autorității	LCCN (EN) sh85127303 · GND (DE) 4767332-1

Portalul de matematică

Portal de metrologie

Portalul de statistici

[1] Standardul UNI italian UNI ISO 3534-1 : 2000 Statistici - Vocabular și simboluri, probabilitate și termeni statistici generali . Milano: UNI, 2000, definiție 1.23.

[2] Karl Pearson , Despre disecția curbelor de frecvență asimetrice , 1894

[3] UNI, standardul italian UNI 4723: 1984, Metode statistice pentru controlul calității. Termeni, simboluri și definiții . Milano: UNI, 1984. înlocuit de standardul menționat mai sus UNI ISO 3534-1 în februarie 2000.

[4] Glosar Istat , pe www3.istat.it (arhivat de la adresa URL originală la 31 decembrie 2011) .

[5] Sheldon , p. 96.

[6] UNI , standardul italian UNI ISO 3534-1: 2000, Statistică - Vocabular și simboluri, Probabilitate și termeni statistici generali . Milano: UNI, 2000, definiție 1.24 și 2.35.

[7] Domenico Piccolo, Statistics , Il Mulino, Bologna, 1998, p. 123.

[8] În aplicații practice, un eșantion format din mai puțin de 30 de elemente (N <30) este considerat „mic”.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

V · D · M Statistici
Statisticile descriptive	Medii ( aritmetice · geometrice · armonioase · Putere · aritmetice și geometrice · Integrale ) · Mediană · Modă · interval de variație · varianță · Deviație standard · deviație absolută medie · Simetrie · Diferență medie ( absolută · logaritmică ) · Curtosi
Inferință statistică	Test de testare a ipotezei · Semnificație · Ipoteză nulă / alternativă · Eroare I și tip II · Test Q · U test · Test t · Z Test · Probabilitate maximă · Standardizare · valoare p · Analiza variației
Analiza supraviețuirii	Rată de eșec · Estimator Kaplan-Meier · test log-rank
Analiza regresiei	Regresie liniară · Regresie neliniară · variabile instrumentale · metodă generalizată a momentelor · Regresie logistică · Model probit · Model logit

V · D · M Concepte fundamentale de metrologie, statistici și metodologie de cercetare
Definiții de bază	Măsurarea Probabilitate Măsurarea fizică proprietate fizică Cantitatea Parametru statistice Populația adevărata valoare Exemplu de măsurare Precizie Precizia Repetabilitatea Reproductibilitatea Semnificația Toleranță Sensibilitate Rezoluție ( Lateral Rezoluție ) Homoskedasticity Heteroskedasticity statistice Ipoteză · Nul ipoteza · Apropierea · semnificativă figura · variabilă aleatoare · Normalizarea · Standardizare
Eroare de manipulare	Măsurarea incertitudinii de măsurare de eroare sistematică eroare statistică de eroare Sensibilitate eroare de rezultate fals negative fals pozitive absolută de eroare de eroare relativă Eroare de propagare Bias
Minimizarea erorilor	Analitică Calibrare Calibrare Calibrare Raport semnal / zgomot Comparație interlaboratorie Calitatea datelor anterioare
Prelevarea de probe	Spațiul de eșantionare Eșantionarea statistică Eșantionarea planului Eșantionarea motivată Eșantionarea la cota Eșantionarea aleatorie ( Eșantionarea sistematică Eșantionarea stratificată Eșantionarea în cluster Eșantionarea în mai multe etape ) Eșantionarea probabilistică
Parametrii de variație	Varianță · Covarianță · Deviație standard · Devianță · Interval dinamic · Coeficient de variație
Test	Testarea ipotezei ( Test parametric · Test non-parametric ) · Interval de încredere · valoarea p