Corelație (statistici)
În statistici , o corelație este o relație între două variabile astfel încât fiecare valoare a primei corespunde unei valori a celei de-a doua, urmând o anumită regularitate. [1] [2]
fundal
Termenul a apărut pentru prima dată într-o lucrare a lui Francis Galton , Geniu ereditar (1869). [3] Nu a fost definit mai complet (moralitatea și instabilitatea morală a unui individ nu au legătură) [4] .
Opt ani mai târziu, în 1877, Galton însuși a descoperit că coeficienții de regresie liniară dintre X și Y sunt aceiași dacă abaterea standard σ x și σ y se aplică ambelor variabile: Galton a folosit de fapt abaterea interquartilă , definind parametrul „co- coeficient de relație "și abrevierea" regresie "la r [5] .
Descriere
Pe baza caracteristicilor prezentate, corelația poate fi definită ca:
- direct (sau pozitiv): variația unui element îl afectează - direct - și pe celălalt. De exemplu, statura înaltă a părinților corespunde staturii înalte a fiilor;
- indirect (și invers sau negativ): variația unui element corespunde, în sens opus, cu cel al celuilalt. De exemplu, cu cât producția de grâu este mai mare, cu atât prețul este mai mic.
În plus, corelațiile pot fi:
- simplu: relatează două fenomene, de exemplu numărul căsătoriilor și numărul nașterilor;
- dublu: dacă există trei fenomene conexe, cum ar fi circulația monetară, prețurile și economiile;
- triplu: atunci când plasează patru elemente unul în raport cu celălalt.
Gradul de corelație dintre două variabile este exprimat prin indicele de corelație. [6] Valoarea pe care o presupune este între -1 (corelație inversă) și 1 (corelație directă și absolută), cu un indice egal cu 0 care implică absența corelației; valoarea nulă a indicelui nu implică, totuși, că variabilele sunt independente.
Coeficienții de corelație sunt derivați din indici, luând în considerare magnitudinile abaterilor de la medie . În special, indicele de corelație Pearson este calculat ca raportul dintre covarianța celor două variabile și produsul abaterilor standard ale acestora: [7]
Cu toate acestea, trebuie remarcat faptul că indicii și coeficienții de corelație trebuie să fie întotdeauna considerați aproximativi, datorită arbitrariului cu care sunt alese elementele: acest lucru este adevărat, în special, în cazul corelațiilor multiple.
Contrar a ceea ce s-ar putea ghici, corelația nu depinde de o relație cauză-efect, ci de tendința unei variabile de a se schimba în funcție de alta. [8] Variabilele pot fi reciproc dependente (de exemplu, relația dintre înălțimea taților și a copiilor) sau comune (relația dintre înălțimea și greutatea unei persoane). [9]
În căutarea unei corelații statistice între două cantități, pentru a determina o posibilă relație cauză-efect, nu trebuie să aibă ca rezultat o corelație falsă . [10]
Eroare standard
De sine Și sunt variabile aleatorii, eroarea standard asociată coeficientului de corelație este:
unde este este coeficientul de corelație e este dimensiunea eșantionului. [11] [12]
Notă
- ^ Definiția corelației , pe dictionare.corriere.it . Adus la 8 octombrie 2017 .
- ^ Paolo Enriques, Filippo Bottazzi și Giorgio Mortara, CORELARE , pe treccani.it , 1931.
- ^ Nașterea conceptului de corelație ( PDF ), pe padis.uniroma1.it . Adus la 23 ianuarie 2018 (arhivat din original la 25 iulie 2018) .
- ^ (EN) Relatarea lui Francis Galton despre invenția corelației , a jstor.org, în mai 1989.
- ^ Regresie , pe treccani.it . Adus la 18 iunie 2018 .
- ^ Indicele de corelație , pe alcula.com .
- ^ Unde se simplifică factorii cu numărător și numitor.
- ^ Conceptul de corelație ( PDF ), pe pellerey.unisal.it . Adus la 22 ianuarie 2018 .
- ^ Analiza corelației ( PDF ), pe sisdin.unipv.it . Adus la 26 noiembrie 2017 .
- ^ Corelație , pe albanesi.it . Adus pe 2 iunie 2018 .
- ^ AL Bowley, Deviația standard a coeficientului de corelație , în Journal of the American Statistical Association , vol. 23, n. 161, 1928, pp. 31-34, DOI : 10.2307 / 2277400 , ISSN 0162-1459 .
- ^ Derivarea erorii standard pentru coeficientul de corelație al lui Pearson , pe validare încrucișată . Adus 21-07-30 .
Elemente conexe
- Coeficient de determinare
- Corelație falsă
- Covarianță (probabilitate)
- Indicele de corelație Pearson
- Regresie liniara
- Variabilă (statistici)
Alte proiecte
-
Wikiversitatea conține resurse privind corelația
-
Wikimedia Commons conține imagini sau alte fișiere corelate
linkuri externe
- ( EN ) Corelație , în Encyclopedia Britannica , Encyclopædia Britannica, Inc.
Controlul autorității | Tezaur BNCF 15575 · LCCN (EN) sh85033032 · GND (DE) 4165343-9 · BNF (FR) cb11978503n (data) |
---|