Matricea de covarianță
Acest articol sau secțiune despre subiectul statisticilor nu menționează sursele necesare sau cei prezenți sunt insuficienți . |
În statisticile multivariate și de probabilitate , matricea de covarianță (sau matricea de varianță și covarianță ) este de obicei indicată ca și este o generalizare a covarianței la cazul dimensiunii mai mari de două. Este o matrice care reprezintă variația fiecărei variabile față de celelalte (inclusiv ea însăși). Este o matrice simetrică .
Statistici
Având în vedere o populație de elemente pe care sunt detectate caractere cantitative . Asta este fiecare cu este un vector al elemente, indicate cu cu . Elementul reprezintă deci modalitatea de -a unitatea statistică cu privire la personaj . Matricea de covarianță are dimensiune și fiecare element este definit ca
unde este indică media personajului .
Înțelesul valorilor
Fiecare element de pe diagonală este varianța caracterului și, prin urmare, este întotdeauna o valoare non-negativă. Fiecare element (cu ) este covarianța dintre personaje Și . Dacă această valoare este pozitivă, înseamnă că pe măsură ce un personaj crește, crește și celălalt. Dacă această valoare este negativă, se întâmplă opusul. Dacă caracterele sunt independente statistic, această valoare este (implicația inversă nu este neapărat verificată).
Aplicații
În plus față de semnificația statistică pe care o putem deduce din termeni, matricea de covarianță este un parametru al funcției gaussiene , în statisticile multivariate .
De asemenea, poate ajuta la reducerea caracteristicilor , prin analiza componentelor principale (PCA).
Bibliografie
- Richard O. Duda, Peter E. Hart, David G. Stork, Wiley Interscience - Pattern Classification (ediția a doua)