Copula (statistici)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Graficul limitelor copulei Fréchet-Hoeffding

În statistici , o copulă este utilizată ca metodă generală de formulare pentru o distribuție multivariată, astfel încât să poată fi reprezentate diferite tipuri de dependențe. Această abordare se bazează pe ideea că o simplă transformare pe fiecare variabilă marginală poate fi aplicată în așa fel încât fiecare variabilă marginală transformată are o distribuție uniformă .

Teorema lui Sklar afirmă că fiecare copulă este o funcție de distribuție comună, având ca argumente distribuțiile marginale. Mai mult, opusul este valabil și: fiecare distribuție comună are o copulă și, dacă marginale sunt continue, este unică.

Definiție

O funcție C: [0,1] d → [0,1] se numește copulă d-dimensională, sau d-copulă sintetică, dacă C este o funcție de divizare comună a unui vector de variabile aleatorii (X 1 , X 2 , ... X d ) având dimensiunea d, ale cărei marginale sunt distribuții uniforme pe [0,1].

O copulă C are următoarele proprietăți:

  1. crește d, deci C (u, 1) = u
  2. marginile sale sunt funcția de identitate pe intervalul de unitate, adică C i (u) = u pentru i = 1, ..., deu∈ [0,1]
  3. graficul său este întotdeauna în interiorul cubului d-dimensional, deoarece 0≤C (u, v) ≤1, ∀ (u, v) ∈ [0,1].

Teorema lui Sklar

Fie (X 1 , X 2 , ... X d ) un vector aleatoriu cu o funcție de distribuție comună având marginale F 1 , ..., F d . Apoi există o funcție C: [0,1] d → [0,1], numită d-copulă, astfel încât , F (x 1 , x 2 , ... x d ) = C (F (x 1 ), F (x 2 ), ..., F (x d )).

Prin urmare, este o funcție de distribuție comună cu marginile F 1 (x 1 ),…, F d (x d ). În schimb, notând prin H funcția de distribuție d-dimensională comună, având marginale continue F 1 (x 1 ), ..., F d (x d ), există o singură copulă C astfel încât H (x) = C (F 1 (x 1 ), ..., F d (x d )).

Această teoremă demonstrează că se pot construi funcții multivariate, cu marginale de orice tip, atâta timp cât sunt continue. În acest fel, putem construi infinite modele parametrice, alegând doar marginale și copula de utilizat.

Mai mult decât atât, este posibil să se definească inversul generalizat F −1 al unei distribuții univariate F. Dacă marginile F 1 , ..., F d sunt continue, atunci teorema lui Sklar poate fi rescrisă prin intermediul funcțiilor lor inverse ca: C ( u 1 , u 2 , ... u d ) = H (F −1 1 (u 1 ), ..., F −1 d (u d )).

Prin urmare, avem posibilitatea de a scrie probabilitatea comună în funcție de marginile sale, o caracteristică care permite copulelor să satisfacă două proprietăți foarte utile: copula produsului și invarianța în ceea ce privește transformările strict monotone.

Familii de copule

Copulele (contra-monotonie), (independență) e (comonotonie), care sunt cele mai ușor de gestionat. În plus față de acestea, vor fi prezentate acum principalele familii de copule, clasificate sub un alt criteriu, împărțindu-le în eliptice și neeliptice și, pentru acestea din urmă, spațiul va fi acordat copulelor lui Arhimede. Cele mai frecvent utilizate copule eliptice sunt multivariate Gaussian și Student's t. Principala diferență între copulele eliptice și neeliptice este că primele au capacitatea de a specifica nivelul de corelație dintre marginale, spre deosebire de cele din urmă. Elipticele, cu toate acestea, au dezavantajul de a nu modela bine valorile extreme ale distribuțiilor multivariate. Ambele familii de copule sunt simetrice, dar pe axe diferite.

Independență și comonotonicitate

Considerăm două variabile aleatoare independente Și definit pe pătratul unității [0,1] 2 . Deoarece sunt independenți, vor avea o distribuție comună ,

unde este Și sunt distribuțiile marginale univariate ale lui X și respectiv Y.

Prin urmare, avem asta cu

Aceasta înseamnă că cele două variabile aleatoare sunt independente dacă și numai dacă copula care captează dependența este de un tip special. Trebuie să fie copulație .

Două variabile aleatorii care nu sunt independente sunt numite dependente. Când au o dependență pozitivă perfectă, sunt numiți comonotonă, în timp ce dacă au o dependență negativă perfectă, sunt numiți contrmonotonă. Copula care corespunde dependenței pozitive maxime este indicată cu , în timp ce cea corespunzătoare contramonotoniei este indicată cu .

Copula gaussiană

Eliptice

Clasa distribuțiilor eliptice este compusă din multe tipuri de distribuții, care au în comun unele proprietăți ale distribuției normale multivariate. Copulele eliptice sunt pur și simplu copule ale distribuțiilor eliptice. Copula Gaussian generează o funcție comună de distribuție normală, cu condiția ca marginale să fie standarde normale, adică cu zero medie și varianță egală cu 1. Mai mult, este utilizată pe scară largă în economie pentru a modela dependența dintre titlurile financiare, astfel încât să ofere o precizie mai mare în evaluarea managementului riscurilor.

O altă copulă eliptică este Student's t. Deoarece copula Gaussian este utilizată pe scară largă în finanțe, pentru a interpreta mai bine corelația dintre valorile titlurilor financiare, dar diferit de aceasta, este capabilă să acorde o pondere mai mare valorilor extreme; aceasta înseamnă că are o variabilitate mai mare decât prima. Din cauza acestei caracteristici, se spune că distribuția t Student are cea mai groasă sau mai grea „coadă”. Această particularitate este utilă în situații de evenimente rare, dar nu foarte rare,

Copula studentului

adică în situații de prăbușire a piețelor financiare. Gaussianul, datorită cozilor mai subțiri, arată acest tip de situație ca evenimente excepționale care ar trebui să apară, de exemplu, o dată la o mie de ani. T studentul, pe de altă parte, acordând o importanță mai mare cozilor, aproximează mai adecvat fenomenele reale decât Gaussianul, îmbunătățind semnificativ acuratețea predicției.

Arhimede

Din punct de vedere al calculului, copulele arhimediene au avantajul de a avea puțini parametri pentru a reprezenta structura dependenței, spre deosebire de copulele gaussiene. Din păcate, însă, dacă aveți cantități mari de date, această caracteristică implică o flexibilitate limitată de adaptare, cu consecința deficitului de precizie. După cum am văzut în paragrafele anterioare, copulele eliptice sunt simetrice și, în unele situații, această particularitate poate reprezenta o problemă. În unele aplicații financiare și de asigurare, este rezonabil să observăm o modificare a corelației. Pe piețele financiare, de exemplu, există o corelație mai mare în perioadele de pierderi mari, adică în timpul prăbușirilor bursiere, decât în ​​perioadele de urcare. În consecință, este necesar să se construiască modele de dependență care să reflecte dependențele observate și prezise, ​​fără a formaliza structura de corelație prin relații cauză-efect. Mai mult, copulele arhimediene, așa cum vom vedea, nu derivă din distribuții multivariate compuse de teorema lui Sklar. Printre cele mai utilizate copule Archimedee se numără Gumbel, Frank și Clayton.

Alte proiecte

Controlul autorității Thesaurus BNCF 52750 · LCCN (EN) sh98005244
Statistici Portal de statistici : accesați intrările Wikipedia care se ocupă de statistici