Analiza factorilor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În statistici și psihometrie, analiza factorială este o tehnică care permite evidențierea existenței unei structuri de trăsături latente (în psihometrie) sau factori sau dimensiuni (în statistici), care nu pot fi măsurate direct, într-un set de variabile. uneori denumite și variabile indicator sau variabile instrumentale ) care se referă la aceste trăsături latente. În cadrul acestora, dimensiunile se caracterizează prin propria lor coerență teoretică, adică factorii nu se limitează la reprezentarea existenței unei asociații statistice între variabile, ci trebuie, de asemenea, să fie interpretabili din punct de vedere științific-rațional.

Clasificare

Analiza factorială poate fi realizată atât în ​​scopuri exploratorii (EFA, Exploratory Factor Analysis), cât și în scopuri confirmative (CFA, Confirmatory Factor Analysis): în primul caz factorii sunt extrapolați din date, în timp ce în al doilea este cercetătorul cel care pune constrângeri asupra modelului său și pentru a verifica dacă acest model este în concordanță cu datele observate, adică, în termeni statistici, dacă arată o potrivire adecvată datelor [1] . Tehnicile utilizate pentru EFA și CFA sunt foarte diferite, în primul rând din punctul de vedere al scopurilor ilustrate mai sus și în al doilea rând pentru tipul de modelare matematică adoptată. În general, totuși, se poate spune că aceste tehnici vizează căutarea „punctelor în comun” ale măsurătorilor colectate, deși din perspective diferite.

Note privind modelarea matematică

Din punct de vedere matematic, atât EFA cât și CFA lucrează la matricea de corelație dintre variabilele observate sau, în mod similar, la matricea de varianță și covarianță . Tehnicile pot fi utilizate atât cu variabile cantitative, cât și calitative , atât timp cât toate variabilele incluse în model au același tip de metrică; acest lucru este necesar pentru alegerea măsurilor de corelație sau variabilitate pentru calcularea matricilor [2] .

Analiza factorilor exploratori

În cazul EFA, pornind de la corelația sau matricea de varianță și covarianță, factorii sunt extrasați prin diverse tehnici. Printre cele mai frecvent utilizate sunt metoda factorilor principali , factorizarea pe componente principale , estimarea maximă a probabilității ; alegerea celei mai adecvate metode depinde de diverse criterii statistice, metodologice și interpretative. Orice metodă va extrage un număr de factori egal cu numărul de variabile măsurate, dar va fi necesară doar o parte din ele. Alegerea numărului de factori care trebuie luați în considerare în soluția factorială poate fi făcută în funcție de diferite criterii, dintre care trebuie amintite în special următoarele:

  • criteriul Kaiser , pe baza căruia toți factorii a căror valoare proprie este mai mare sau egală cu 1 sunt considerați [3] ;
  • criteriul Cattell, sau analiza graficului de gheață , care stabilește grafic numărul de factori ( graficul de gheață reprezintă valorile proprii în ordonată și dimensiunile, progresiv de la primul, în abscisă) prin căutarea punctului de inflexiune al graficul [3] ;
  • analiza paralelă , care constă în esență în analiza unui „ grafic dublu scree ” în care sunt reprezentate valorile proprii ale factorilor determinați de EFA și ale aceluiași număr de factori aleatori. Numărul de dimensiuni de luat în considerare este stabilit prin căutarea dimensiunii în care valorile proprii „reale” devin mai mici decât cele „aleatorii” [4] .

Este util să ne amintim, pentru a clarifica cele spuse, că valorile proprii se referă la ponderea variabilității „explicată” de factor și că își asumă valori descendente pe măsură ce primul factor se deplasează spre ultimul.

Rezultatul poate fi apoi rotit prin diferite metode. Metodele care utilizează rotații ortogonale păstrează independența factorilor (cea mai utilizată este Varimax ), în timp ce cele care folosesc rotații oblici eliberează constrângerea independenței factorilor pentru a-și îmbunătăți interpretabilitatea (printre aceștia trebuie să menționăm Promax ). Pentru interpretarea rezultatului, cei mai importanți parametri care trebuie evaluați sunt [1] :

  • la nivel global, cantitatea de variabilitate sau, mai exact, de varianță „explicată” de setul de factori considerați și de fiecare factor individual;
  • saturația ( încărcarea factorului ), care descrie puterea relației dintre factor și variabila măsurată; saturațiile foarte mici (dacă sunt standardizate, cu valori absolute mai mici de 0,30 sau 0,40) sunt utilizate în general pentru a exclude relația dintre o variabilă și un factor, simplificând astfel structura. În acest sens, trebuie remarcat faptul că, discutând acest parametru, este logic mai corect să afirmăm „ factorul saturează variabila ” decât invers;
  • caracter comun (comunalitate) sau, alternativ, complementul său la 1, unicitate definită (unicitate), care descrie cât de mult din varianța variabilei observate se explică prin varianța factorului pe care această variabilă l-a saturat sau, atunci când este discutat în termeni de unicitate, ponderea varianței variabilei care nu este explicată de factorul unic al variabilei.

Dacă, după stabilirea structurii factoriale, adică ce factori saturează ce variabile, această structură este multifactorială, un pas suplimentar este adesea efectuat prin efectuarea unui nou EFA individual pentru fiecare factor.

Analiza factorilor de confirmare

CFA este o tehnică foarte diferită de EFA din punct de vedere matematic, reflectând marea diferență de scop între aceste două metode. CFA, de fapt, se realizează prin utilizarea modelelor de ecuații structurale (în engleză SEM, Structural Equation Modeling ). Structura factorială este constrânsă, adică definită a priori de către cercetător (relațiile structurale nu sunt, totuși, singurii parametri care pot / trebuie constrânși). Modelul va proceda la estimarea saturațiilor și, prin urmare, la calcularea unei serii de indici de potrivire care descriu cât de bine se potrivește modelul datelor sau, în termeni mai simpli, cât de bine modelul este capabil să descrie observațiile. Există un număr mare de indici de potrivire, care , în general, pot fi împărțiți în indici absoluți (cum ar fi valoarea statisticii testului Chi-pătrat - singurul care permite, de asemenea, aplicarea unui test inferențial) și RMR, SRMR sau RMSEA), indici relativi (cum ar fi NFI și TLI) și indici comparativi (cum ar fi AIC și BIC ).

Exemple

Variabilele observate sunt adesea elementele unei grile de evaluare. Un exemplu, preluat din psihometrie, este acela de a măsura atitudinea comunicativă non-verbală a pacientului față de un terapeut. Această întindere nu poate fi măsurată direct; cercetătorul, pe de altă parte, poate evalua cu ușurință unele trăsături - de exemplu gesturi sau privire - care ar putea reflecta această atitudine. De unde știi dacă acest lucru este adevărat? După colectarea observațiilor asupra unui număr adecvat de subiecți, stabiliți în funcție de unele criterii de mărime a eșantionului, va fi necesar să se utilizeze analiza factorială (EFA, în acest caz) pentru a arăta că aceste variabile măsurate sunt corelate efectiv între ele de-a lungul unei dimensiuni și verificați dacă această dimensiune poate fi interpretată ca o trăsătură a atitudinii comunicative non-verbale.

Diferențe cu alte tehnici

În timp ce pentru CFA nu există în mod substanțial o tehnică similară, în ceea ce privește EPT, există diverse tehnici statistice care sunt aparent similare și care diferă însă în ceea ce privește tipul de modelare matematică adoptat și / sau în scop.

Poate că cea mai similară tehnică cu EFA este analiza componentelor principale (PCA), care este totuși o tehnică de reducere a dimensionalității datelor care permite descrierea datelor folosind un număr mai mic de variabile prin sintetizarea informațiilor pe baza structurii de corelație sau covarianță a variabilelor observate . Prin urmare, raționamentul este similar cu extragerea factorilor EFA, dar scopul este foarte diferit, precum și faptul că pentru PCA dimensiunile extrase nu trebuie neapărat să își arate coerența teoretică, dar pot reflecta o relație, chiar dacă este doar statistic, între date [1] .

O altă tehnică, mai asemănătoare cu EFA în principiu, dar foarte diferită matematic, este analiza corespondenței simple (CA) sau multiple (MCA). Această tehnică, creată în scopuri pur exploratorii, poate fi utilizată numai cu variabile de natură calitativă nominală și se concentrează de fapt nu pe variabile, ci pe categorii. Tipul de modelare adoptat transformă frecvențele observate pentru fiecare categorie într-o metrică bazată pe distribuția statistică a Chi Square . Apoi reprezintă aceste categorii într-un spațiu a dimensiune, unde este între 1 și numărul de categorii, în care variabilitatea este reprezentată geometric din punct de vedere al inerției, iar distanța geometrică dintre punctele care reprezintă categoriile este cu atât mai mică cu cât categoriile sunt asociate mai mult (adică tind să varieze împreună). Cu toate acestea, este necesar să se precizeze că CA și MCA pot fi folosite și într-o perspectivă foarte diferită: ceea ce este descris aici se referă la analiza corespondenței cu privire la variabile (într-un set de date în format standard, gândind „pe coloane”), în în care ideea de bază este de a evidenția existența profilelor arhetipale care se disting în dimensiuni; cu toate acestea, tehnicile de analiză a corespondenței pot fi folosite și pentru descrierea unităților statistice (într-un set de date în format standard, aceasta înseamnă raționament „prin linii”) și astfel se observă asemănările dintre profilurile diferitelor unități statistice [5] .

Implementări software

Funcțiile de efectuare a analizei factoriale, atât exploratorii, cât și confirmatorii, sunt disponibile în cele mai frecvente programe statistice, inclusiv SAS (Proc Factor ) [6] , Stata ( factor, factormat și comenzi sem ) [7] [8] , SPSS [9] și R.

Notă

  1. ^ a b c ( EN ) Furr, RM și Bacharach, VR, Psychometrics: an introduction , 2nd Edition, SAGE.
  2. ^ ( RO ) Cum pot efectua o analiză factorială cu variabile categorice (sau categorice și continue)? | Întrebări frecvente despre Stata - Statistici IDRE , în Statistici IDRE . Adus pe 2 ianuarie 2018 .
  3. ^ a b Yong, AG și Pearce, S., Un ghid pentru începători pentru analiza factorială: concentrarea asupra analizei factorilor exploratori , în Tutoriale în metode cantitative pentru psihologie , 2013.
  4. ^ Ledesma, RD & Valero-Mora, P., Determinarea numărului de factori de reținut în EFA: un program de calculator ușor de utilizat pentru efectuarea analizei paralele , în Evaluare practică, cercetare și evaluare , 2007.
  5. ^ (EN) Greenacre, M. și Blasius, J., Analiza corespondenței în științele sociale: dezvoltări și aplicații recente, Academic Press, 1994.
  6. ^ (EN) Analiza factorilor | Ieșire adnotată SAS - Statistici IDRE , în Statistici IDRE . Adus pe 2 ianuarie 2018 .
  7. ^ Modelarea ecuațiilor structurale (SEM) | Stata , pe www.stata.com . Adus pe 2 ianuarie 2018 .
  8. ^ (EN) Analiza factorilor | Ieșire adnotată Stata - Statistici IDRE , în Statistici IDRE . Adus pe 2 ianuarie 2018 .
  9. ^ (EN) Analiza factorilor | SPSS Annotated Output - IDRE Stats , în IDRE Stats . Adus pe 2 ianuarie 2018 .

Bibliografie

  • RM Furr & VR Bacharach, Psihometrie: o introducere, ediția a II-a, SAGE
  • JM Bland și DG Altman, Scale și indici de validare , British Medical Journal, 2002
  • AB Costello și JW Osborne, Cele mai bune practici în analiza factorilor exploratori: patru recomandări pentru a profita la maximum de analiza dvs. , Evaluare practică, cercetare și evaluare, 2005
  • AG Yong & S. Pearce, Un ghid pentru începători pentru analiza factorială: concentrându-se pe analiza factorilor exploratori , tutoriale în metode cantitative pentru psihologie, 2013
  • M. Greenacre și J. Blasius, Analiza corespondenței în științele sociale: dezvoltări și aplicații recente , Academic Press, 1994
  • RD Ledesma și P. Valero-Mora, Determinarea numărului de factori de reținut în EFA: un program de calculator ușor de utilizat pentru efectuarea Analizei paralele, evaluării practice, cercetării și evaluării, 2007

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 25778 · LCCN (EN) sh85046817 · GND (DE) 4016338-6 · BNF (FR) cb11934806q (data)