Analiza componentelor independente

Analiza componentelor independente , cunoscută și sub acronimul englez ICA (care înseamnă Independent component analysis ) este o metodă de procesare computațională care servește la separarea unui semnal multivariant în sub-componentele sale aditive, presupunând că există o independență statistică reciprocă a sursa semnalelor non- gaussiene . Acesta este un caz special de separare sursă oarbă .

Definiția ICA

Presupunerea independenței diferitelor unde de semnal se dovedește a fi corectă în multe cazuri, astfel încât separarea oarbă de ICA a unui semnal mixt dă adesea rezultate foarte bune. Este, de asemenea, utilizat pentru semnale care nu se presupune că au fost generate pentru amestecare în scopuri pur analitice. O simplă aplicare a ICA este problema cocktail-ului , unde semnalele de vorbire ale interlocutorului nostru, adiacente muzicii și zgomotul vorbirii simultane ale altora, sunt efectiv separate. De obicei, problema este simplificată presupunând că nu există ecouri sau întârzieri în timpul sosirii la audierea ascultătorului. O notă importantă de luat în considerare este că, dacă sunt prezente N surse, sunt necesare cel puțin N observații (de ex. Microfoane) pentru a obține semnalele originale (J = D, unde D este dimensiunea datelor introduse și J este dimensiunea șablonului ). Au fost examinate alte cazuri de (J <D) care nu au fost bine determinate sau supradeterminate (J> D).

Metoda statistică găsește componentele independente (cunoscute sub numele de factori, variabile latente sau surse) prin maximizarea independenței statistice a componentelor estimate. Non-Gaussianitatea, motivată de teorema limitei centrale , este o metodă de măsurare a independenței componentelor. Non-Gaussianitatea poate fi măsurată, de exemplu, prin curtoză sau aproximări ale negentropiei . Informațiile reciproce sunt un alt criteriu utilizat pe scară largă pentru măsurarea independenței statistice a semnalelor.

Algoritmi ICA tipici

Algoritmii ICA tipici folosesc centrarea, determinarea zgomotului alb (albire) și reducerea dimensiunii (reducerea dimensionalității) ca etape de preprocesare pentru a simplifica și reduce complexitatea problemei privind algoritmul iterativ luat în considerare. Procesele de albire și reducere a dimensiunii pot fi obținute cu analiza componentelor principale sau descompunerea la valori unice ale undei. Procesul de albire asigură că toate dimensiunile sunt tratate în mod egal a priori înainte de lansarea algoritmului. Algoritmii utilizați în ICA includ infomax , FastICA și JADE, dar există și alții.

Metoda ICA nu poate extrage numărul exact de surse de semnal, ordinea în care semnalele sosesc de la surse și nici semnul (pozitiv sau negativ) sau valoarea scalară a surselor.

Metoda este importantă pentru separarea semnalului orb și poate oferi multe aplicații practice.

Definiții matematice

Analiza componentelor liniare independente pot fi împărțite în cazuri și zgomotoase, silentioase unde ICA noiseless este un caz special de ICA zgomotos (zgomotos sau mai degrabă artificiale). ^[1] ICA neliniar ar trebui considerat ca un caz separat. ^[2]

Istorie

Cadrul general care a permis dezvoltarea analizei componente independente a fost dezvoltat de Jeanny Herault și Christian Jutten în 1986 și a fost definit mai clar de Pierre Comon în 1994 . În 1995 , Tony Bell și Terry Sejnowski au demonstrat un algoritm ICA foarte rapid și eficient (bazat pe infomax), un principiu introdus de Ralph Linsker în 1992 .

Există mulți algoritmi prezentați de literatura statistică care pot efectua ICA. Unul utilizat pe scară largă, care este inclus în aplicațiile industriale, este algoritmul FastICA , care a fost dezvoltat de Aapo Hyvärinen și Erkki Oja și folosește kurtosis ca funcție de cost . Alte exemple sunt mai degrabă legate de separarea surselor oarbe , care necesită o abordare mai generică. De exemplu, se poate presupune că sursele sunt independente și se poate proceda la semnale separate care par a fi corelate reciproc și, prin urmare, care sunt statistic „dependente” unele de altele.

Aplicații

Un exemplu de aplicare a algoritmilor ICA este în domeniul electroencefalografiei (EEG), care înregistrează diferența de potențial între diferitele zone ale scalpului, generate de cortexul cerebral și transmise prin meningi și craniu. Semnalele electrice provenite din creier sunt mult atenuate atunci când sunt înregistrate pe scalp (deoarece trec prin meningi , lichidul cefalorahidian , calota craniană, galea aponevrotică și pielea scalpului), cu potențiale care scad la nivelul a microvololtului (μV) și există componente puternice nedorite derivate din mișcările ochilor și ale mușchilor faciali, temporali și frontali.

Algoritmul ICA a fost, de asemenea, utilizat pe scară largă în separarea electrocardiogramei (ECG) a fătului de cea a mamei.

Tehnicile ICA pot fi extinse la analiza datelor non-fizice, dar semantice sau lingvistice . De exemplu, ICA a fost aplicat pentru a face un computer să înțeleagă subiectul discuției într-un set de arhive ale listelor de știri.

Notă

^ Johan Himbergand Aapo Hyvärinen, Analiza componentelor independente pentru date binare: un studiu experimental , Proc. Int. Workshop privind analiza componentelor independente și separarea semnalului orb (ICA2001), San Diego, California, 2001.
^ Huy Nguyen și Rong Zheng, Analiza componentelor binare independente cu sau amestecuri , IEEE Transactions on Signal Processing, Vol. 59, Issue 7. (July 2011), pp. 3168-3181.

Elemente conexe

Alte proiecte

Wikimedia Commons conține imagini sau alte fișiere despre Analiza componentelor independente

linkuri externe

( EN ) Ce este analiza componentelor independente? de Aapo Hyvärinen
( EN ) Capitolul introductiv al cărții A. Hyvärinen, J. Karhunen, E. Oja (2001). Analiza componentelor independente
(EN) FastICA ca pachet pentru Matlab, limbaj R, C ++ și Python , pe cis.hut.fi.
( EN ) Cutii de instrumente ICALAB pentru Matlab, dezvoltate la Riken
( EN ) Setul de instrumente de analiză a semnalului de înaltă performanță oferă implementări C ++ ale FastICA și Infomax
( EN ) Software gratuit pentru ICA de către JV Stone.
( RO ) Demonstrarea problemei cocktail-urilor , pe cis.hut.fi. Adus la 17 ianuarie 2007 (arhivat din original la 13 martie 2010) .
( EN ) EEGLAB Toolbox ICA al EEG pentru Matlab, dezvoltat la UCSD.
( EN ) FMRLAB Toolbox ICA al fMRI pentru Matlab, dezvoltat la UCSD
( EN ) Discuție despre ICA utilizată într-un context biomedical de reprezentare a formei , pe brandon-merkl.blogspot.com .

Portal IT	Portal de inginerie
Portalul Medicinii	Portalul de statistici

[Hyvärinen-1] Johan Himbergand Aapo Hyvärinen, Analiza componentelor independente pentru date binare: un studiu experimental , Proc. Int. Workshop privind analiza componentelor independente și separarea semnalului orb (ICA2001), San Diego, California, 2001.

[Huyna-2] Huy Nguyen și Rong Zheng, Analiza componentelor binare independente cu sau amestecuri , IEEE Transactions on Signal Processing, Vol. 59, Issue 7. (July 2011), pp. 3168-3181.

[1]

[2]

V · D · M Învățare automată
Probleme	Clasificarea · Regresie · asociere Reguli · Învățare nesupravegheați · Supravegheat de învățare · Reinforcement Learning · învățare profundă
Învățare nesupravegheată	Clustering · clustering Ierarhica · K mijloace · Așteptarea maximizare · DBSCAN · schimbare medie · antagonist generativă rețea (CGAN · cycleGAN VAE-GAN)
Învățare supravegheată	Arborele decizional · Pădure aleatorie · CRF · HMM · KNN · Clasificator bayesian · Rețea neuronală artificială · Regresie liniară · Regresie logistică · PGM · SVM
Consolidarea învățării	Q-learning · SARSA · TD
Reducerea dimensiunii	Analiza factorilor · CCA · ICA · LDA · PCA · Selecția caracteristicilor · Extragerea caracteristicilor · t-SNE
Rețele neuronale artificiale	Perceptron · RBF · N · FFN · Rețea Hopfield · MLP · RNN ( LSTM ) · RBM · SOM · CNN · TDNN · SNN
Software	Keras · Microsoft Cognitive Toolkit · scikit-learn · TensorFlow · Theano · Torch · Weka
Alte	Algoritm genetic · PSO · Caracteristic