În matematică , în special în domeniul algebrei liniare și al analizei funcționale , pentru o matrice Hermitiană dată {\ displaystyle A} și un vector diferit de zero {\ displaystyle x} , coeficientul Rayleigh este numărul real:
- {\ displaystyle R (A, x): = {x ^ {\ dagger} Ax \ over x ^ {\ dagger} x}}
unde este {\ displaystyle x ^ {\ dagger}} denotă vectorul transpus conjugat de {\ displaystyle x} . Chiar dacă este definit de cantități complexe, coeficientul Rayleigh este întotdeauna real, fiind {\ displaystyle x ^ {\ dagger} Axe} o formă și ființă hermitiană {\ displaystyle x ^ {\ dagger} x = \ | x \ | ^ {2}} , unde este {\ displaystyle \ | \ cdot \ |} indică norma euclidiană. Ca verificare, este suficient să întrebați {\ displaystyle \ alpha: = x ^ {\ dagger} Ax} și observă asta, a fi {\ displaystyle A ^ {\ dagger} = A} , avem:
- {\ displaystyle \ alpha ^ {\ dagger} = x ^ {\ dagger} A ^ {\ dagger} x = x ^ {\ dagger} Ax = \ alpha}
dar asta implică asta {\ displaystyle \ alpha \ in \ mathbb {R}} .
Se poate arăta că coeficientul Rayleigh își asumă valoarea minimă {\ displaystyle \ lambda _ {\ min}} , care este cea mai mică valoare proprie a {\ displaystyle A} , cand {\ displaystyle x} este vectorul propriu corespunzător {\ displaystyle v _ {\ min}} . În mod similar, avem {\ displaystyle R (A, x) \ leq \ lambda _ {\ max}} Și {\ displaystyle R (A, v _ {\ max}) = \ lambda _ {\ max}} .
Imaginea coeficientului Rayleigh este spectrul {\ displaystyle A} , și numărul {\ displaystyle \ lambda _ {\ max}} este raza spectrală .
Matricea de covarianță
Un caz deosebit de important apare atunci când matricea {\ displaystyle A} este matricea de covarianță . O astfel de matrice poate fi reprezentată de produs {\ displaystyle D'D} , unde este {\ displaystyle D} este o matrice de date empirice e {\ displaystyle D '} transpunerea acestuia. Fiind simetric , {\ displaystyle A} posedă valori proprii non-negative și vectori proprii ortogonali (mai precis, ortonormalizabili ). Intr-adevar:
- {\ displaystyle Av_ {i} = D'Dv_ {i} = \ lambda _ {i} v_ {i}}
- {\ displaystyle \ Rightarrow v_ {i} 'D'Dv_ {i} = v_ {i}' \ lambda _ {i} v_ {i}}
- {\ displaystyle \ Rightarrow \ left \ | Dv_ {i} \ right \ | ^ {2} = \ lambda _ {i} \ left \ | v_ {i} \ right \ | ^ {2}}
- {\ displaystyle \ Rightarrow \ lambda _ {i} = {\ frac {\ left \ | Dv_ {i} \ right \ | ^ {2}} {\ left \ | v_ {i} \ right \ | ^ {2} }} \ geq 0}
sau valorile proprii {\ displaystyle \ lambda _ {i}} nu sunt negative. În plus:
- {\ displaystyle {\ begin {align} & \ qquad \ qquad Av_ {i} = \ lambda _ {i} v_ {i} \\ & \ Rightarrow v_ {j} 'Av_ {i} = \ lambda _ {i} v_ {j} 'v_ {i} \\ & \ Rightarrow \ left (Av_ {j} \ right)' v_ {i} = \ lambda _ {j} v_ {j} 'v_ {i} \\ & \ Rightarrow \ lambda _ {j} v_ {j} 'v_ {i} = \ lambda _ {i} v_ {j}' v_ {i} \\ & \ Rightarrow \ left (\ lambda _ {j} - \ lambda _ { i} \ right) v_ {j} 'v_ {i} = 0 \\ & \ Rightarrow v_ {j}' v_ {i} = 0 \ end {align}}}
sau vectorii proprii {\ displaystyle v_ {j}} ele sunt ortogonale (ortonormalizabile în cazul vectorilor proprii diferiți / multipli).
Pentru a arăta că coeficientul Rayleigh este maximizat de vectorul propriu în raport cu cea mai mare valoare proprie ( raza spectrală ), luați în considerare descompunerea unui vector generic {\ displaystyle x} pe baza vectorilor proprii {\ displaystyle v_ {i}} :
- {\ displaystyle x = \ sum _ {i = 1} ^ {n} \ alpha _ {i} v_ {i}}
unde este:
- {\ displaystyle \ alpha _ {i} = {\ frac {x'v_ {i}} {v_ {i} 'v_ {i}}} = {\ frac {\ langle x, v_ {i} \ rangle} { \ left \ | v_ {i} \ right \ | ^ {2}}}}
este coordonata lui {\ displaystyle x} proiectat ortogonal pe {\ displaystyle v_ {i}} . Deci avem:
- {\ displaystyle R (A, x) = {\ frac {x'D'Dx} {x'x}} = {\ frac {\ left (\ sum _ {j = 1} ^ {n} \ alpha _ { j} v_ {j} \ right) '\ left (D'D \ right) \ left (\ sum _ {i = 1} ^ {n} \ alpha _ {i} v_ {i} \ right)} {\ left (\ sum _ {j = 1} ^ {n} \ alpha _ {j} v_ {j} \ right) '\ left (\ sum _ {i = 1} ^ {n} \ alpha _ {i} v_ {i} \ dreapta)}}}
care datorită perpendicularității reciproce a vectorilor proprii devine:
- {\ displaystyle R (A, x) = {\ frac {\ sum _ {i = 1} ^ {n} \ alpha _ {i} ^ {2} \ lambda _ {i}} {\ sum _ {i = 1} ^ {n} \ alpha _ {i} ^ {2}}} = \ sum _ {i = 1} ^ {n} \ lambda _ {i} {\ frac {(x'v_ {i}) ^ {2}} {(x'x) (v_ {i} 'v_ {i})}}}
adică coeficientul Rayleigh este suma cosinusului pătrat al unghiurilor formate între {\ displaystyle x} și vectorii proprii {\ displaystyle v_ {i}} , ponderat de valorile proprii respective.
Dacă un transportator {\ displaystyle x} maximizează {\ displaystyle R (A, x)} , apoi și fiecare scalar diferit de zero {\ displaystyle kx} maximizează {\ displaystyle R} și, prin urmare, problema poate fi redusă la metoda Lagrange pentru maximizare {\ displaystyle \ sum _ {i = 1} ^ {n} \ alpha _ {i} ^ {2} \ lambda _ {i}} , cu conditia ca:
- {\ displaystyle \ sum _ {i = 1} ^ {n} \ alpha _ {i} ^ {2} = 1}
Formulare utilizând multiplicatori Lagrange
Acest rezultat poate fi obținut și folosind metoda multiplicatorului Lagrange . Problema este de a găsi punctele critice ale funcției:
- {\ displaystyle R (A, x) = x ^ {T} Ax}
sub rezerva restricției {\ displaystyle \ | x \ | ^ {2} = x ^ {T} x = 1} . Cu alte cuvinte, este vorba de găsirea punctelor critice ale:
- {\ displaystyle {\ mathcal {L}} (x) = x ^ {T} Ax- \ lambda \ left (x ^ {T} x-1 \ right)}
unde este {\ displaystyle \ lambda} este un multiplicator Lagrange. Punctul staționar al {\ displaystyle {\ mathcal {L}} (x)} apare atunci când:
- {\ displaystyle {\ frac {d {\ mathcal {L}} (x)} {dx}} = 0}
- {\ displaystyle \ Rightarrow 2x ^ {T} A ^ {T} -2 \ lambda x ^ {T} = 0}
- {\ displaystyle \ Rightarrow Axe = \ lambda x}
Și:
- {\ displaystyle R (A, x) = {\ frac {x ^ {T} Ax} {x ^ {T} x}} = \ lambda {\ frac {x ^ {T} x} {x ^ {T} x}} = \ lambda}
Prin urmare, vectorii proprii {\ displaystyle x_ {1}, \ cdots, x_ {n}} din {\ displaystyle A} sunt punctele critice ale coeficientului Rayleigh și ale valorilor proprii respective {\ displaystyle \ lambda _ {1}, \ cdots, \ lambda _ {n}} sunt valorile staționare ale {\ displaystyle R} .
Utilizare în teoria Sturm-Liouville
Teoria Sturm-Liouville studiază acțiunea operatorului liniar :
- {\ displaystyle L (y) = {\ frac {1} {w (x)}} \ left (- {\ frac {d} {dx}} \ left [p (x) {\ frac {dy} {dx }} \ right] + q (x) y \ right)}
pe spațiul prehilbertian definit de:
- {\ displaystyle \ langle {y_ {1}, y_ {2}} \ rangle = \ int _ {a} ^ {b} w (x) y_ {1} (x) y_ {2} (x) \, dx }
compus din funcții care îndeplinesc anumite condiții limită specifice în {\ displaystyle a} Și {\ displaystyle b} . În acest caz, coeficientul Rayleigh este:
- {\ displaystyle {\ frac {\ langle {y, Ly} \ rangle} {\ langle {y, y} \ rangle}} = {\ frac {\ int _ {a} ^ {b} y (x) \ left (- {\ frac {d} {dx}} \ left [p (x) {\ frac {dy} {dx}} \ right] + q (x) y (x) \ right) dx} {\ int _ {a} ^ {b} {w (x) y (x) ^ {2}} dx}}}
Uneori este prezentat într-o formă echivalentă, obținută prin separarea integralei la numărător și utilizarea integrării pe părți :
- {\ displaystyle {\ begin {align} {\ frac {\ langle {y, Ly} \ rangle} {\ langle {y, y} \ rangle}} & = {\ frac {\ left \ {\ int _ {a } ^ {b} y (x) \ left (- {\ frac {d} {dx}} \ left [p (x) y '(x) \ right] \ right) dx \ right \} + \ left \ {\ int _ {a} ^ {b} {q (x) y (x) ^ {2}} \, dx \ right \}} {\ int _ {a} ^ {b} {w (x) y (x) ^ {2}} \, dx}} \\ & = {\ frac {\ left \ {\ left.-y (x) \ left [p (x) y '(x) \ right] \ right | _ {a} ^ {b} \ right \} + \ left \ {\ int _ {a} ^ {b} y '(x) \ left [p (x) y' (x) \ right] \, dx \ right \} + \ left \ {\ int _ {a} ^ {b} {q (x) y (x) ^ {2}} \, dx \ right \}} {\ int _ {a} ^ {b} w (x) y (x) ^ {2} \, dx}} \\ & = {\ frac {\ left \ {\ left.-p (x) y (x) y '(x) \ right | _ {a} ^ {b} \ right \} + \ left \ {\ int _ {a} ^ {b} \ left [p (x) y '(x) ^ {2} + q (x) y (x) ^ {2} \ right] \, dx \ right \}} {\ int _ {a} ^ {b} {w (x) y (x) ^ {2}} \, dx}} \ sfârșit {aliniat}}}
Generalizare
Pentru o pereche dată de matrice {\ displaystyle (A, B)} și pentru un vector dat {\ displaystyle x \ neq {\ vec {0}}} , coeficientul Rayleigh generalizat este definit ca:
- {\ displaystyle R (A, B; x): = {\ frac {x ^ {*} Ax} {x ^ {*} Bx}}}
Coeficientul Rayleigh generalizat poate fi redus la coeficientul Rayleigh {\ displaystyle R (D, C ^ {*} x)} prin transformare {\ displaystyle D = C ^ {- 1} A {C ^ {*}} ^ {- 1}} , unde este {\ displaystyle CC ^ {*}} este descompunerea Cholesky a matricei hermitiene {\ displaystyle B} pozitiv definit .
Bibliografie
- ( EN ) Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau, Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining , Ch. 2, Springer, 2011.
- (EN) Horn, RA și CA Johnson. 1985. Analiza matricei . Cambridge University Press. pp. 176-180.
- ( EN ) Parlet BN Problema simetrică a valorii proprii , SIAM, Classics in Applied Mathematics, 1998.
Elemente conexe
linkuri externe