Indice de fixare

Indicele de fixare (F _ST ) este o măsură de diferențiere a populațiilor datorită structurii genetice. Este adesea evaluat pe baza datelor din polimorfisme genetice, cum ar fi polimorfismele cu nucleotide simple (SNP) sau microsateliții (STR). Dezvoltat ca un caz special al statisticii F a lui Sewall Wright , este una dintre cele mai frecvent utilizate formule statistice în genetica populației .

Definiție

Două dintre cele mai frecvent utilizate definiții pentru _FST la un locus dat se bazează pe varianța frecvențelor alelelor dintre populații și pe probabilitatea identității de către descendenți.

De sine ${\bar {p}}$ ${\ displaystyle {\ bar {p}}}$ ${\ displaystyle {\ bar {p}}}$ este frecvența medie a unei alele în populația totală, $\sigma _{S}^{2}$ ${\ displaystyle \ sigma _ {S} ^ {2}}$ ${\ displaystyle \ sigma _ {S} ^ {2}}$ este varianța frecvenței alelei dintre diferite subpopulații, ponderată de mărimea subpopulațiilor, e $\sigma _{T}^{2}$ ${\ displaystyle \ sigma _ {T} ^ {2}}$ ${\ displaystyle \ sigma _ {T} ^ {2}}$ este varianța stării alelice în populația totală, F _ST este definit ca ^[1]

F_{ST}={\frac {\sigma _{S}^{2}}{\sigma _{T}^{2}}}={\frac {\sigma _{S}^{2}}{{\bar {p}}(1-{\bar {p}})}}

{\ displaystyle F_ {ST} = {\ frac {\ sigma _ {S} ^ {2}} {\ sigma _ {T} ^ {2}}} = {\ frac {\ sigma _ {S} ^ {2 }} {{\ bar {p}} (1 - {\ bar {p}})}}}

{\ displaystyle F_ {ST} = {\ frac {\ sigma _ {S} ^ {2}} {\ sigma _ {T} ^ {2}}} = {\ frac {\ sigma _ {S} ^ {2 }} {{\ bar {p}} (1 - {\ bar {p}})}}}

Definiția lui Wright arată că F _ST măsoară cantitatea de varianță genetică care poate fi explicată prin structura populației. Poate fi, de asemenea, înțeleasă ca fracțiunea diversității totale care nu este o consecință a diversității medii în cadrul subpopulațiilor, unde diversitatea este măsurată prin probabilitatea ca două alele selectate aleatoriu să fie diferite, adică $2p(1-p)$ ${\ displaystyle 2p (1-p)}$ ${\ displaystyle 2p (1-p)}$ .

Dacă frecvența alelei din $the$ ${\ displaystyle i}$ $the$ populația este $p_{i}$ ${\ displaystyle p_ {i}}$ $p_ {i}$ și dimensiunea relativă a populației $the$ ${\ displaystyle i}$ $the$ acest $c_{i}$ ${\ displaystyle c_ {i}}$ $Acolo}$ , asa de

F_{ST}={\frac {{\bar {p}}(1-{\bar {p}})-\sum c_{i}p_{i}(1-p_{i})}{{\bar {p}}(1-{\bar {p}})}}={\frac {{\bar {p}}(1-{\bar {p}})-{\overline {p(1-p)}}}{{\bar {p}}(1-{\bar {p}})}}

{\ displaystyle F_ {ST} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - \ sum c_ {i} p_ {i} (1-p_ {i})} {{\ bar {p}} (1 - {\ bar {p}})}} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - {\ overline {p (1-p)}}} {{\ bar {p}} (1 - {\ bar {p}})}}}

{\ displaystyle F_ {ST} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - \ sum c_ {i} p_ {i} (1-p_ {i})} {{\ bar {p}} (1 - {\ bar {p}})}} = {\ frac {{\ bar {p}} (1 - {\ bar {p}}) - {\ overline {p (1-p)}}} {{\ bar {p}} (1 - {\ bar {p}})}}}

Alternativ ^[2] :

F_{ST}={\frac {f_{0}-{\bar {f}}}{1-{\bar {f}}}}

{\ displaystyle F_ {ST} = {\ frac {f_ {0} - {\ bar {f}}} {1 - {\ bar {f}}}}}

{\ displaystyle F_ {ST} = {\ frac {f_ {0} - {\ bar {f}}} {1 - {\ bar {f}}}}}

unde este $f_{0}$ ${\ displaystyle f_ {0}}$ $f_ {0}$ este probabilitatea identității prin descendență a doi indivizi care se află în aceeași subpopulație, e ${\bar {f}}$ ${\ displaystyle {\ bar {f}}}$ ${\ displaystyle {\ bar {f}}}$ este probabilitatea ca doi indivizi luați din populația totală să fie identici la descendență. Folosind această definiție, F _ST poate fi interpretat ca o măsură pentru apropierea genetică între doi indivizi din aceeași subpopulație, în raport cu populația totală. Dacă rata mutației este scăzută, această interpretare poate fi făcută mai explicită prin legarea probabilității identității prin descendență la timpii de coalescență : atât T _{0 cât} și T denotă timpul mediu de coalescență, primul pentru indivizii aceleiași subpopulații și al doilea din populația totală. Prin urmare,

F_{ST}\approx 1-{\frac {T_{0}}{T}}

{\ displaystyle F_ {ST} \ approx 1 - {\ frac {T_ {0}} {T}}}

{\ displaystyle F_ {ST} \ approx 1 - {\ frac {T_ {0}} {T}}}

Această formulă este cea mai avantajoasă prin faptul că timpul de coalescență prevăzut poate fi ușor estimat pe baza datelor genetice, ceea ce a condus la dezvoltarea mai multor estimatori pentru F _ST .

Stima

Practic niciuna dintre cantitățile utilizate pentru definiții nu poate fi ușor măsurată. Ca urmare, au fost propuși mai mulți estimatori. Un estimator deosebit de simplu, aplicabil datelor secvenței ADN , este ^[3] :

F_{ST}={\frac {\pi _{\text{Between}}-\pi _{\text{Within}}}{\pi _{\text{Between}}}}

{\ displaystyle F_ {ST} = {\ frac {\ pi _ {\ text {Between}} - \ pi _ {\ text {Within}}} {\ pi _ {\ text {Between}}}}}

{\ displaystyle F_ {ST} = {\ frac {\ pi _ {\ text {Between}} - \ pi _ {\ text {Within}}} {\ pi _ {\ text {Between}}}}}

unde este $\pi _{\text{Between}}$ ${\ displaystyle \ pi _ {\ text {Între}}}$ ${\ displaystyle \ pi _ {\ text {Între}}}$ Și $\pi _{\text{Within}}$ ${\ displaystyle \ pi _ {\ text {Within}}}$ ${\ displaystyle \ pi _ {\ text {Within}}}$ reprezintă variația genetică între doi indivizi eșantionați din subpopulații diferite ( $\pi _{\text{Between}}$ ${\ displaystyle \ pi _ {\ text {Între}}}$ ${\ displaystyle \ pi _ {\ text {Între}}}$ ) sau a aceleiași subpopulații ( $\pi _{\text{Within}}$ ${\ displaystyle \ pi _ {\ text {Within}}}$ ${\ displaystyle \ pi _ {\ text {Within}}}$ ). Variația genetică dintr-o populație poate fi calculată ca suma diferențelor perechi împărțite la numărul de perechi. Cu toate acestea, acest estimator este părtinitor atunci când dimensiunile eșantionului sunt mici sau variază între populații. Prin urmare, metode mai elaborate sunt utilizate în practică pentru a calcula F _ST . Două dintre aceste metode cele mai utilizate sunt estimatorul Weir & Cockerham (1984) ^[4] sau analiza varianței moleculare.

Interpretare

Această comparație a variabilității genetice în și între populații este adesea utilizată în genetică aplicată a populației . Valorile variază de la 0 la 1. O valoare zero implică panmissia completă, adică cazul în care cele două populații traversează liber. O valoare a unuia implică faptul că toate variațiile genetice se datorează structurii populației și că cele două populații nu împărtășesc nicio diversitate genetică.

Pentru modelele idealizate, cum ar fi modelul „insulă” al lui Wright, F _ST poate fi utilizat pentru a estima ratele de migrație. Conform acestui model, rata migrației este de

{\hat {M}}\approx {\frac {1}{2}}\left({\frac {1}{F_{ST}}}-1\right)

{\ displaystyle {\ hat {M}} \ approx {\ frac {1} {2}} \ left ({\ frac {1} {F_ {ST}}} - 1 \ right)}

{\ displaystyle {\ hat {M}} \ approx {\ frac {1} {2}} \ left ({\ frac {1} {F_ {ST}}} - 1 \ right)}

Interpretarea F _ST poate fi dificilă atunci când datele analizate sunt extrem de polimorfe. În acest caz, probabilitatea identificării descendenților este foarte scăzută și F _ST poate avea o limită superioară arbitrar scăzută, ceea ce ar putea duce la o interpretare greșită a datelor. Mai mult, F _ST în sens strict nu este o distanță genetică, deoarece nu satisface inegalitatea triunghiulară; ca rezultat, continuă să fie dezvoltate noi instrumente pentru a măsura diferențierea genetică.

Notă

^ (EN) E. Kent Holsinger și Bruce S. Weir, Genetica în populații structurate geografic: definirea, estimarea și interpretarea FST , în Nature Reviews Genetics, vol. 10, nr. 9, 1 septembrie 2009, pp. 639-650, DOI : 10.1038 / nrg2611 . Adus pe 14 octombrie 2015 .
^ (EN) Richard Durrett, Probability Models for DNA Sequence Evolution , Springer, 15 decembrie 2008, ISBN 9780387781693 . Adus pe 14 octombrie 2015 .
^ RR Hudson, M. Slatkin și WP Maddison, Estimarea nivelurilor de flux genic din datele secvenței ADN , în Genetică , vol. 132, nr. 2, 1 octombrie 1992, pp. 583-589. Adus la 15 octombrie 2015 .
^ BS Weir și C. Clark Cockerham, Estimarea statisticilor F pentru analiza structurii populației , în Evolution , vol. 38, nr. 6, 1 noiembrie 1984, pp. 1358-1370, DOI : 10.2307 / 2408641 . Adus la 15 octombrie 2015 .

Alte proiecte

Wikimedia Commons conține imagini sau alte fișiere despre fixarea indexului

Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică

[1] (EN) E. Kent Holsinger și Bruce S. Weir, Genetica în populații structurate geografic: definirea, estimarea și interpretarea FST , în Nature Reviews Genetics, vol. 10, nr. 9, 1 septembrie 2009, pp. 639-650, DOI : 10.1038 / nrg2611 . Adus pe 14 octombrie 2015 .

[2] (EN) Richard Durrett, Probability Models for DNA Sequence Evolution , Springer, 15 decembrie 2008, ISBN 9780387781693 . Adus pe 14 octombrie 2015 .

[3] RR Hudson, M. Slatkin și WP Maddison, Estimarea nivelurilor de flux genic din datele secvenței ADN , în Genetică , vol. 132, nr. 2, 1 octombrie 1992, pp. 583-589. Adus la 15 octombrie 2015 .

[4] BS Weir și C. Clark Cockerham, Estimarea statisticilor F pentru analiza structurii populației , în Evolution , vol. 38, nr. 6, 1 noiembrie 1984, pp. 1358-1370, DOI : 10.2307 / 2408641 . Adus la 15 octombrie 2015 .

[1]

[2]

[3]

[4]