Indice de fixare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Indicele de fixare (F ST ) este o măsură de diferențiere a populațiilor datorită structurii genetice. Este adesea evaluat pe baza datelor din polimorfisme genetice, cum ar fi polimorfismele cu nucleotide simple (SNP) sau microsateliții (STR). Dezvoltat ca un caz special al statisticii F a lui Sewall Wright , este una dintre cele mai frecvent utilizate formule statistice în genetica populației .

Definiție

Două dintre cele mai frecvent utilizate definiții pentru FST la un locus dat se bazează pe varianța frecvențelor alelelor dintre populații și pe probabilitatea identității de către descendenți.

De sine este frecvența medie a unei alele în populația totală, este varianța frecvenței alelei dintre diferite subpopulații, ponderată de mărimea subpopulațiilor, e este varianța stării alelice în populația totală, F ST este definit ca [1]

Definiția lui Wright arată că F ST măsoară cantitatea de varianță genetică care poate fi explicată prin structura populației. Poate fi, de asemenea, înțeleasă ca fracțiunea diversității totale care nu este o consecință a diversității medii în cadrul subpopulațiilor, unde diversitatea este măsurată prin probabilitatea ca două alele selectate aleatoriu să fie diferite, adică .

Dacă frecvența alelei din populația este și dimensiunea relativă a populației acest , asa de

Alternativ [2] :

unde este este probabilitatea identității prin descendență a doi indivizi care se află în aceeași subpopulație, e este probabilitatea ca doi indivizi luați din populația totală să fie identici la descendență. Folosind această definiție, F ST poate fi interpretat ca o măsură pentru apropierea genetică între doi indivizi din aceeași subpopulație, în raport cu populația totală. Dacă rata mutației este scăzută, această interpretare poate fi făcută mai explicită prin legarea probabilității identității prin descendență la timpii de coalescență : atât T 0 cât și T denotă timpul mediu de coalescență, primul pentru indivizii aceleiași subpopulații și al doilea din populația totală. Prin urmare,

Această formulă este cea mai avantajoasă prin faptul că timpul de coalescență prevăzut poate fi ușor estimat pe baza datelor genetice, ceea ce a condus la dezvoltarea mai multor estimatori pentru F ST .

Stima

Practic niciuna dintre cantitățile utilizate pentru definiții nu poate fi ușor măsurată. Ca urmare, au fost propuși mai mulți estimatori. Un estimator deosebit de simplu, aplicabil datelor secvenței ADN , este [3] :

unde este Și reprezintă variația genetică între doi indivizi eșantionați din subpopulații diferite ( ) sau a aceleiași subpopulații ( ). Variația genetică dintr-o populație poate fi calculată ca suma diferențelor perechi împărțite la numărul de perechi. Cu toate acestea, acest estimator este părtinitor atunci când dimensiunile eșantionului sunt mici sau variază între populații. Prin urmare, metode mai elaborate sunt utilizate în practică pentru a calcula F ST . Două dintre aceste metode cele mai utilizate sunt estimatorul Weir & Cockerham (1984) [4] sau analiza varianței moleculare.

Interpretare

Această comparație a variabilității genetice în și între populații este adesea utilizată în genetică aplicată a populației . Valorile variază de la 0 la 1. O valoare zero implică panmissia completă, adică cazul în care cele două populații traversează liber. O valoare a unuia implică faptul că toate variațiile genetice se datorează structurii populației și că cele două populații nu împărtășesc nicio diversitate genetică.

Pentru modelele idealizate, cum ar fi modelul „insulă” al lui Wright, F ST poate fi utilizat pentru a estima ratele de migrație. Conform acestui model, rata migrației este de

Interpretarea F ST poate fi dificilă atunci când datele analizate sunt extrem de polimorfe. În acest caz, probabilitatea identificării descendenților este foarte scăzută și F ST poate avea o limită superioară arbitrar scăzută, ceea ce ar putea duce la o interpretare greșită a datelor. Mai mult, F ST în sens strict nu este o distanță genetică, deoarece nu satisface inegalitatea triunghiulară; ca rezultat, continuă să fie dezvoltate noi instrumente pentru a măsura diferențierea genetică.

Notă

  1. ^ (EN) E. Kent Holsinger și Bruce S. Weir, Genetica în populații structurate geografic: definirea, estimarea și interpretarea FST , în Nature Reviews Genetics, vol. 10, nr. 9, 1 septembrie 2009, pp. 639-650, DOI : 10.1038 / nrg2611 . Adus pe 14 octombrie 2015 .
  2. ^ (EN) Richard Durrett, Probability Models for DNA Sequence Evolution , Springer, 15 decembrie 2008, ISBN 9780387781693 . Adus pe 14 octombrie 2015 .
  3. ^ RR Hudson, M. Slatkin și WP Maddison, Estimarea nivelurilor de flux genic din datele secvenței ADN , în Genetică , vol. 132, nr. 2, 1 octombrie 1992, pp. 583-589. Adus la 15 octombrie 2015 .
  4. ^ BS Weir și C. Clark Cockerham, Estimarea statisticilor F pentru analiza structurii populației , în Evolution , vol. 38, nr. 6, 1 noiembrie 1984, pp. 1358-1370, DOI : 10.2307 / 2408641 . Adus la 15 octombrie 2015 .

Alte proiecte

Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică