Mutație acceptată punctual

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

PAM, acronim pentru Mutarea acceptată în puncte sau Procentul de mutație acceptată, indică un set de matrice de substituție utilizate în bioinformatică pentru alinierea a două secvențe de caractere ( nucleotide sau aminoacizi ).

În timpul căutării unei alinieri între două secvențe, este de fapt necesar să se evalueze bunătatea aliniamentelor găsite. Pentru a face acest lucru, un scor este atribuit fiecărei perechi de caractere, ceea ce va permite să găsească alinierea care maximizează asemănarea dintre cele două secvențe. În acest context, se pune întrebarea dacă substituțiile dintre caractere au toate aceeași importanță și, prin urmare, ar trebui evaluate toate în același mod.

Origini

Matricile PAM sunt rezultatul unui studiu din 1978 realizat de Margaret Dayhoff . [1] Au fost analizate 71 de familii de proteine ​​strâns legate, pentru a analiza frecvența diferitelor substituții de caractere. S-a observat că substituțiile nu au fost aleatorii, dar unele au avut loc mai ușor decât altele, probabil pentru că nu au modificat semnificativ structura și funcția proteinei.

Structura

Fiecare matrice are o dimensiune de 20x20 (douăzeci este numărul de aminoacizi obișnuiți) și fiecare celulă reprezintă probabilitatea de a înlocui un aminoacid cu altul. Pentru fiecare aminoacid j , se numără toate modificările unui alt aminoacid k . Frecvența este normalizată prin împărțirea la totalul modificărilor. Cu această procedură obținem matricea A a substituțiilor din blocurile de secvențe considerate. Un model probabilistic Markov este apoi construit pentru a modela substituțiile care au avut loc. [2] Prin urmare, matricea bazică PAM1 definește probabilitatea de tranziție a unui aminoacid într-un alt aminoacid care permite păstrarea a 99% din secvență. Pornind de la matricea de substituție A obținem:

pentru

cu

Coeficientul c este ales astfel încât porțiunea de schimbări așteptate de model să fie egală cu 1%, presupunând ca distribuția inițială observată în blocurile inițiale.

Prin urmare rezolvarea
se obține valoarea lui c . Logitul probabilităților de tranziție este introdus în matrice.

Deci putem avea trei cazuri

  • trecerea probabilă a lui i în j
  • tranziție aleatorie
  • tranziție puțin probabilă

Dacă vrem să luăm în considerare procente mai mari de schimbare, înmulțiți matricea cu ea însăși.

Cea mai utilizată matrice este PAM250, care acceptă o modificare globală de 250%. Cu toate acestea, la acest nivel, secvențele de aminoacizi păstrează încă o similaritate de 20% (cit.)

Utilizare

Matricea PAM este apoi utilizată atât pentru a evalua bunătatea unei alinieri globale între două secvențe de aminoacizi, cât și pentru a măsura distanța dintre două secvențe. Exemplu: două secvențe S1 și S2 sunt separate de o unitate PAM dacă S1 poate fi transformat în S2 cu o medie de mutație punctuală la fiecare 100 de aminoacizi.

Notă

  1. ^ Dayhoff, MO, Schwartz, R. și Orcutt, BC, Un model de schimbare evolutivă în proteine , în Atlasul secvenței și structurii proteinelor , volumul 5, suplimentul 3, Nat. Biomed. Res. Found., 1978, pp. 345–358, ISBN 0-912466-07-3 .
  2. ^ Baldi P , Chauvin Y, Hunkapiller T, McClure MA., Modele ascunse Markov de informații secvențiale biologice primare , în Proc Natl Acad Sci SUA , vol. 91, nr. 3, 1994, pp. 1059–63, DOI : 10.1073 / pnas.91.3.1059 , PMID 8302831 .

Elemente conexe