Alinierea secvențelor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Alinierea secvenței este o procedură bioinformatică în care sunt comparate și aliniate două sau mai multe secvențe primare de aminoacizi , ADN sau ARN . Alinierea permite identificarea regiunilor identice sau similare care pot avea relații funcționale, structurale sau filogenetice ( evolutive ). Alinierea este adesea utilizată pentru a verifica dacă o secvență de interes este prezentă într-o bază de date cu secvențe cunoscute sau dacă există una similară.

O aliniere a secvenței, produsă de programul ClustalW între două proteine deget de zinc identificate prin numărul lor de acces GenBank .

Bazele secvențelor aliniate formează rânduri într-o matrice , în timp ce coloanele sunt formate acolo unde este posibil de baze identice sau similare. Spații ( goluri , identificate într-un aliniament de liniuță -) pot fi introduse pentru a obține cel mai mare număr de identități între secvențe și pentru a compensa orice inserții evolutive sau îndepărtări ( indel ) de baze. Dacă două secvențe sunt omoloage , erorile dintr-o aliniere pot fi interpretate ca mutații simple, în timp ce spațiile ca indel introduse într-o secvență după punctul de divergență.

În alinierea secvențelor de aminoacizi, similaritatea dintre bazele din aceeași coloană oferă informații despre conservarea unei anumite regiuni a proteinei . Absența substituțiilor sau prezența exclusivă a substituțiilor conservatoare (un aminoacid substituit cu altul cu un grup lateral R cu proprietăți biochimice similare) într-o regiune a polipeptidei poate indica faptul că această regiune este importantă din punct de vedere structural sau funcțional.

Programele de aliniere specializate pot oferi două opțiuni: alinieri globale sau locale. Alinierea globală este o optimizare care caută să extindă asocierea bazelor de-a lungul unor secvențe întregi; alinierea locală în schimb încearcă să identifice regiunile de similitudine în cadrul unor secvențe care pot fi foarte diferite. Alinierea locală este de obicei preferată, deși este mai dificil de produs, dată fiind problema adăugată a identificării regiunilor similare.

Algoritmi de aliniere

Din punct de vedere istoric, unul dintre primii algoritmi de aliniere globală este algoritmul Needleman-Wunsch din 1970 [1] , bazat pe programare dinamică . În 1981 a fost propus algoritmul Smith-Waterman [2] , din nou bazat pe programare dinamică, dar care produce o aliniere locală.

Pentru a determina distanța de editare , adică cât de diferite sunt secvențele, pot fi utilizate metrici diferite. Cele mai faimoase sunt distanța Levenshtein care numără numărul de substituții, inserții și ștergeri) sau distanța Hamming care numără doar numărul de substituții și nu permite inserții și ștergeri.

Software

Există multe software-uri de aliniere, unul dintre cele mai utilizate și faimoase este BLAST ( Instrumente de căutare de aliniere locală de bază ).

Notă

  1. ^ Needleman, Saul B.; și Wunsch, Christian D., O metodă generală aplicabilă căutării asemănărilor în secvența de aminoacizi a două proteine , în Journal of Molecular Biology , vol. 48, nr. 3, 1970, pp. 443-53, DOI : 10.1016 / 0022-2836 (70) 90057-4 , PMID 5420325 .
  2. ^ Smith, Templul F.; și Waterman, Michael S., Identification of Common Molecular Subsequences , în Journal of Molecular Biology , vol. 147, 1981, pp. 195–197 (arhivat din original la 26 mai 2011) .

Elemente conexe

Alte proiecte

Controlul autorității LCCN ( EN ) sh2008009623