Rosetta @ home

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Rosetta @ home
software
Tip Calcul distribuit
Dezvoltator Laboratorul Baker, Universitatea din Washington; Rosetta Commons
Data primei versiuni 6 octombrie 2005
Sistem de operare Multiplatform
Licență Freeware pentru utilizare academică și non-profit, licență comercială disponibilă [1]
( licența nu este gratuită )
Site-ul web boinc.bakerlab.org/rosetta

Rosetta @ home este un proiect de calcul distribuit pentru predicția structurii proteinelor pe platforma BOINC (Berkeley Open Infrastructure for Network Computing), realizat la laboratorul Baker de la Universitatea din Washington . Rosetta @ home își propune să prezică interacțiunile proteină-proteină și să proiecteze noi proteine ​​cu ajutorul a 373.024 voluntari, 1.190.556 computere, pentru o putere totală de calcul de 278 TeraFLOPS în medie (la 29 decembrie 2015) [2] . Foldit , un joc video de la Rosetta @ home, își propune să atingă aceste obiective cu o abordare „crowdsourcing”. În timp ce cea mai mare parte a proiectului este orientată către cercetarea de bază pentru a îmbunătăți acuratețea și robustețea metodelor de proteomică , Rosetta @ home face, de asemenea, cercetări aplicate asupra malariei , bolii Alzheimer și a altor boli. [3]

Ca toate proiectele BOINC, Rosetta @ home folosește puterea de procesare neutilizată a computerelor voluntarilor pentru a efectua calcule pe unități de lucru individuale. Rezultatele obținute sunt trimise către un server central de proiect, unde sunt validate și introduse în bazele de date ale proiectului. Proiectul este multi-platformă și rulează pe o gamă largă de configurații hardware . Utilizatorii pot vedea progresul predicțiilor structurii proteinei pe screensaver-ul Rosetta @ home.

Rosetta @ Home are, de asemenea, o versiune beta a proiectului, Ralph @ Home , în care sunt testate noi aplicații, noi setări și tot ceea ce va fi apoi introdus în versiunea finală a proiectului.

În plus față de cercetările legate de boli, rețeaua Rosetta @ home servește ca cadru de testare pentru noi metode de bioinformatică structurală. Aceste noi metode sunt apoi utilizate în alte aplicații bazate pe Rosetta, cum ar fi RosettaDock și proiectul Human Proteome Folding , după ce au fost suficient dezvoltate și s-au dovedit a fi stabile în grupul mare și diversificat de utilizatori Rosetta @ home. Două teste deosebit de importante pentru noile metode dezvoltate cu Rosetta @ home sunt Evaluarea critică a tehnicilor pentru predicția structurii proteinelor ( CASP ) și Evaluarea critică a predicției interacțiunilor ( CAPRI ), experimente bienale care, respectiv, evaluează stadiul tehnicii în predicția structurii proteinelor și interacțiunea proteină-proteină. Rosetta @ home se situează printre principalele programe de simulare a interacțiunii proteice și este una dintre cele mai bune metode de predicție a structurii terțiare disponibile. [4]

Platforma de calcul

Atât aplicația Rosetta @ home, cât și platforma de calcul distribuită BOINC sunt disponibile pentru Microsoft Windows, Linux și Macintosh (BOINC este disponibil și pentru alte platforme, cum ar fi FreeBSD). Participarea la Rosetta @ home necesită o unitate centrală de procesare ( CPU ) cu o viteză de ceas de cel puțin 500 MHz , 200 megabiți de spațiu liber pe disc, 512 megabiți RAM și o conexiune la internet. Începând cu 2 martie 2018, versiunea aplicației Rosetta Mini este de 3,78 pentru Windows, Mac și Linux, în timp ce este de 4,07 pentru dispozitivele Android. Versiunea recomandată BOINC este 7.8.3. Standardul HTTP (portul 80) este utilizat pentru comunicarea între clientul BOINC al utilizatorului și serverele Rosetta @ home de la Universitatea din Washington; HTTPS (portul 443) este utilizat la schimbul de parole. Controlul la distanță și local al clientului BOINC folosește porturile 31.416 și 1043, care ar putea fi necesar să fie deblocate în mod specific dacă se află sub un firewall. Unitățile de lucru, care conțin date despre proteine ​​individuale, sunt distribuite de pe servere situate în laboratorul Baker de la Universitatea din Washington către computerele voluntarilor, care calculează o predicție a structurii pentru proteina atribuită. Pentru a evita predicțiile de structură duplicate pe o anumită proteină, fiecare unitate de lucru este inițializată cu numere aleatorii. Acest lucru oferă fiecărei predicții o traiectorie unică de coborâre de-a lungul peisajului energetic al proteinei. Predicțiile structurii de pe Rosetta @ home sunt aproximări ale unui minim global în peisajul energetic al unei proteine ​​date. Acest minim global reprezintă cea mai favorabilă conformație energetică a proteinei, adică starea sa nativă.

O caracteristică principală a interfeței grafice de utilizator ( GUI ) Rosetta @ home este un screensaver care arată progresul unității de lucru care rulează în timpul procesului de pliere simulată. În colțul din stânga sus al economizorului de ecran, proteina țintă este prezentată adoptând diferite forme (conformații) în timp ce caută structura sa cea mai scăzută de energie. Imaginea imediat în dreapta este cea mai recentă structură acceptată. În partea dreaptă sus este cea mai mică conformație energetică găsită până acum, mai jos este structura adevărată sau nativă a proteinei, dacă a fost deja determinată experimental. Trei elemente grafice sunt incluse în screensaver. În centru, un grafic indică energia liberă acceptată, care fluctuează pe măsură ce modelul acceptat se schimbă. Un grafic al rădăcinii pătrate medii a modelului acceptat (RMSD), care măsoară cât de similar modelul acceptat este structural cu modelul original, este afișat în dreapta. În partea dreaptă a graficului energetic și sub graficul RMSD, rezultatele acestor două funcții sunt utilizate pentru a produce energia vs pătratul RMSD, deoarece modelul este rafinat progresiv.

La fel ca toate proiectele BOINC, Rosetta @ home rulează în fundal pe computerul utilizatorului folosind energie neutilizată. Rosetta @ home eliberează resurse de pe CPU de îndată ce sunt solicitate de alte aplicații, astfel încât utilizarea normală a computerului să nu fie afectată. Pentru a minimiza consumul de energie sau de căldură al unui computer susținut, procentul maxim de resurse CPU la care poate accesa Rosetta @ home poate fi specificat prin intermediul preferințelor contului de utilizator. Orele zilelor în care Rosetta @ home este autorizată să efectueze lucrările pot fi, de asemenea, ajustate împreună cu multe alte preferințe, prin setările contului.

Rosetta, software-ul care rulează pe rețeaua Rosetta @ home, a fost rescris în C ++ pentru a permite o dezvoltare mai ușoară decât versiunea sa originală, care a fost scrisă în Fortran . Această nouă versiune este orientată obiect și a fost lansată pe 8 februarie 2008. Dezvoltarea codului Rosetta este realizată de Rosetta Commons. Software-ul este licențiat gratuit comunității academice și este disponibil contra cost companiilor farmaceutice.

Importanța proiectului

Decodarea genomului uman este probabil cea mai mare realizare din acest secol. Dar, înainte ca aceste cunoștințe să poată fi utilizate, oamenii de știință trebuie să facă cercetări cu un pas mai departe: trebuie să înțeleagă modul în care proteinele sunt construite din ADN - ul nostru. Proteinele sunt părțile care alcătuiesc celulele vii.

Odată cu finalizarea genomului uman, oamenii de știință au doar o vedere „plană” a structurii proteinelor (structura primară este secvențele de aminoacizi). Pentru a cunoaște în profunzime ce fac proteinele, oamenii de știință trebuie să cunoască structura tridimensională a proteinelor (structura terțiară). Învățând despre proteine ​​în 3D, oamenii de știință vor putea să înțeleagă rolul lor în procesele celulare și să creeze terapii mai eficiente în combaterea unui număr mare de boli.

Structura 3D a proteinelor este în prezent descoperită experimental în laboratoare prin cristalografie cu raze X sau prin rezonanță magnetică nucleară . Cu toate acestea, procesul este foarte lent (poate dura săptămâni sau chiar luni pentru a afla cum să cristalizeze o proteină pentru prima dată) și foarte costisitor (aproximativ 100.000 USD pe proteină). [5] Odată ce structura 3D a unei proteine ​​este finalizată, aceasta este adesea depusă într-o bază de date din domeniul public, cum ar fi Protein Databank sau Cambridge Protein Structure Database . Din păcate, rata la care sunt descoperite noi secvențe depășește cu mult determinarea structurii lor. Din mai mult de 7.400.000 de secvențe de proteine ​​disponibile în baza de date proteică non-redundantă a NCBI , mai puțin de 140.000 de structuri tridimensionale au fost rezolvate și depuse la Protein Data Bank, baza de date primară pentru informații despre structura proteinelor. [6] Unul dintre principalele obiective ale Rosetta @ home este de a prezice structurile proteice cu aceeași precizie ca metodele existente, dar într-un mod care necesită mult mai puțin timp și bani. Rosetta @ home dezvoltă, de asemenea, metode pentru determinarea structurii și interacțiunii proteinelor de membrană (de exemplu, GPCR), [7] care sunt deosebit de dificil de analizat cu tehnicile tradiționale, dar care reprezintă majoritatea țintelor pentru medicamentele moderne.

CASP6 țintă T0281, prima predicție ab initio a unei structuri proteice care a abordat rezoluția la nivel atomic. Rosetta a produs un model pentru T0281 (suprapus în magenta) cu un RMSD de 1,5 Å din structura cristalină (albastru).

Progresele în predicția structurii proteinelor sunt evaluate la fiecare doi ani în Evaluarea critică a tehnicilor pentru predicția structurii proteinelor (CASP), în care cercetătorii din întreaga lume încearcă să obțină structura unei proteine ​​din secvența aminoacizilor săi. Grupurile de cercetare care obțin un scor ridicat în acest experiment uneori competitiv sunt considerate purtătorii unui standard pentru ceea ce este stadiul tehnicii în prezicerea structurii proteinelor. Rosetta, programul pe care se bazează Rosetta @ home, a fost utilizat de la CASP5 în 2002. În experimentul CASP6 din 2004, Rosetta a intrat în istorie pentru că a fost primul program care a produs, în modelul său prezentat pentru ținta CASP T0281, o predicție a unei structuri proteice ab initio apropiată de rezoluție la nivel atomic. [8] Predicția Ab initio este considerată o categorie deosebit de dificilă de predicție structurală, deoarece nu folosește informații din omologia structurală și se poate baza doar pe informații din omologia secvenței și modelarea fizică a interacțiunilor din cadrul proteinei. Rosetta @ home a fost utilizat în CASP din 2006 și a fost printre primele grupuri de prognoză din fiecare categorie de prognoză a instalațiilor din CASP7. [9] [10] [11] Aceste predicții de înaltă calitate au fost posibile datorită puterii de calcul puse la dispoziție de voluntarii Rosetta @ home. [12] O creștere a puterii de calcul va permite Rosetta @ home să sondeze mai multe regiuni în spațiul conformațional (posibilele forme pe care le poate lua o proteină), care, conform paradoxului Levinthal , cresc exponențial cu lungimea proteinei.

Rosetta @ home este, de asemenea, utilizat în predicția interacțiunilor proteice, în care este determinată structura complexelor multiproteice sau a structurilor cuaternare . Acest tip de interacțiuni proteice sunt prezente în multe funcții celulare, inclusiv antigen - anticorp , legarea enzimei - inhibitor și importul-exportul de celule. Determinarea acestor interacțiuni este esențială pentru dezvoltarea medicamentelor. Rosetta este utilizată în Evaluarea critică a predicției interacțiunilor (CAPRI), care evaluează stadiul tehnicii în domeniul andocării proteinelor, similar cu modul în care CASP măsoară progresul în predicția structurii proteinelor. Puterea de calcul pusă la dispoziție de voluntarii proiectului Rosetta @ home a fost considerată un factor important în performanța Rosetta în CAPRI, unde predicțiile sale de andocare erau printre cele mai exacte și complete. [13]

La începutul anului 2008, Rosetta a fost utilizată pentru proiectarea computațională a unei proteine ​​cu o funcție niciodată văzută în natură. [14] Acest lucru a fost parțial inspirat de un articol de profil înalt din 2004 care descrie proiectarea de calcul a unei proteine ​​cu activitate enzimatică îmbunătățită în raport cu forma sa naturală. [15] Într-un articol din 2008 al grupului David Baker, care citează proiectul Rosetta @ home pentru resursele de calcul pe care le-a pus la dispoziție, descrie modul în care a fost fabricată proteina. Articolul a fost o dovadă importantă a conceptului pentru această metodă de proiectare a proteinelor. Acest tip de proiectare a proteinelor ar putea avea aplicații viitoare în descoperirea medicamentelor, chimia verde și bioremediere.

Relevanță medicală

Rosetta @ home este un proiect axat pe cercetarea de bază, dar o parte a lucrării include diverse virusuri, inclusiv SIDA , boala Alzheimer , cancerul și malaria . Nu toate proiectele menționate anterior sunt deja pe platforma BOINC , deoarece proiectul lucrează la un sistem eficient de așteptare care permite cercetătorilor să prezinte noi proiecte într-un mod simplu (( EN ) [1] ).

Există o legătură în trei puncte care duce de la predicția structurală la tratamentul bolii:

  1. Predicția structurală și proiectarea proteinelor sunt strâns legate :
    Îmbunătățirile în predicția structurală duc la îmbunătățiri în proiectarea proteinelor, care la rândul lor pot fi traduse direct în crearea de noi enzime, vaccinuri etc.
  2. Prognoza structurală identifică ținte pentru noile medicamente :
    Când prezicem structura proteinelor genomului uman la scară largă, aflăm multe despre modul în care funcționează proteinele, ceea ce va ajuta la înțelegerea modului în care funcționează celulele și modul în care se formează bolile. Mai concret, oamenii de știință vor putea identifica multe noi ținte medicamentoase pentru acele mici molecule inhibitoare care pot fi proiectate.
  3. Prognoza structurală vă permite să utilizați „design rațional” pentru a crea noi medicamente :
    Dacă structura unei proteine ​​este cunoscută, siturile funcționale ale acesteia pot fi determinate și în mod specific țintele pentru acele site-uri care pot fi inactivate de un nou medicament.

Cercetări legate de boli

În plus față de cercetările de bază care vizează prezicerea structurii, andocării și proiectării proteinelor, Rosetta @ home este, de asemenea, utilizat în cercetarea imediată a bolilor. Numeroase proiecte minore de cercetare sunt descrise în jurnalul David Baker's Rosetta @ home.

Boala Alzheimer

O componentă a suitei software Rosetta, RosettaDesign, a fost utilizată pentru a prezice cu precizie ce regiuni ale proteinelor amiloidogene sunt cele mai susceptibile de a forma fibrile asemănătoare amiloidului. Luând exopeptide (șase fragmente lungi de aminoacizi) ale unei proteine ​​de interes și selectând cea mai mică energie cu o structură similară cu cea a unei hexapeptide despre care se știe că formează fibrile, RosettaDesign a reușit să identifice peptidele de două ori mai probabil să se formeze. versus proteine ​​aleatorii. Rosetta @ home a fost utilizat în același studiu pentru a prezice structurile betamiloidului , o proteină fibrilară despre care sa presupus că ar fi cauza bolii Alzheimer . Rezultate preliminare, încă nepublicate, au fost obținute pe proteine ​​modificate de Rosetta care pot preveni formarea fibrilelor, deși nu se știe dacă acest lucru poate preveni boala.

Antrax

O altă componentă a Rosetta, RosettaDock, a fost utilizată împreună cu metode experimentale pentru a modela interacțiunile dintre trei proteine ​​- factorul letal (LF), factorul de edem (EF) și antigenul protector (PA) - care alcătuiesc toxina antrax . Modelul computerului a prezis cu acuratețe andocarea între PA și LF, ajutând la stabilirea domeniilor proteinelor respective care sunt implicate în complexul LF-PA. Acest model a fost în cele din urmă utilizat în cercetări care au dus la îmbunătățirea vaccinurilor antrax.

Virusul herpes simplex 1

RosettaDock a fost utilizat pentru a simula ancorarea dintre un anticorp (imunoglobulina G) și o proteină de suprafață exprimată de virusul herpes simplex 1 (HSV-1) care servește la degradarea anticorpului antiviral. Complexul proteic prezis de RosettaDock este de acord îndeaproape cu modelele experimentale care sunt deosebit de dificil de obținut, conducând cercetătorii la concluzia că metoda de predicție a andocării are potențialul de a rezolva unele dintre problemele cristalografiei cu raze X pe care le are modelarea interfețelor proteice.

HIV

Ca parte a cercetării finanțate cu 19,4 milioane de dolari de la Fundația Bill și Melinda Gates, Rosetta @ home a fost utilizată în proiectarea mai multor vaccinuri posibile pentru virusul imunodeficienței umane (HIV).

Malarie

În cercetările implicate în inițiativa „Marile provocări în sănătatea globală”, Rosetta a fost folosită pentru a proiecta noi proteine ​​care ar putea ucide Anopheles gambiae sau ar putea face țânțarul să nu poată transmite malaria . Abilitatea de a modela și modifica în mod specific interacțiunile proteină-ADN oferă metode de proiectare computațională pentru proteine, precum Rosetta, un rol important în terapia genică (care include posibile tratamente pentru cancer ).

Istoria dezvoltării și a software-ului derivat

Introdus inițial de laboratorul Baker în 1998 ca o abordare ab initio a predicției structurii, Rosetta s-a ramificat de atunci în mai multe căi și servicii distincte de dezvoltare. Platforma Rosetta își ia numele de la piatra Rosetta , deoarece încearcă să descifreze „semnificația” structurală a secvențelor de proteine ​​de aminoacizi. La mai bine de șapte ani de la apariția Rosettei, proiectul Rosetta @ home a fost inițiat (adică anunțat că nu mai este beta), pe 6 octombrie 2005. Mulți dintre studenții absolvenți și alți cercetători implicați în dezvoltarea inițială a Rosetta s-au mutat de atunci în alte universități și institute de cercetare și ulterior au consolidat mai multe părți ale proiectului Rosetta.

RosettaDesign

Suprapunerea modelului proiectat de Rosetta (roșu) pentru Top7 pe structura sa cristalină cu raze X (albastru, ID PDB: 1QYS)

RosettaDesign, o abordare computațională bazată pe Rosetta pentru proiectarea proteinelor, a început în 2000 cu un studiu menit să reproiecteze calea de pliere a unei proteine ​​G. În 2002, RosettaDesign a fost folosit pentru a proiecta Top7, o proteină α / β 93 lungă. o pliere nemaivăzută până acum în natură. Această nouă conformație a fost prezisă de Rosetta într-o valoare de 1,2 Å RMSD a structurii determinate de cristalografia cu raze X, care a fost o predicție neobișnuit de precisă. Rosetta și RosettaDesign au câștigat o recunoaștere pe scară largă pentru că sunt primii care proiectează și prezic cu precizie structura unei noi proteine ​​de această lungime. Ca dovadă a acestui fapt, articolul din 2002 care descrie abordarea duală a dus la două scrisori în revista Science și a fost citat de peste 240 de articole științifice diferite. Produsul concret al acestei cercetări, Top7, a fost denumit „Proteina Lunii” pe baza de date Protein Data Bank în octombrie 2006; o suprapunere a nucleelor ​​respective (reziduurile 60-79) ale structurilor sale cristaline prezise și cu raze X, reprezintă sigla Rosetta @ home.

Brian Kuhlman, fost postdoctor în laboratorul lui David Baker și acum profesor asistent la Universitatea din Carolina de Nord, Chapel Hill, oferă RosettaDesign ca serviciu online.

RosettaDock

RosettaDock a fost adăugat la suita software Rosetta în timpul primului experiment CAPRI din 2002 ca algoritm de laborator Baker pentru predicția de andocare proteină-proteină. În acest experiment, RosettaDock a făcut o predicție de înaltă precizie a andocării dintre exotoxina piogenă streptococică A și un receptor al lanțului β al celulei T și o predicție de precizie medie pentru un complex între o α-amilază și anticorpul său. Deși metoda RosettaDock a făcut doar două predicții acceptabile și precise din șapte posibile, acest lucru a fost suficient pentru a o clasa pe locul șapte din cele nouăsprezece metode de predicție din primul experiment CAPRI.

Dezvoltarea RosettaDock s-a împărțit în două ramuri pentru cursele CAPRI ulterioare, deoarece Jeffrey Gray, care a pus bazele RosettaDock în timp ce era la Universitatea din Washington, a continuat să lucreze la metodă în noua sa poziție la Universitatea Johns Hopkins. Membrii laboratorului Baker au continuat dezvoltarea RosettaDock în absența lui Gray. Cele două versiuni diferă ușor în modelarea lanțurilor laterale, selecția „nălucii” și în alte zone. În ciuda acestor diferențe, atât metodele lui Baker, cât și cele ale lui Gray au avut rezultate bune în cea de-a doua competiție CAPRI, clasându-se pe a cincea și, respectiv, a șaptea dintr-un total de 30 de grupe. Serverul RosettaDock al lui Jeffrey Gray este disponibil ca serviciu gratuit de predicție de andocare a proteinelor pentru utilizare necomercială.

În octombrie 2006, RosettaDock a fost integrat în Rosetta @ home. Metoda folosește o etapă de andocare rapidă și brută folosind doar scheletul proteic. Aceasta este urmată de o fază lentă de rafinare atomică în care orientarea respectivă a celor două proteine ​​care interacționează și interacțiunea lanțurilor laterale la interfața proteină-proteină sunt simultan optimizate pentru a găsi cea mai scăzută conformație energetică. Creșterea remarcabilă a puterii de calcul oferită de rețeaua Rosetta @ home, în combinație cu reprezentarea revizuită „fold-tree” a flexibilității scheletului și a modelării în buclă, a determinat RosettaDock să fie al șaselea din 63 de grupuri de predicție în al treilea experiment CAPRI.

Robetta

Serverul Robetta este un serviciu automat de predicție a structurii proteinelor oferit de laboratorul Baker pentru modelare comparativă ab initio necomercială. A participat ca server automat de predicții la experimentele CASP de la CASP5 în 2002, dovedindu-se a fi printre cei mai buni din categoria predicțiilor automate. De atunci, Robetta a concurat în CASP6 și 7, unde s-a descurcat mai bine decât media atât în ​​rândul serverelor automate, cât și al grupurilor de predicții umane.

În modelarea structurii proteinei CASP6, Robetta caută mai întâi omologii structurali folosind BLAST, PSI-BLAST și 3D-Jury, apoi analizează secvența proteinei în domeniile sale individuale sau pliază independent unități ale proteinei, potrivind secvența cu familii.structurale în baza de date Pfam. Domeniile cu omologi structurali urmează, prin urmare, un protocol „model bazat pe șabloane” (de exemplu, modelarea prin omologie). În acest moment, programul de aliniere al laboratorului Baker, sincronizarea K *, produce un set de omologi de secvență și fiecare dintre acestea este modelat prin metoda de novo a lui Rosetta pentru a produce o „rechemare” (posibilă structură). Predicția finală a structurii este selectată luând modelul cu cea mai mică energie determinată de funcția de energie cu rezoluție redusă a lui Rosetta. Pentru domeniile care nu au omologi structurali, este urmat un protocol de novo , în care cel mai mic model de energie dintr-o serie de „apeluri” generate este selectat ca predicție finală. Aceste predicții de domeniu sunt apoi legate împreună pentru a investiga interacțiunile inter-domeniu și terțiar la nivelul proteinei. În cele din urmă, contribuțiile lanțului lateral sunt modelate folosind un protocol Monte Carlo pentru cercetări conformaționale.

În CASP8, Robetta a fost extinsă pentru a utiliza metoda Rosetta de înaltă rezoluție (tot rafinarea atomilor), a cărei absență a fost considerată a fi cauza principală a preciziei mai scăzute a lui Robetta în comparație cu rețeaua Rosetta @ home din CASP7.

Împăturește-l

La 9 mai 2008, după ce utilizatorii Rosetta @ home au sugerat o versiune interactivă a programului de calcul distribuit , laboratorul Baker a lansat public Foldit , un joc online de predicție a structurii proteinelor bazat pe platforma Rosetta. Începând cu 20 septembrie 2016, Foldit are peste 240.000 de utilizatori înregistrați. Jocul oferă utilizatorilor o serie de controale (de exemplu, „amesteca”, „muta”, „reconstrui”) pentru a manipula scheletul și lanțurile laterale ale unei proteine ​​în conformații favorizate energetic. Utilizatorii pot lucra la proteine ​​individual ca „soliști” sau colectiv ca „evolutori”, obținând puncte în ambele categorii pe măsură ce își îmbunătățesc predicțiile de structură. De asemenea, utilizatorii pot concura individual cu alți utilizatori prin modul „duel”, unde câștigă jucătorul care obține cea mai mică structură energetică după 20 de mutări.

Comparație cu proiecte de calcul distribuite similare

Există mai multe proiecte de calcul distribuite care au domenii de studiu similare cu Rosetta @ home, dar diferă prin abordarea lor de cercetare:

Pliant @ acasă

Dintre toate proiectele majore de calcul distribuite implicate în cercetarea proteinelor, Folding @ home este singurul care nu folosește platforma BOINC . Atât Rosetta @ home, cât și Folding @ home fac cercetări privind bolile legate de greșirea proteinelor (de exemplu, boala Alzheimer ), dar Folding @ home o face mai exclusiv. În loc să folosească metode bazate pe structuri sau bazate pe design pentru a prezice comportamentul, să zicem, amiloid , Folding @ home folosește dinamică moleculară pentru a modela modul în care proteinele se pliază (sau pot fi greșite și ulterior agregate). Cu alte cuvinte, puterea Folding @ home este modelarea procesului de pliere a proteinelor, în timp ce puterea Rosetta @ home este predicția structurii proteinelor și a interacțiunilor acestora, precum și proiectarea de noi proteine. De asemenea, cele două proiecte diferă semnificativ în ceea ce privește puterea de calcul și diversitatea hardware-ului utilizat. În medie, în jur de 15,0 PetaFLOPS (15000 TeraFLOPS) cu o bază hardware care include PlayStation 3 și plăci video , Folding @ home are de aproape 55 de ori puterea de calcul a Rosetta @ home, care are o medie de 270 TeraFLOPS cu o bază formată exclusiv din procesoare .

Grila comunitară mondială

Atât faza I cât și faza II a Human Proteome Folding (HPF), un subproiect al World Community Grid , au folosit programul Rosetta pentru a face adnotări structurale și funcționale ale diferitelor genomi. Deși acum îl folosește pentru a crea baze de date pentru biologi, Richard Bonneau, om de știință șef la Human Proteome Folding, a fost activ în dezvoltarea inițială a Rosetta la laboratorul lui David Baker în timp ce își obținea doctoratul.

Predictor @ home

La fel ca Rosetta @ home, Predictor @ home s-a specializat în predicția structurii proteinelor. Predictor @ home a planificat să dezvolte noi zone pentru platforma sa de calcul distribuită în proiectarea proteinelor și a andocării proteinelor (folosind pachetul CHARMM de dinamică moleculară), devenind astfel mai comparabil cu Rosetta @ home. În timp ce Rosetta @ home folosește programul Rosetta pentru predicția structurii sale, Predictor @ home a folosit metodologia dTASSER.

Alte proiecte de calcul distribuite legate de proteine ​​pe BOINC sunt QMC @ home , Docking @ home , POEM @ home , SIMAP și Tanpaku.

Notă

  1. ^ Portfolio Highlight: Rosetta ++ Software Suite , la depts.washington.edu , UW TechTransfer - Digital Ventures. Adus pe 7 septembrie 2008 .
  2. ^ de Zutter W, Rosetta @ home: Prezentare generală a creditului , la boinc.bakerlab.org . Adus pe 14 decembrie 2011 .
  3. ^ Ce este Rosetta @ home? , pe forumurile Rosetta @ home , Universitatea din Washington. Adus la 7 septembrie 2008 (arhivat din original la 13 septembrie 2008) .
  4. ^ Lensink MF, Méndez R, Wodak SJ, Docking and scoring complexes protein: CAPRI 3rd Edition , în Proteins , vol. 69, nr. 4, decembrie 2007, pp. 704-18, DOI : 10.1002 / prot . 21804 , PMID 17918726 .
  5. ^ Bourne PE, Helge W (a cura di), Structural Bioinformatics , Hoboken, NJ, Wiley-Liss, 2003, ISBN 978-0-471-20199-1 , OCLC 50199108 .
  6. ^ Yearly Growth of Protein Structures , su pdb.org , RCSB Protein Data Bank, 2008. URL consultato il 30 novembre 2008 (archiviato dall' url originale il 28 settembre 2008) .
  7. ^ Baker D, Rosetta@home: David Baker's Rosetta@home journal (message 55893) , su Rosetta@home forums , University of Washington, 2008. URL consultato il 7 ottobre 2008 .
  8. ^ Rosetta@home: Research Overview , su Rosetta@home , University of Washington, 2007. URL consultato il 7 ottobre 2008 (archiviato dall' url originale il 25 settembre 2008) .
  9. ^ Kopp J, Bordoli L, Battey JN, Kiefer F, Schwede T, Assessment of CASP7 predictions for template-based modeling targets , in Proteins , 69 Suppl 8, 2007, pp. 38–56, DOI : 10.1002/prot.21753 , PMID 17894352 .
  10. ^ Read RJ, Chavali G, Assessment of CASP7 predictions in the high accuracy template-based modeling category , in Proteins , 69 Suppl 8, 2007, pp. 27–37, DOI : 10.1002/prot.21662 , PMID 17894351 .
  11. ^ Jauch R, Yeo HC, Kolatkar PR, Clarke ND, Assessment of CASP7 structure predictions for template free targets , in Proteins , 69 Suppl 8, 2007, pp. 57–67, DOI : 10.1002/prot.21771 , PMID 17894330 .
  12. ^ Das R, Qian B, Raman S, et al. , Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home , in Proteins , 69 Suppl 8, 2007, pp. 118–28, DOI : 10.1002/prot.21636 , PMID 17894356 .
  13. ^ Wang C, Schueler-Furman O, Andre I, et al. , RosettaDock in CAPRI rounds 6-12 , in Proteins , vol. 69, n. 4, dicembre 2007, pp. 758–63, DOI : 10.1002/prot.21684 , PMID 17671979 .
  14. ^ Jiang L, Althoff EA, Clemente FR, et al. , De novo computational design of retro-aldol enzymes , in Science , vol. 319, n. 5868, marzo 2008, pp. 1387–91, DOI : 10.1126/science.1152692 , PMID 18323453 .
  15. ^ Hayden EC, Protein prize up for grabs after retraction , in Nature , 13 febbraio 2008, DOI : 10.1038/news.2008.569 .

Voci correlate

Altri progetti

Collegamenti esterni