GenBank

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
GenBank versiunea 100 CD

GenBank este o bază de date cu acces deschis , înființată în 1982, care raportează toate secvențele de nucleotide și proteinele conexe obținute după traducerea lor. Baza de date este produsă și întreținută de Centrul Național pentru Informații despre Biotehnologie (NCBI), care face parte din Institutul Național de Sănătate al SUA , în cadrul Colaborării Internaționale a Bazelor de Date cu Secvențe de Nucleotide (INSDC). [1]

GenBank își primește informațiile din rezultatele obținute pe peste 300.000 de organisme distincte de la laboratoare din întreaga lume, [2] reprezentând cel mai important punct de referință din domeniul său de cercetare. Versiunea 236.0, din 15 februarie 2020, conține peste 216 milioane loci și peste 399 miliarde baze din peste 216 milioane secvențe raportate. [3]

fundal

Ideea creării unei baze de date pentru secvențele de nucleotide s-a născut inițial în 1979 cu Walter Goad, cercetător în grupul de biologie teoretică și biofizică de la Laboratorul Național Los Alamos, printre principalii promotori. [4] Trei ani mai târziu, a fost creat GenBank, cu finanțare de la Institutele Naționale de Sănătate și alte agenții federale. Laboratorul Național Los Alamos a început să colaboreze cu Bolt, Beranek și Newman și, într-un an, GenBank a colectat peste 2.000 de secvențe.

La mijlocul anilor 1980 , compania de bioinformatică Intelligenetics a Universității Stanford a gestionat proiectul GenBank, din nou în colaborare cu Laboratorul Național Los Alamos. [5] Una dintre primele comunități de bioinformatică de pe Internet , GenBank a început să promoveze comunicările științifice cu acces deschis. Între 1989 și 1992, proiectul a fost transferat către noul Centru Național de Informații Biotehnologice. [6]

Trimiterea datelor

Numai secvențele originale pot fi trimise către GenBank. Datele directe pot fi trimise online prin BankIt sau offline utilizând software-ul Sequin . Odată ce secvența a fost primită, personalul examinează originalitatea datelor și îi atribuie un număr de acces, garantând controlul calității. În cele din urmă, datele sunt introduse în baza de date și făcute publice, devenind accesibile prin Entrez sau descărcabile prin FTP . Trimiterile în bloc ale etichetei de secvență exprimată (EST), a site-ului marcat cu secvență (STS), a secvenței de sondare a genomului (GSS) și a secvenței de genom cu randament ridicat (HTGS) sunt cel mai adesea lucrarea centrelor de secvențiere pe scară largă. GenBank gestionează și procesează, de asemenea, secvențe genomice microbiene complete.

Notă

  1. ^ (RO) GenBank Overview , pe ncbi.nlm.nih.gov. Adus pe 4 iulie 2016 .
  2. ^ EW Sayers și I. Karsch-Mizrachi, folosind GenBank , în Methods Mol Biol , vol. 1374, 2016, pp. 1-22, DOI : 10.1007 / 978-1-4939-3167-5_1 .
  3. ^ (EN) Note de distribuție (TXT) pe ftp.ncbi.nih.gov, Centrul Național pentru Informații despre Biotehnologie, 15 februarie 2020. Accesat pe 23 februarie 2020.
  4. ^ (EN) Walter B. Goad, GenBank (PDF) pe fas.org. Adus pe 4 iulie 2016 .
  5. ^ (EN) Istoria LANL GenBank , pe bio.net. Adus pe 4 iulie 2016 .
  6. ^ D. Benton, Recent changes in the GenBank On-line Service , in Nucleic Acids Res , vol. 18, nr. 6, 1990, pp. 1517-1520, PMID 2326192 .

Alte proiecte

linkuri externe

Controlul autorității LCCN ( EN ) n85375442