ZÂMBETE

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

SMILES ( acronim pentru Simplified Molecular Input Line Entry System [1] ) este o metodă de descriere a structurii unei molecule folosind un șir ASCII scurt.

Șirurile SMILES sunt importate de majoritatea software-ului de proiectare a moleculelor pentru a crea modele bidimensionale sau tridimensionale.

Codificarea SMILES a fost dezvoltată în 1980 de Arthur Weininger și David Weininger, apoi modificată și extinsă de alții, dintre care cea mai mare este Daylight Chemical Information Systems Inc. Alte notații liniare sunt Wiswesser Line Notation (WLN), ROSDAL și SLN (Tripos Inc). Recent, IUPAC a introdus InChI ( International Chemical Identifier ) ca standard pentru reprezentarea formulelor.

ZÂMBETE canonice și ZÂMBETE izomerice

Termenul canonical SMILES ( Canonical SMILES ) indică versiunea specificației SMILES care dictează regulile astfel încât fiecare moleculă să aibă o singură reprezentare SMILES. O aplicație obișnuită este indexarea moleculelor într-o bază de date .

Termenul SMILES Isomeric ( Isomeric SMILES ) indică versiunea specificației SMILES care include reguli pentru specificarea configurațiilor izomerilor , chiralității și dublei legături.

ZÂMBETE ca reprezentare a unui grafic

În ceea ce privește procedurile de calcul bazate pe grafice , SMILES este un șir obținut prin imprimarea simbolurilor nodurilor prezente pe grafic care reprezintă formula structurală. Atomii de hidrogen sunt mai întâi eliminați din grafic, apoi buclele sunt deschise pentru a converti graficul într-un copac deschis. Acolo unde buclele au fost deschise, se adaugă sufixe numerice pentru a indica ce noduri sunt conectate. Ramurile copacului sunt indicate prin utilizarea parantezelor.

Exemple

Atomii sunt reprezentați folosind simbolul lor chimic închis între paranteze pătrate, cum ar fi [Au] pentru aur . Anionul hidroxid este [OH-]. Parantezele pătrate pot fi omise pentru atomii „organici” C , N , O , P , S , Br , Cl și I. Toate celelalte elemente trebuie incluse între paranteze drepte. Dacă parantezele pătrate sunt omise, se presupune că numărul de atomi de hidrogen este implicit; de exemplu, ZÂMBETUL pentru apă este pur și simplu O, iar pentru etanol este CCO.

Dubla legătură a dioxidului de carbon este reprezentat ca O = C = O și legătura triplă a acidului cianhidric ca C # N.

Ciclohexanul este reprezentat ca C1CCCCC1, ideea este că cei doi indică aceeași poziție în moleculă, formând astfel un inel cu șase atomi de carbon. Rețineți că numeralul (în acest caz 1) reprezintă poziția, mai degrabă decât combinația „C1”. Iată notația extinsă pentru a clarifica: (C1) - (C) - (C) - (C) - (C) - (C) -1, mai degrabă decât (C1) - (C) - (C) - (C) - (C) - (C) - (C1).

Atomii aromatici C, O, S și N sunt reprezentați cu caracterele lor mici, „c”, „o”, „s” și respectiv „n”.

Ramurile sunt reprezentate de paranteze rotunde, de exemplu CCC (= O) O pentru acidul propionic și C (F) (F) F pentru fluoroform , care ar putea fi descrise și prin formula necanonică: FC (F) F.

ZOMBRE izomerice

Structura cis- difluoretilenei

Configurațiile cu legare dublă sunt reprezentate folosind caracterele "/" și "\". De exemplu, F / C = C / F reprezintă trans - difluoretilenă , unde atomii de fluor sunt pe partea opusă a dublei legături, în timp ce F / C = C \ F reprezintă cis- difluoretilenă, unde atomii de fluor sunt pe aceeași latura ca dubla legătură.

Extensii

SMARTS este o variantă a SMILES care permite indicarea atomilor și a legăturilor „wildcard”. Această caracteristică este utilizată pe scară largă în algoritmii de căutare a bazelor de date chimice.

Notă

Elemente conexe

Alte proiecte

linkuri externe

Chimie Portalul chimiei : portalul științei compoziției, proprietăților și transformărilor materiei