Gramatică regulată

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Chomsky-Hierarchy.jpg

O gramatică obișnuită , în informatică, este o gramatică formală generativă . Numită și dreapta liniară sau stânga liniară , conform ierarhiei Chomsky este o gramatică de tip 3.

Reamintește

Pictogramă lupă mgx2.svg Același subiect în detaliu: Gramatica formală .

La fel ca alte gramatici formale, este o cvadruplă , in care

  1. sunt simbolurile non-terminale
  2. sunt simbolurile terminale
  3. axioma menționată este simbolul de început non-terminal.
  4. sunt regulile de producție, o relație binară de cardinalitate finită pe , pe care în mod normal scriem ca
    această scriere ne spune că în stânga trebuie să existe cel puțin un non-terminal și în dreapta orice.

Definiție

Producțiile unei gramatici obișnuite sunt de tipul:

  • în cazul stânga liniară (în engleză left grammar regular )
adică în stânga regulii de producție există un non-terminal și în dreapta un non-terminal urmat de un terminal sau un singur terminal.
  • în cazul drepturilor liniare (în engleză right regular grammar )
adică în stânga regulii de producție există un non-terminal și în dreapta un terminal urmat de un non-terminal sau un singur terminal.

Acordăm atenție faptului că nu trebuie să existe producții mixte formate din dreapta și stânga liniare în același timp în aceeași gramatică, deoarece în acest caz nu mai suntem în prezența unei gramatici obișnuite, ci a unei gramatici libere de context ( nu contextual ) așa cum este evidențiat într-un exemplu de mai jos.

Acestea sunt numite regulate deoarece limbajele generate de aceste gramatici sunt reprezentabile prin expresii regulate .
Termenul liniar derivă din faptul că în dreapta producțiilor putem găsi cel mult un non-terminal; stânga sau dreapta indică locul în care non-terminalul va fi relativ la terminal.

Limbile care pot fi generate de gramaticile obișnuite (tip-3) se numesc limbi regulate și sunt echivalente cu limbile recunoscute de automatele de stare finită și cu limbile reprezentate de expresii regulate .

Fiecare gramatică obișnuită este, de asemenea, o gramatică fără context, deoarece gramaticile de tip 3 sunt strict cuprinse în gramaticile de tip 2 conform ierarhiei Chomsky .

Unele manuale și articole nu permit reguli de producție goale ( ε-producții ) și presupun că șirul gol nu este prezent în limbă.
În orice caz, se dovedește teorema care garantează că o gramatică dată ale cărei reguli de producție P pot fi separate în două subseturi care conțin una producțiile goale și cealaltă producțiile obișnuite, atunci există o gramatică regulată format din gramatică la care au fost eliminate producțiile goale.
Mai formal regulat fără ε-producții astfel încât

Exemple

Un exemplu de gramatică liniară dreaptă cu axiomă, format din următoarele reguli de producție:

Această gramatică descrie același limbaj ca și expresia regulată .

Un alt exemplu de gramatică liniară dreaptă cu axiomă, format din următoarele reguli de producție:

Această gramatică descrie același limbaj ca și expresia regulată .

Exemplu de gramatică neregulată

O gramatică care generează limbaj ar putea fi cu axiomă, format din următoarele reguli de producție:

dar aceasta nu este o gramatică obișnuită, ci o gramatică fără context ; are atât producții din dreapta, cât și din stânga și, prin urmare, nu este obișnuit.

Bibliografie

  • Giorgio Ausiello, Fabrizio d'Amore, Giorgio Gambosi. Limbi, modele, complexitate . Franco Angeli Editore, 2003 ISBN 88-464-4470-1

Elemente conexe

Teoria automatelor : limbaje formale și gramatici formale
Ierarhia Chomsky Gramatica formală Limba Automat minim
Tipul-0 (nelimitat) Recursiv enumerabil Mașină Turing
(nelimitat) Recursiv Decider
Tipul 1 Context dependent Context dependent Automat liniar
Tipul 2 Fără context Fără context Automat cu baterie ND
Tipul 3 Regulat Regulat Stări finite
Fiecare categorie de limbă sau gramatică este un subset adecvat al categoriei imediat deasupra acesteia.
Lingvistică Portalul lingvistic : accesați intrările Wikipedia care se ocupă de lingvistică