Limbaj de marcare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Un exemplu de imagine creată în limbaj SVG
Un exemplu de imagine creată în limbaj SVG

Limbajul de markup (sau markup ) este un set de reguli care descriu mecanismele de reprezentare (structurale, semantice, de prezentare) sau de dispunere a unui text; folosind convențiile standardizate, aceste reguli pot fi utilizate pe mai multe suporturi. Prin urmare, tehnica de formatare cu markeri (numite expresii codificate ) va necesita o serie de convenții, tipice unui „limbaj de marcare a documentului”.

Descriere

Termenul de marcare (sau marcare ) derivă din mediul tipografic în care a fost folosit pentru a marca cu adnotări părțile textului care trebuiau evidențiate sau corectate, pentru a le semnaliza compozitorului sau dactilografului.

Tipuri

Sigla HTML 5

Diferitele limbaje de marcare existente se disting practic în:

  • limbaje de marcare procedurale;
  • limbaje de marcare descriptive.

Diferența dintre cele două constă în mecanismul utilizat pentru a defini reprezentarea textului, atât în ​​ceea ce privește structura acestuia, atât în ​​ceea ce privește semnificația elementelor care îl compun, cât și în ceea ce privește afișarea (sau formatarea):

  • limbajele de marcare procedurale indică procedurile de procesare a textului prin adăugarea instrucțiunilor care trebuie efectuate pentru a afișa porțiunea de referință a textului ( troff , T E X , ...)
  • limbajele de marcare descriptive lasă alegerea tipului de reprezentare care trebuie aplicat textului software-ului care îl va reproduce din când în când ( SGML , HTML , XML , ...)

Limbile de al doilea tip sunt mai avantajoase, deoarece se concentrează pe problemele structurale de lizibilitate și nu iau în considerare software-ul cu care au fost generate în faza de citire. Cu alte cuvinte, acestea sunt cele care fac posibilă garantarea unei separări corecte între structură (sau conținut) și afișare (sau prezentare, nu neapărat vizuală: de exemplu, vorbită).

SGML (S tandard G eneralized M arkup L anguage) a fost primul standardizate international descriptiv marcare metalimbaj ( ISO 8879 din 1986 ) , că metodele de reprezentare a textului în format electronic , independent de hardware și sistemul de operare utilizat definit. SGML se bazează pe conceptul de definiție a tipului de document sau a Definiției tipului de document (DTD), adică necesită pentru fiecare document definiția modului în care pot fi utilizate diferitele elemente ale textului. De exemplu, o scrisoare conține elemente esențiale precum expeditor , unul sau mai mulți destinatari , data , subiectul , corpul , indicația persoanei care o semnează , .... Toate elementele care trebuie să fie prezente, probabil chiar și cu o anumită ordine. DTD trebuie să se ocupe de definirea tuturor, stabilirea a ceea ce este permis și a ceea ce nu.

HTML a fost dezvoltat la începutul anilor nouăzeci al secolului al XX-lea de Tim Berners-Lee la CERN din Geneva ( Elveția ), împreună cu protocolul HTTP dedicat transferului de documente în acest format. În 1989 Berners-Lee a propus un proiect care implică publicarea hipertextului , cunoscut sub numele de „ world wide web ”. În cadrul acestui proiect, s-au născut atât serverul web „ httpd ” (HyperText Transfer Protocol Daemon), cât și clientul WorldWideWeb (primul browser din istorie), a cărui dezvoltare a început în octombrie 1990 și a cărei utilizare a fost exclusiv internă pentru CERN până la publicarea sa pe internetul în 1991. Ajutat de colegii săi din cadrul institutului elvețian, Berners-Lee a contribuit la definirea primei versiuni de HTML, care a fost făcută publică oficial în iunie 1993 , co-semnat cu Daniel Connolly și susținut de Internet Engineering Task. Grupul de lucru Force (IETF) numit Integration of Internet Information Resources , pentru a-l propune ca standard IETF.

În 1994 , limbajul a avut o puternică difuzare în urma primelor utilizări comerciale ale web - ului , așa că în același an s-a născut World Wide Web Consortium și, din acel moment, dezvoltarea HTML va deveni prerogativa W3C.

În 1995 , W3C a definit versiunea 3.0 a HTML, care a fost urmată de versiunea 3.2 în 1997 , iar în cele din urmă au apărut primele specificații HTML4 în 1998 .

Caracteristicile limbajelor de markup

O caracteristică comună a multor limbaje de markup este că amestecă textul unui document cu instrucțiuni de markup în același flux de date sau fișier. Acest lucru nu este necesar; puteți izola marcajul de conținutul textului, folosind pointeri, compensări, ID-uri sau alte metode pentru a coordona cele două. Acest „markup standoff” este tipic pentru reprezentările interne pe care programele le folosesc pentru a lucra cu documente marcate. Cu toate acestea, marcajul încorporat sau „inline” este mult mai frecvent în altă parte. Iată, de exemplu, o mică secțiune de text marcată în HTML:

 <h1> Anatidae </ h1> 
<p> 
Familia <i> Anatidae </ i> include rațe, gâște și lebede,
dar <em> nu </ em> urlații strâns înrudiți.
</ p>
Exemplu de pagină HTML
Exemplu de pagină HTML

Codurile cuprinse între paranteze unghiulare <like this> sunt instrucțiuni de marcare (cunoscute sub numele de etichete), în timp ce textul dintre aceste instrucțiuni este textul real al documentului. Codurile h1 , p și em sunt exemple de marcare semantică , deoarece descriu scopul intenționat sau semnificația textului pe care îl includ. Mai exact, h1 înseamnă „acesta este un titlu de nivel superior”, p înseamnă „acesta este un paragraf” și em înseamnă „acesta este un cuvânt sau o expresie accentuată”. Un program care interpretează astfel de marcaje structurale poate aplica propriile reguli sau stiluri pentru a prezenta diferite bucăți de text, folosind diferite fonturi, aldine, dimensiunea fontului, indentare, culoare sau alte stiluri, după cum se dorește. De exemplu, o etichetă de tipul „h1” (nivelul antetului 1) ar putea fi prezentată într-un font mare cu caractere îngroșate sans-serif într-un articol sau ar putea fi subliniată într-un document monospațial (în stilul mașinii de scris) sau s-ar putea să nu fie complet completă schimbați prezentarea.

În schimb, eticheta i din HTML 4 este un exemplu de marcare a prezentării , care este de obicei folosit pentru a specifica o anumită caracteristică a textului fără a specifica motivul pentru acesta. În acest caz, elementul i necesită utilizarea unui tipar cursiv. Cu toate acestea, în HTML 5 acest element a fost refăcut cu o utilizare mai semantică: pentru a desemna o gamă de text cu o voce sau o dispoziție alternativă, sau compensată în alt mod de proză normală într-un mod care indică o calitate diferită a textului . De exemplu, elementul i ar trebui utilizat pentru a indica o denumire sau expresie taxonomică în altă limbă [1] . Modificarea a fost făcută pentru a facilita tranziția de la HTML 4 la HTML 5 cât mai ușor posibil, astfel încât utilizările depreciate ale elementelor de prezentare să păstreze cea mai probabilă semantică.

Inițiativa de codificare a textului (TEI) a publicat instrucțiuni extinse [2] cu privire la modul de codificare a textelor de interes pentru științele umane și sociale, dezvoltate de-a lungul anilor de cooperare internațională. Aceste linii directoare sunt utilizate de proiectele care codifică documente istorice, lucrări ale cărturarilor, anumite perioade sau genuri și așa mai departe.

Notă

  1. ^ element , la html.spec.whatwg.org .
  2. ^ TEI: Guidelines , on web.archive.org , 3 iulie 2014. Adus pe 29 ianuarie 2021 (arhivat din original la 3 iulie 2014) .

Elemente conexe

Limbile familiei SGML

Limbile familiei XML

Diagrama XSLT

Limbaje ușoare

Alte limbi

Alte articole conexe

linkuri externe

Controlul autorității Tezaur BNCF 52326 · LCCN (EN) sh95002796 · BNF (FR) cb133199588 (data)