ISO 639

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

ISO 639 este un standard internațional pentru clasificarea limbilor și a grupurilor de limbi și le oferă un cod unic de identificare.

Scopul ISO 639 este de a crea un catalog universal recunoscut de coduri convenționale care sunt asociate în mod unic cu limbi individuale fără ambiguitate. Termenul limbă include mai multe forme de comunicare nu numai limitate la limbile vorbite , dar include și limbi extinse sau istorice, grupuri lingvistice sau macro-limbi sau macro-limbi, variante lingvistice, dialecte , precum și forme nespuse de comunicare, cum ar fi limbajul semnelor . Pe de altă parte, limbile utilizate în domeniul IT sunt excluse.

ISO 639 a fost aprobat pentru prima dată în 1967, dar constă din diferite secțiuni (numerotate de la -1 la -6) care au fost publicate și actualizate de mai multe ori de-a lungul anilor până în secolul XXI extinzând din când în când versiunea ISO anterioară . Cele mai des utilizate standarde sunt ISO 639-1 și ISO 639-3.

Codurile de identificare furnizate de ISO 639 pot fi utilizate în multe domenii și aplicații, de exemplu pentru a indica în ce limbă este scris un text sau un site web, pentru a identifica limba sursă a unui termen definit într-un dicționar, limbile gestionate dintr-un software , denumirea unei locații etc. Din acest motiv, ISO 639 este utilizat pe scară largă în domeniul tehnologiei informației, designului web și în gestionarea arhivelor bibliografice.

Caracteristicile codurilor

Codurile ISO identifică următoarele limbi:

  • Limbi individuale
  • Macro-limbi (partea 3)
  • Colecție de limbi (partea 1, 2, 5)
  • Dialecte
  • Limbi rezervate pentru uz local (partea 2, 3)
  • Cazuri speciale (partea 2, 3)

Tipuri (pentru limbi individuale):

  • Limbi folosite (partea 2, 3) (toate macro-limbile sunt limbi utilizate)
  • Limbi dispărute (partea 2, 3)
  • Limbi străvechi (partea 1, 2, 3)
  • Limbi istorice (partea 2, 3)
  • Limbaje artificiale (partea 2, 3)

Coduri bibliografice și terminologice:

  • Bibliografii (partea 2)
  • Terminologii (partea 2)

ISO 639-1

Pictogramă lupă mgx2.svg Același subiect în detaliu: ISO 639-1 .
  • ISO 639-1: 2002 : Coduri pentru reprezentarea denumirilor limbilor - Partea 1: Cod Alpha-2 .

Această secțiune folosește coduri din 2 litere ( alfa-2 ) pentru a identifica principalele limbi (sau familii de limbi) ale planetei, oferind un catalog general care constă din 136 de elemente.

Acestea sunt larg difuzate și utilizate la nivel internațional pentru a se referi în principal la principalele limbi ale lumii (de exemplu: ( EN ), ( IT ), ( DE ) etc.). Acestea sunt limbi care sunt în mare parte prezente în literatura contemporană.

Versiunea actualizată a acestui standard a fost publicată în 2002 , iar ultimul identificator adăugat după publicare datează din 2003.

ISO 639-2

Pictogramă lupă mgx2.svg Același subiect în detaliu: ISO 639-2 .
  • ISO 639-2: 1998 : Coduri pentru reprezentarea denumirilor limbilor - Partea 2: Cod alfa-3 .

Catalogarea mai generală a ISO 639-1 este aprofundată în ISO 639-2, care utilizează coduri de 3 litere ( alfa-3 ) pentru a permite un număr mai mare de combinații posibile și pentru a permite o diferențiere mai mare în numărul și tipul de limbi. În plus față de limbile individuale, ISO 639-2 oferă și coduri de identificare pentru familiile de limbi (de exemplu, limbile sino-tibetane sau limbile celtice ) și pentru așa - numitele macro-limbi , pentru dialecte , pentru limbi și limbi dispărute, antice sau artificiale. Termenul macro-limbaj (în engleză macrolanguage ) se referă la un obiect care, în anumite contexte, poate fi considerat ca o singură limbă sau limbă în scopuri practice de analiză, dar care în realitate este un set care colectează subtipuri evoluate (cum este cazul de chineză, care colectează subtipuri eterogene și distincte, cum ar fi cantoneză sau pașto ). Catalogarea macro-limbajelor este perfecționată începând cu următorul standard ISO 693-3.

Indicele ISO 639-2 include 464 coduri de identificare.

Acest indice a fost substanțial depășit de catalogarea și mai extinsă și detaliată oferită de ISO 639-3. Cu excepția familiilor de limbi (care sunt în mare parte recuperate în ISO 639-5), de fapt toate elementele ISO 639-2 au fost recodificate și inserate în ISO 639-3.

Publicat pentru prima dată în 1998 , a fost actualizat cu elemente noi până în 1999.

ISO 639-3

Pictogramă lupă mgx2.svg Același subiect în detaliu: ISO 639-3 .
  • ISO 639-3: 2007 : Coduri pentru reprezentarea denumirilor limbilor. Partea 3: Cod alfa-3 pentru acoperirea cuprinzătoare a limbilor

ISO 639-3 își propune să construiască un index general și cât mai detaliat posibil, care să includă orice tip de limbaj natural existent în lume.

Indicele ISO 639-3 atribuie coduri de 3 litere ( alfa-3 ) unui vast catalog de limbaje moderne, antice, dispărute și chiar artificiale, însumând 7776 de elemente.

ISO 639-3 este conceput să nu intre în conflict cu ISO 639-2. Din acest motiv, toate elementele prezente în ISO 639-2 sunt echipate cu un nou cod de identificare (cu excepția familiilor lingvistice , excluse din ISO 639-3 și reintroduse numai în ISO 693-5 ulterior).

limba cod
639-1
cod
639-2
Domeniu
639-3
cod
639-3
Engleză ro ing in dreptul lui ing
limba germana de ger / deu in dreptul lui deu
arabic ar ara macrolanguaj ara
in dreptul lui arb + alții
chinez zh chi / zho [1] [2] macrolanguaj zho
Mandarină in dreptul lui cmn
Cantoneză in dreptul lui da
Min Nan in dreptul lui nan

ISO 639-3 a fost lansat în 2007.

Nou în ISO 639-3

ISO 639-3 reprezintă o încercare de a construi un index mult mai detaliat al limbilor, care, la fel ca cele precedente, ia în considerare literatura produsă în diferitele limbi, dar diferă în încercarea de a da o explicație mai detaliată a situației concrete a limbile.vorbesc între ele. Principalele caracteristici ale ISO 639-3 sunt:

  • Includerea în index a mult mai multor macro-limbi. Aceasta include atât elemente noi, cât și elemente deja codificate anterior. Mai exact, există 56 de elemente care în ISO 639-2 au fost catalogate ca limbi și care în ISO 639-3 au fost catalogate ca macro-limbaje. Aceasta înseamnă că, în anumite contexte, un limbaj, care anterior era considerat o simplă variantă a unui limbaj ISO 639-2, conform standardului ISO 639-3, poate fi considerat o limbă în sine.
  • Diferența de tratament rezervată familiilor de limbi , a căror primă indexare fusese deja realizată cu ISO 639-2. Aceste elemente au fost complet excluse din ISO 639-3, care se concentrează exclusiv pe limbi și macro-limbi. Familiile de limbi sunt re-indexate numai cu ISO 639-5 ulterior.

ISO 639-4

  • ISO 639-4: 2010 : Coduri pentru reprezentarea denumirilor limbilor. Partea 4: Liniile directoare și principiile generale de implementare pentru codificarea limbilor

Acest document stabilește orientările pentru utilizarea ISO 639 și conține criteriile de atribuire a codurilor lingvistice. Secțiunile 1, 2, 3 și 5 din ISO 639 conțin, de asemenea, instrucțiuni despre modul de aplicare a standardului, dar secțiunea 4 este destinată să ofere o descriere cuprinzătoare și exhaustivă a regulilor de utilizare și a liniilor directoare presupuse de această codificare ISO.

Documentul a fost publicat în 2010.

ISO 639-5

Pictogramă lupă mgx2.svg Același subiect în detaliu: ISO 639-5 .
  • ISO 639-5: 2008 : Coduri pentru reprezentarea denumirilor limbilor - Partea 5: Cod alfa-3. Codificare pentru familii și grupuri de limbi

ISO 639-5 folosește coduri din 3 litere ( alfa-3 ) pentru a codifica un total de 114 familii de limbi și grupuri de limbi, indiferent dacă sunt vii sau dispărute. Având în vedere că standardul codifică doar o mică parte din toate familiile de limbi utilizate de lingvistică , trebuie remarcat faptul că documentul presupune următoarele definiții:

  • familie de limbi : „două sau mai multe limbi în sine, având un strămoș comun”;
  • grup lingvistic : „două sau mai multe limbi în sine, la care, în anumite circumstanțe, este legitim să se refere ca și cum ar fi o singură entitate”.

În special, conform ISO 639-5, membrii unui grup lingvistic nu trebuie neapărat să aibă legătură lingvistică. Expresia „în anumite circumstanțe” înseamnă că cele două limbi pot fi caracterizate prin proximitate geografică, afinitate de utilizare sau pot fi grupate în funcție de categorii și criterii independente de cele strict lingvistice .

Standardul a fost publicat în 2008. Pentru o încercare de codificare a familiilor de limbi mai cuprinzătoare, a se vedea standardul ISO 639-6.

ISO 639-6

  • ISO 639-6: 2009 : Coduri pentru reprezentarea denumirilor limbii - Partea 6: Cod Alpha-4. Pentru o codificare generală a variantelor lingvistice

ISO 639-6 a folosit coduri de identificare cu 4 litere ( alfa-4 ) și nume specifice pentru a construi un indice general al familiilor lingvistice , limbilor unice și variantelor lingvistice unice recunoscute în fiecare limbă identificată, fie ele limbi vii, dispărute sau artificiale. Standardul a inclus și grupuri de limbi, conform aceleiași definiții care a fost dată în ISO 639-5.

Marea noutate a standardului ISO 639-6 a fost că a fost proiectat având în vedere includerea așa-numitelor soiuri lingvistice : indexul a fost conceput pentru a codifica toate variantele de limbă cunoscute în prezent și pentru a asigura spațiu suficient pentru extinderi viitoare și noi intrări . Codul trebuia să asigure compatibilitatea „înapoi” cu codurile ISO 639 publicate anterior.

Standardul a fost publicat în 2009, dar a fost retras în 2014. Prin urmare, în prezent, cea mai generală încercare de a atribui coduri de identificare limbilor cunoscute rămâne ISO 639-3 .

Notă

Elemente conexe

Alte proiecte

linkuri externe

Lingvistică Portalul lingvistic : accesați intrările Wikipedia care se ocupă de lingvistică