ASCII extins

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Termenul ASCII extins (în engleză Extended ASCII sau high ASCII ) desemnează o codificare de 8 biți sau mai mult, capabilă să reprezinte multe alte caractere în plus față de 128 tradiționalul ASCII pe 7 biți.

Utilizarea acestui termen a fost adesea criticată deoarece poate sugera (în mod eronat) că ASCII a fost actualizat sau că este aceeași codificare.

Istorie

Pictogramă lupă mgx2.svg Același subiect în detaliu: Unicode .

O nouă codificare numită Unicode a fost dezvoltată în 1991 pentru a putea codifica mai multe caractere într-un mod standard și pentru a permite utilizarea mai multor seturi de caractere extinse (de exemplu, greacă și chirilică) într-un singur document; acest set de caractere este răspândit astăzi.

Inițial avea 65.536 de caractere ( puncte de cod ) și ulterior a fost extins la 1.114.112 (= 2 20 + 2 16 ) și până acum au fost alocate aproximativ 101.000. Primele 256 de puncte de cod sunt exact aceleași cu cele din ISO 8859-1 . Majoritatea codurilor sunt utilizate pentru codificarea limbilor precum chineza , japoneza și coreeana .

Motivele din spatele ei

Deoarece numărul de simboluri utilizate în limbile naturale este mult mai mare decât caracterele care pot fi codate cu vechiul ASCII, a fost necesar să se extindă setul de codare. De-a lungul anilor, în țările care nu utilizează alfabetul latin (sau, în orice caz, caractere care nu sunt prezente în setul ASCII), cum ar fi țările din Orientul Îndepărtat sau din lumea slavă, s-au născut metode de codificare pentru caractere nestandardizate totuși, afectat de probleme grave de compatibilitate cu alte seturi.

Deoarece codificarea ASCII utilizează 7 biți, multe dintre seturile de extensii au folosit 128 de caractere suplimentare care ar putea fi codificate folosind cel de-al optulea bit disponibil în fiecare octet .

Extensii proprietare

Diferite extensii proprietare s-au născut pe mainframe-uri non- EBCDIC și mini-computere, în special în universități. Commodore, de exemplu, a adăugat multe coduri non-ASCII la codificarea sa numită PETSCII , pe baza standardului original din 1963 . IBM a introdus criptarea pe 8 biți pe computerele sale IBM cu variante pentru diferite țări. IBM a produs codificări compatibile ASCII, deoarece primele 128 de caractere ale setului și-au păstrat valoarea originală ( US-ASCII ), diferitele codificări au fost împărțite în pagini (pagini de cod).

ISO 8859 și adaptări brevetate

În urma proliferării codificărilor proprietare, ISO a lansat un standard numit ISO 8859 care conține o extensie de 8 biți a setului ASCII. Cel mai important a fost ISO 8859-1 , numit și Latin1 , care conține caracterele pentru limbile din Europa de Vest. Codurile au fost standardizate pentru alte limbi: ISO 8859-2 pentru limbile din Europa de Est, ISO 8859-5 pentru caracterele chirilice și multe altele.

O particularitate a ISO 8859 în comparație cu alte caractere extinse este că caracterele de la 128 la 159, ale căror 7 biți inferiori corespund caracterelor de control ASCII, nu sunt utilizate pentru a evita crearea problemelor de compatibilitate. Microsoft a creat ulterior pagina de cod 1252 , un set conform ISO 8859-1 care umple și aceste 32 de caractere, care au devenit standardul pentru versiunile europene de Windows .

Elemente conexe

Alte proiecte

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT