Unitatea de informare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În tehnologia informației și telecomunicații , o unitate de informație se referă la capacitatea unui anumit sistem de stocare sau canal de comunicație, utilizat ca termen de comparație pentru a măsura capacitatea altor sisteme de stocare sau canale de comunicații.

În teoria informației , conceptul de unități informaționale este legat de conceptele de conținut informațional și / sau entropie de variabile aleatorii.

Cele mai comune unități sunt bitul , ca capacitate a unui sistem care poate exista în doar două stări, și octetul , care este echivalentul a opt biți. Multiplii acestor unități pot fi folosiți prin adăugarea prefixelor sistemului internațional sau a prefixelor pentru multipli binari conform standardizării definite de IEC .

Unități primare

Comparație între diferite unități de informații: bit , trit, nat , ban. Cantitatea de informații este egală cu înălțimea barelor.

În 1928 , Ralph Hartley a observat un principiu al stocării fundamentale [1] care a fost formalizat ulterior de Claude Shannon în 1945 : cantitatea de informații care poate fi stocată într-un sistem este proporțională cu logaritmul log b N al numărului N de stări posibile a sistemului. Prin schimbarea bazei logaritmului de la b la un număr diferit c , obținem efectul înmulțirii valorii logaritmului cu o valoare constantă log c N = (log c b ) log b N. Prin urmare, alegerea bazei b determină unitatea utilizată pentru măsurarea informațiilor. În special, dacă b este un număr natural , unitatea corespunde cantității de informații care poate fi stocată într-un sistem cu b stări posibile.

Când b este 2, unitatea este bitul (contracția cifrei binare ). Un sistem cu 8 stări posibile, de exemplu, poate stoca până la log 2 8 = 3 biți de informații. Alte unități de informații utilizate frecvent includ:

  • b = 3: unitatea informațională se numește "trit" (contracția sistemului numeric ternar) și corespunde log 2 3 (≈ 1.585) bit [2] .
  • b = 10: unitatea de informații se numește cifră zecimală , hartley , ban , decit sau dit și corespunde log 2 10 (≈ 3.322) biți. [1] [3] [4] [5] .
  • b = e ( numărul lui Napier ): unitatea de informații se numește nat , nit sau nepit (de la John Napier ) și este echivalentă cu log 2 și (≈ 1,443) bit [1] .

Trit, ban și nat sunt rareori folosite pentru a măsura capacitatea de stocare, dar nat, în special, este adesea folosit în teoria informației, deoarece logaritmii naturali sunt mai ușor de manevrat la nivelul formalismului matematic.

Unități derivate

Au fost adoptate numeroase nume pentru a desemna grupuri de biți

Octet

Din punct de vedere istoric, un octet a fost numărul de biți necesari pentru a codifica un caracter text în interiorul unui computer (definiția, prin urmare, depinde de arhitectura computerului); astăzi, însă, ia întotdeauna semnificația a opt biți. Un octet poate reprezenta, prin urmare, 2 8 = 256 de valori distincte, cum ar fi întregi între 0 și 255 sau între -128 și 127. Standardul IEEE 1541-2002 prevede că „B” (litera mare) este simbolul care indică octetul. Octetii și multiplii acestora sunt întotdeauna utilizați pentru a indica dimensiunea fișierului și capacitatea de stocare a computerului.

Ciuguli

Un grup de patru biți este numit ciugulit . Această unitate este adesea utilizată în reprezentarea hexazecimală , deoarece un ciugulit conține aceeași cantitate de informații ca o cifră hexazecimală [6] .

Word, blocuri și pagini

Calculatoarele manipulează în general biții în grupuri de dimensiuni prestabilite, denumite în mod convențional cuvinte . Numărul de biți dintr-un cuvânt este în general definit de mărimea registrelor CPU sau de numărul de biți care sunt mutați din memoria principală într-o singură operație.

Unele limbi mașină folosesc grupuri de două cuvinte (un „cuvânt dublu” sau „dword”) sau patru cuvinte (un „cuvânt quad” sau „quad”).

Memoria cache a unui computer funcționează în general pe blocuri de memorie care constau din mai multe cuvinte consecutive. Aceste unități sunt uneori numite blocuri cache sau linii cache .

Sistemul de memorie virtuală partiționează memoria principală a computerului în unități și mai mari, denumite în mod tradițional pagini .

Multipli sistematici de biți și octeți

Folosind prefixele standard ale sistemului internațional este posibil să se obțină termeni pentru grupuri de biți exprimate în puteri de 10: kilo- = 10 3 = 1000 ( kilobit sau kbit), mega- = 10 6 = 1000000 ( megabit sau Mbit) și giga- = 10 9 = 1 000 000 000 ( gigabit sau Gbit). Aceste prefixe sunt cele mai des utilizate pentru multipli de octeți, exemplele sunt kilobyte (kB = 8000 biți), megabyte (1 MB = 8 000 000 biți) și gigabyte (1 GB = 8 000 000 000).

Cu toate acestea, din motive tehnice, capacitățile de memorie ale computerului sunt adesea multipli ai unei puteri mari de două, cum ar fi 2 28 = 268 435 456 octeți. Pentru a evita utilizarea numerelor „incomode”, prefixele sistemului internațional sunt adesea folosite pentru a indica cea mai apropiată putere a două, de exemplu folosind prefixul kilo pentru 2 10 = 1024, mega pentru 2 20 = 1 048 576 și giga pentru 2 30 = 1 073 741 824 și așa mai departe. De exemplu, un cip de memorie RAM cu o capacitate de 2 28 octeți este denumit cip de 256 megabyte. Tabelul de mai jos ilustrează aceste diferențe.

Simbol Prefix Înțeles DA Înțeles binar Diferența de mărime
K. kilogram 10 3 = 1000 1 2 10 = 1024 1 2,40%
M. mega 10 6 = 1000 2 2 20 = 1024 2 4,86%
G. jig 10 9 = 1000 3 2 30 = 1024 3 7,37%
T. tera 10 12 = 1000 4 2 40 = 1024 4 9,95%
P. peta 10 15 = 1000 5 2 50 = 1024 5 12,59%
ȘI exa 10 18 = 1000 6 2 60 = 1024 6 15,29%
Z zetta 10 21 = 1000 7 2 70 = 1024 7 18,06%
Da trebuie 10 24 = 1000 8 2 80 = 1024 8 20,89%

În trecut, scrisoarea de capital K a fost utilizată în locul minusculă k pentru a indica 1024 în loc de 1000. Cu toate acestea, această diferență în simbolistică nu a fost niciodată aplicată în mod consecvent. Pe de altă parte, pentru sistemele de stocare externe (cum ar fi discurile optice ), prefixele SI sunt utilizate cu semnificația lor originală (puteri de 10).

Au existat numeroase încercări de a rezolva confuzia utilizând notații alternative pentru multipli exprimați sub forma puterilor a două. În 1998 , IEC a publicat un standard care definește o serie de prefixe binare care folosesc 1024 în loc de 1000 ca rădăcină principală [7] :

Simbol Prefix
Ki kibi, kilogram binar 1 kibibyte (KiB) 2 10 octeți 1024 B
Pe mine mebi, mega binar 1 mebibyte (MiB) 2 20 octeți 1024 KiB
Gi gibi, giga binar 1 gibibyte (GiB) 2 30 octeți 1024 MiB
Tu tebe, tera binară 1 tebibyte (TiB) 2 40 octeți 1024 GiB
Pi pebi, peta binară 1 pebibyte (PiB) 2 50 octeți 1024 TiB
Ei exbi, binar exa 1 exbibyte (EiB) 2 60 octeți 1024 PiB

Cu toate acestea, standardul JEDEC definește literele majuscule K, M și G pentru puterile binare 2 10 , 2 20 , 2 30 și 2 40 pentru a reflecta utilizarea obișnuită [8] .

Notă

  1. ^ A b c (EN), Norman Abramson, Teoria și codificarea informației, McGraw-Hill, 1963.
  2. ^ (EN) Donald E. Knuth, Seminumerical algorithms, în The Art of Computer programming, vol. 2.
  3. ^ (EN) Shanmugam, Digital and Analog Computer Systems, 2006.
  4. ^ (EN) Gregg Jaeger, Quantum information: an overview , 2007.
  5. ^ (EN) I. Ravi Kumar, Teorie statistică cuprinzătoare a comunicării, 2001.
  6. ^ Nybble , pe dicționarul reference.com . Accesat la 12 august 2012 .
  7. ^ . Standardul ISO / IEC este ISO / IEC 80000-13 : 2008. Acest standard anulează și înlocuiește punctele 3.8 și 3.9 din IEC 60027-2: 2005. Singura diferență majoră este adăugarea de definiții explicite pentru unele cantități. Catalog online ISO , pe iso.org .
  8. ^ JEDEC Solid State Technology Association,Termeni, definiții și simboluri de litere pentru microcomputere, microprocesoare și circuite integrate de memorie ( PDF ), pe JESD 100B.01 , decembrie 2002. Accesat pe 5 aprilie 2009 .

Elemente conexe

linkuri externe