Fisier text

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Un fișier text deschis cu gedit

Un fișier text este un fișier computer care conține numai text pur , adică codificarea binară a caracterelor pe care un cititor uman le poate înțelege, cum ar fi litere, numere, semne de punctuație etc.

Termenul poate fi folosit spre deosebire de fișierul binar , care este în schimb un fișier care conține secvențe binare care nu pot fi urmărite înapoi la o codificare de caractere lizibilă, cum ar fi reprezentări binare ale pixelilor sau instrucțiunile unei aplicații executabile de către CPU . În realitate, din punctul de vedere al mașinilor, nu există nicio distincție între cele două tipuri, deoarece toate fișierele nu sunt altceva decât secvențe de octeți . Diferența constă doar în ceea ce reprezintă octeții și modul în care sunt utilizați. Formatul fișierului indică modul în care trebuie interpretate secvențele de octeți care îl formează.

Prin urmare, octeții fișierelor text reprezintă litere, cifre, punctuație, spații și alte simboluri tipărite normale, dar pot conține, de asemenea, unele caractere de control, cum ar fi tabulatorul , începutul liniei și returnarea căruței .

Codificare

Prin codificare în fișiere text înțelegem corespondența dintre valoarea octetului, care este întotdeauna un număr întreg de la 0 la 255 și caracterul reprezentat. Corespondența nu este întotdeauna 1 la 1: în multe codificări moderne, un singur caracter este reprezentat de mai mulți octeți, pentru a depăși limita a 256 de caractere posibile și, de asemenea, pentru a susține limbaje bogate în simboluri, cum ar fi cele orientale. Exemple de codificări 1 la 1 sunt ASCII foarte frecvente, cele ale standardului ISO 8859 și EBCDIC . Exemple de codificări multibyte sunt diferitele tipuri de Unicode și EUC .

Utilizare

Evident, scopul pentru care s-au născut fișierele text și încă o utilizare foarte frecventă este citirea / scrierea directă de către utilizatori. Lipsa de formatare îi face săraci din punct de vedere estetic, dar pe de altă parte, datorită acestei simplități, nu sunt necesare programe speciale pentru a le citi, și adesea pot fi transferate direct de la un sistem de operare la altul (cu condiția ca aveți același set de caractere disponibil).

Din acest motiv, aproape tot software-ul este însoțit de un fișier text simplu care oferă o scurtă descriere, numită adesea readme (sau readme în engleză). Chiar și codul sursă al programelor este de obicei scris în text simplu. Dacă o sursă ar fi scrisă de exemplu în format .doc (cu Microsoft Word sau OpenOffice.org ), fișierul produs ar conține, de asemenea, informații de format binar care ar pune compilatoarele în criză.

Există unele limitări ale universalității fișierelor text:

  • codificarea nu este întotdeauna evidentă, iar atunci când sistemul nu o recunoaște sau nu o acceptă, fișierul poate deveni ilizibil;
  • sistemele majore folosesc notații diferite pentru noua linie: MacOS folosește CR , Unix folosește LF , Windows folosește CR / LF. Unele programe, cum ar fi Gedit , pot deschide corect fișiere text, cel puțin cu cele mai populare codificări, indiferent de sistemul în care au fost create; în alte cazuri, afișajul va fi imperfect.

Extensia fișierelor text destinate citirii, atunci când este utilizată, este în general .txt . În cazul fișierelor sursă, extensia depinde de limbajul de programare utilizat, de exemplu .c pentru C și .htm sau .html pentru HTML .

Utilizare de către software

Fișierele text nu sunt neapărat legate de procesarea umană. Foarte des, acestea sunt utilizate doar de software, atât în ​​citire, cât și în scriere, pentru stocarea datelor. Sunt mai puțin compacte decât fișierele binare , ceea ce poate însemna o pierdere de spațiu pe disc: de exemplu, un număr de 32 de biți , care poate valora miliarde, ocupă întotdeauna 4 octeți în binar, dar în format text ocupă până la 11 (ca în caz de -1222333444) plus orice caractere delimitate. Cu toate acestea, dacă ocuparea discului nu este critică, formatul textului are avantaje:

  • Datele pot fi utilizate cu ușurință de alte programe și sisteme, cu o cunoaștere minimă a structurii lor: sunteți mai puțin constrâns de dimensiunea câmpurilor și ordinea octeților . De exemplu, deși fiecare foaie de calcul are propriul format de stocare binar, toată lumea poate lucra cu fișiere text în care matricea de date este pur și simplu o listă de valori separate prin caractere standard ( CSV , TSV ...)
  • Orice corupție a datelor cauzează de obicei mai puține daune și numai la nivel local. Pierderea unui octet într-un fișier text înseamnă de obicei pierderea unei bucăți de date; pierderea acestuia într-un fișier binar poate avea ca rezultat o defazare și încurcarea întregului fișier
  • Dacă este necesar sau în caz de erori ( depanare ), acesta poate fi verificat cu ușurință de către un utilizator. De exemplu, examinarea și editarea unui fișier INI este foarte intuitivă

Elemente conexe

Alte proiecte

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT