Raw (format fișier)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Pentru fișierele Raw (în engleză: raw , neprocesate ) putem înțelege, în cel mai general caz, un set de date salvate fără a utiliza un anumit format de stocare sau, într-un anumit domeniu, cum ar fi fotografia digitală sau în unele aplicații informatice, poate descrie un format special de stocare utilizat pentru colectarea datelor care, dintr-un anumit motiv, este considerat brut .

Caz general

Pentru a înțelege conceptul de fișiere brute este necesar să știm în principiu ce conține un fișier „non-brut”. Dacă luăm de exemplu o piesă muzicală salvată în format WAV , constatăm că aceasta conține întotdeauna, pe lângă eșantioanele audio , și metadatele , care specifică cel puțin frecvența de eșantionare , numărul de biți pe eșantion și numărul de canale audio înregistrate. Acest set de informații (date + metadate) permite oricărui player media să deschidă pur și simplu fișierul automat și să-l redea fără intervenția ulterioară a utilizatorului.

Aceeași piesă muzicală salvată în format brut, adică fără metadate, ar necesita utilizarea unui software mai complex, în general pentru uz profesional, care înainte de redarea sunetului ar fi obligat să ceară utilizatorului cu precizie acele informații lipsă, cum ar fi rata de eșantionare, biți pe eșantion și numărul de canale. Dacă doar unul dintre acești parametri este greșit, reproducerea audio ar fi, fără probabilitate, lipsită de sens. Același exemplu poate fi aplicat în mod similar fișierelor care conțin imagini sau orice altceva. Acestea fiind spuse, totuși, înțelegem cum este deosebit de rar să întâlnim aceste tipuri de fișiere, dar nu imposibil, ca în cazul fișierelor audio sau video produse de descărcări care s-au oprit. Bucata de fișier așa cum este prezentată nu este utilizabilă, dar unele programe de vizualizare [1] au capacitatea de a repara fișierele respective, dacă au fost descărcate suficiente informații pentru a determina formatul complet, dar afișând doar datele audio sau video care au fost descărcate. . Rezultatul este un fișier vizibil, deși poate fi mai scurt decât fișierul original

Domeniul de aplicare specific

În cazul aplicației specifice, adjectivul brut se aplică în principal conținutului datelor, nu grupării lor într-un fișier, care poate fi apoi utilizat în alte contexte în care, prin prelucrarea finală a acestor date brute, pot fi făcute utilizabile în scopul pentru care au fost formate (imagini, sunete, documente etc.) Aceasta implică faptul că un fișier de date brute poate avea metadate și are aproape întotdeauna un antet, pentru că altfel software-ul care este chemat să citească acel raw fișierul și apoi procesează-l ulterior, el nu ar putea să-l recunoască și apoi să-l folosească; unele programe pentru procesarea fișierelor audio fără antet, de fapt, după citirea fișierului audio brut, vă solicită să specificați parametrii de procesare și redare ai fișierului în sine. De asemenea, pot exista informații de închidere a fișierelor numite uneori „coadă”. În ceea ce privește conținutul de date al unui fișier brut, acestea pot fi, de asemenea, comprimate atât cu metode cu pierderi, cât și cu metode fără pierderi , acest lucru se întâmplă uneori în fișierele mari de dimensiuni brute ieșite de la camere digitale de înaltă rezoluție. Pe de altă parte, în fișierele brute de rezervă de nivel scăzut (fișiere imagine) ale mediilor de stocare în masă, cum ar fi hard disk-urile, dacă se aplică o compresie, aceasta trebuie să fie doar de tip fără pierderi pentru a nu pierde nicio informație a celor înregistrat, altfel imposibilitatea de a utiliza datele salvate. Aceste operații de compresie permit reducerea considerabilă a dimensiunii fișierului care trebuie să înregistreze datele și să ușureze gestionarea.

Înțelegerea semnificației „formatului de fișier brut” este de mare ajutor dacă analizăm unele dintre cele mai comune domenii ale informaticii în care este utilizată această metodă de formare a fișierelor. Acest lucru se datorează faptului că modalitatea brută de formare a datelor ia diferite forme și modalități diferite de tratare și utilizare a datelor, în funcție de domeniul în care este aplicată.

Fișier brut în câmpul fotografic

Pictogramă lupă mgx2.svg Același subiect în detaliu: Raw (fotografie) .

În câmpul fotografic există diferite formate brute în funcție de producător și de modelul camerei care generează fișierul. Formatul brut în aceste cazuri include cu siguranță atât antetul, cât și metadatele (date de informații despre condițiile de fotografiere ale imaginii brute reproduse). În plus, pentru camerele de înaltă rezoluție care implică formarea fișierelor mari, se întâlnește uneori și compresia de date fără pierderi.

Pregătirea datelor brute în fotografia digitală

Datele brute stocate sunt rezultatul digitalizării nivelurilor de semnal electric proporționale cu intensitatea fluxului de lumină incident pe fiecare singur fotosite al senzorului. În aproape toți senzorii (cu excepția unor modele ale câtorva mărci) fotosite care le compun sunt de trei tipuri: R, G și B și fiecare dintre aceste tipuri, înregistrează intensitatea luminozității în raport cu acea componentă cromatică a luminii incident pe acel site specific (R, G sau B). Cu toate acestea, aceste informații nu sunt suficiente pentru a forma pixelul (gruparea de date care descrie caracteristicile cromatice complete ale acelei imagini elementare particulare despre care fotositul colectează informații), pentru a reprezenta fidel imaginea luată, fiecare pixel trebuie să conțină toate cele trei informații pe intensitatea RGB, chiar și a celor două componente pe care singurul site nu le poate înregistra. Acesta este motivul pentru care fișierul, cu doar datele digitale ale informațiilor care ies din fotografiile individuale ale senzorului (care sunt câteva milioane), sunt numite raw (= nu sunt procesate).

Formarea imaginii din date brute

Pentru a obține o imagine care este fidelă cromatic scenei împușcate, de fapt, este necesară o procesare ulterioară în care, pornind de la datele înregistrate (o singură componentă cromatică pentru fiecare fotosite), cele două componente cromatice lipsă sunt de asemenea calculate folosind datele înregistrate de pe site-urile adiacente. Datele RGB astfel obținute (una capturată și două calculate) pe fiecare fotosite, constituie datele cromatice ale fiecărui pixel. Aceste date nu mai sunt acum brute, deoarece, după ce le-au dat un format de înregistrare (BMP, TIFF, JPG etc.), sunt deja utilizabile. Fișierele brute ale unor mărci ale tuturor camerelor conțin, de asemenea, în ele o grupare de date identificabile ca fișiere JPG. Acest mic fișier este destinat să accelereze operațiunile de arhivare și să aibă o indicație imediată a conținutului imaginii.

Conceptul de „brut”, „neprelucrat”, este potrivit în acest caz, deoarece pentru a fi procesat și, prin urmare, utilizabil, fișierul trebuie să fi trecut cel puțin prin procesul de demozaicare prin generarea celor două canale de culoare lipsă pe fiecare pixel de către aplicând o interpolare algoritmică și, de asemenea, aplicarea unui format la fișier conform unuia dintre standardele de înregistrare a fișierelor grafice.

Fișier brut în domeniul stocării datelor de memorie în masă

Pentru a înțelege tipul de fișier brut referitor la un fișier imagine al unui suport de memorie de masă, este necesar să se precizeze modul în care sunt înregistrate datele fișierelor care trebuie arhivate.

Înregistrarea datelor pe suport de stocare în masă

Este o experiență obișnuită faptul că, pentru a înregistra fișiere pe un suport, acesta trebuie formatat, adică informațiile trebuie înregistrate pe urmele suportului care permit numerotarea și identificarea tuturor sectoarelor suportului în sine. Acestea sunt concepute ca segmente de memorie de masă în care trebuie înregistrate datele reale ale fișierelor care trebuie arhivate. Această operațiune este necesară pentru a putea citi fișierele înregistrate ulterior. De fapt, în fiecare mediu (disc sau altul) există o zonă în care, printre altele, există informații despre sectoarele în care sunt înregistrate fișierele individuale de pe disc (FAT, File Allocation Table , care poate avea nume și caracteristici diferite în funcție de a sistemelor informatice pe care este instalat suportul de stocare în masă). O analogie, oricât de reductivă, poate fi stabilită prin evocarea funcțiilor indexului unei cărți, unde cartea este în mod evident suportul de masă). Prin urmare, un fișier brut cu imaginea completă a unui disc conține tot ceea ce este înregistrat pe disc, prin urmare nu numai datele referitoare la fișiere, ci și informațiile de formatare a discului cu identificatorii sectoarelor individuale și a întregii zone a masei memorie unde se află FAT și celelalte elemente destinate funcțiilor de încărcare automată ale sistemului de operare (MBR, Master Boot Record). Un astfel de fișier brut, desigur, așa cum este, nu poate îndeplini funcțiile unui hard disk, deși este o reprezentare fidelă a acestuia.

Condiții de utilizare a datelor brute ale „fișierului imagine disc”

În aceste fișiere există în mod normal anteturi care le identifică și permit utilizarea lor în software dedicat, de exemplu pentru a restabili funcționarea unui disc deteriorat, dar nu există întotdeauna compatibilitatea încrucișată între diferitele fișiere produse de diferitele software capabile să creeze o imagine fişier.

Acces brut la amintiri în masă

Ceea ce se numește „acces brut” la un mediu de stocare în masă este o metodă de citire care păstrează și transmite sistemului tot ce este citit de capul de citire și este primul pas pentru înregistrarea fișierului imagine al unui hard disk. Acest mod brut de accesare a mediilor de stocare este radical diferit de modul obișnuit. În mod normal, capul, desigur, citește tot ce întâlnește pe pistă - coduri de formatare care identifică sectoarele discului + date înregistrate în sectoare - și prevede că software-ul de gestionare al cititorului (hard disk, dischetă sau alt dispozitiv de stocare) ștergeți codurile de formatare media, după ce le utilizați pentru a recompune fișierul. În acest fel, sunt păstrate doar datele înregistrate în sectoare. Aceste date, recompuse, formează fișierul documentului care a fost destinat citirii.

Citirea și arhivarea brute, de asemenea, în acest caz, legitimează utilizarea conceptului de „neprocesat”, „brut”, deoarece acele date citite și înregistrate, fiind brute din codurile de format, nu sunt nici documentul înregistrat, nu doar datele de formatare , ci o unire a lor.

Fișiere brute în audio digital

În domeniul audio digital, înregistrarea fișierelor brute este, în mod normal, fără antet, este un format nativ, care nu poate fi asociat imediat cu formate cunoscute pentru utilizarea imediată a conținutului său cu software-ul de reproducere.

Formarea datelor audio brute

Acestea sunt datele care ies din dispozitivul de eșantionare a semnalului audio (în PCM - Pulse-Code Modulation ) și care nu sunt utilizabile direct din cauza lipsei unui format de înregistrare (și, în consecință, de utilizare) care este scris în mod normal în antet. a dosarului. Deoarece aceste fișiere brute pot avea, de asemenea, eșantioane cu rate neobișnuite de eșantionare [2] , utilizarea lor necesită cunoștințe legate de DSP (Digital Signal Processing), prin urmare, de preferință, utilizarea este rezervată utilizatorilor experți din cauza riscului de pierdere a datelor. Pe de altă parte, cu cunoștințe specifice, este posibil să se obțină rezultatele maxime posibile. În câmpul audio, eșantionarea datelor brute poate avea loc în PCM cu rezoluție de 8 biți (corespunzătoare împărțirii în 256 de niveluri discrete a întregului interval maxim al semnalului analogic al fiecărui eșantion prelevat). Eșantionarea poate avea loc și cu rezoluție pe 16 biți (aici nivelurile discrete în care semnalul digital este convertit în digital sunt 65.536). Cu cât este mai mare rezoluția de eșantionare, cu atât este mai mare fidelitatea semnalului înregistrat. Frecvența minimă de eșantionare pentru reproduceri de înaltă fidelitate este de 44100 Hz, ceea ce corespunde conversiei digitale a 44,100 de eșantioane pe secundă a nivelurilor analogice ale semnalului audio. Semnalele definite ca calitate audio CD au o rezoluție de 16 biți pe eșantion și o frecvență de eșantionare de 44100 Hz pentru fiecare dintre cele două canale stereo.

Condiții de utilizare a datelor brute

Semnalul audio convertit de la analog la digital ( conversie A / D ) nu este încă utilizabil, deoarece este încă date brute, de fapt nu i s-a dat încă un format care să poată fi recunoscut de software-ul de redare, format care are sarcina „instruiește” acest software cu privire la modul de gestionare a fișierului pentru reproducerea acestuia (decodarea rezoluției de eșantionare și decodificarea frecvenței de eșantionare). Pe de altă parte, un fișier cu anteturi, cum ar fi un fișier MP3 , conține, pe lângă datele esențiale referitoare la codificarea PCM, și informațiile la fel de esențiale pentru decompresie. Cu toate acestea, în antetele unor formate (cum ar fi MP3), pot fi inserate și alte informații, care nu sunt esențiale pentru redare, precum numele artistului sau metadatele utile pentru înregistrarea fișierului.

Acesta este motivul pentru care un fișier audio brut este de fapt „neprelucrat”, deoarece îi lipsește informațiile care îl fac imediat utilizabil de către un player audio sau editor.

Notă

  1. ^ Program VLC
  2. ^ În domeniul audio digital, rata de eșantionare se referă de obicei la numărul de eșantioane analogice care sunt convertite în digital în fiecare secundă.
Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT