Artefact de compresie

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Imagine cu artefacte (datorită nivelului ridicat de compresie)

Un artefact de compresie este rezultatul unei scheme agresive de compresie a datelor aplicată unei imagini , audio sau video care elimină unele date mai puțin importante din conținutul general, dar este totuși vizibilă și neplăcută utilizatorului. Artefactele din datele dependente de timp , cum ar fi audio sau video, sunt adesea rezultatul erorii latente de compresie a datelor cu pierderi .

Din punct de vedere tehnic, un artefact de compresie este o anumită clasă de erori de date care sunt adesea consecința cuantificării în compresia de date cu pierderi.

Artefactele de compresie sunt vizibile în multe medii utilizate pe scară largă, cum ar fi DVD-urile și , de asemenea, în formate comune de fișiere de computer, cum ar fi JPEG , MP3 sau MPEG . Mediile necomprimate (precum Laserdisc- urile , CD-urile audio și fișierele WAV sau mediile comprimate fără pierderi , precum FLAC ) nu sunt supuse artefactelor de compresie.

Artefacte de compresie în codificarea imaginii

Când se utilizează transformarea discretă a cosinusului (DCT) pentru codarea blocurilor, cum ar fi în imagini în format JPEG, pot apărea diferite tipuri de artefacte, cum ar fi un contur în zone netede, zgomot zimțat de-a lungul liniilor și marginilor curbate și / sau un efect de tablă în mai multe regiuni „dense”.

Atunci când se utilizează codificarea de predicție în filme, cum ar fi MPEG-1 , artefactele de compresie tind să rămână vizibile pentru câteva generații de cadre decomprimate, ducând la apariția unui efect „pictat”, ca și cum imaginea ar fi pictată de pensulă. artist.

Ilustrarea efectului compresiei JPEG asupra unei imagini ușor zgomotoase, cu o combinație de text și spațiu alb. Textul este o captură de ecran capturată dintr-o conversație Wikipedia cu zgomot adăugat (intensitatea 10 în Paint.NET). Un cadru al animației a fost salvat ca JPEG (calitatea 90) și reîncărcat. Ambele cadre au fost apoi mărite cu un factor de 4 (cea mai apropiată interpolare a vecinilor).

Când se utilizează codificarea de predicție a mișcării , cum ar fi în MPEG-2 sau MPEG-4 , artefactele de compresie tind să se deplaseze odată cu derularea optică a imaginii, provocând un efect special în care murdăria pare să se miște împreună cu obiectele din scenă.

Erorile prezente în fluxul de date pot provoca erori, cum ar fi erori mari de cuantificare, sau pot întrerupe complet analiza fluxului pentru o perioadă scurtă de timp, provocând decăderea imaginii. În cazul în care au apărut erori grave în fluxul de date, nu este neobișnuit ca decodorul să continue să aplice efecte „pictate” imaginii deteriorate, creând un efect „imagine fantomă”.

Pentru a opri producerea artefactelor de compresie, multe sisteme trimit ocazional un întreg cadru comprimat fără predicție, de obicei la începutul unei tăieturi și apoi la intervale regulate de timp.

În codificarea imaginii MPEG, acestea sunt cunoscute sub numele de „ cadre I ”, unde „I” înseamnă „compresie intraframe”.

Reducerea artefactelor de imagine

Au fost propuse mai multe abordări pentru a reduce efectele compresiei asupra imaginilor, dar pentru a utiliza tehnici standard de compresie / decompresie și pentru a menține beneficiile compresiei (de exemplu, costuri mai mici de transmisie și stocare), multe dintre aceste metode se concentrează pe „post procesare "- adică în reprocesarea imaginilor primite sau afișate. Niciuna dintre aceste tehnici de post-procesare nu s-a dovedit a fi eficientă în toate situațiile și, în consecință, nicio tehnică nu a obținut acceptarea pe scară largă; în plus, unele tehnici au fost implementate și utilizate în sistemele proprietare. Multe software-uri de editare a imaginilor, de exemplu, au în ele algoritmi de reducere a artefactelor proprii JPEG.

Codificare video

Când se utilizează predicția mișcării, cum ar fi în MPEG-1 , MPEG-2 sau MPEG-4 , artefactele de compresie tind să rămână pe mai multe generații de cadre decomprimate și să se deplaseze odată cu fluxul optic al imaginii, ducând la un efect aparte, la jumătatea drumului. între un efect pictural și „murdăria” care se mișcă odată cu obiectele din scenă.

Erorile de date din fluxul de biți comprimat, posibil datorate erorilor de transmisie, pot duce la erori similare erorilor mari de cuantificare sau pot opri complet analizarea fluxului de date pentru o perioadă scurtă de timp, ducând la „ruperea” imaginii. În cazul în care au apărut erori grave în fluxul de biți, decodificatoarele continuă să aplice actualizări pentru imaginea deteriorată pentru o perioadă scurtă de timp, creând un efect de „imagine fantomă”, până când este primit următorul cadru comprimat independent. În codificarea imaginii MPEG, acestea sunt cunoscute sub numele de „cadre I”, „I” reprezentând „intra”. Până la sosirea următorului cadru I, decodificatorul poate efectua ascunderea erorilor.

Obiectele de compensare a mișcării limitează artefacte

Exemplu de eroare de macroblocare cauzată de eroarea de transmisie.

Discontinuitățile la limita blocurilor pot apărea la marginile blocurilor de predicție de compensare a mișcării. La compresia video compensată în mișcare, imaginea curentă este prezisă prin blocuri în mișcare (macroblocuri, partiții sau unități de predicție) de pixeli din cadre decodificate anterior. Dacă două blocuri învecinate folosesc vectori de mișcare diferiți, va exista o discontinuitate de margine între blocuri.

Zgomotul „țânțar”

Artefactele de compresie video includ rezultate cumulative ale compresiei imaginilor statice, incluzând, de exemplu, sunetele sau alte ocupații de margine în fotografiile ulterioare apar secvențial ca o estompare sclipitoare de puncte în jurul marginilor, numite zgomot de țânțari , deoarece seamănă cu țânțarii care roiesc în jurul obiectului. Așa-numitul „zgomot de țânțar” este cauzat de algoritmul de compresie discret bazat pe blocuri bazat pe transformarea cosinusului (DCT) utilizat în majoritatea standardelor de codificare video, cum ar fi formatele MPEG. [1]

Artefacte de compresie în codificarea audio

O tehnică este de a utiliza o rată de biți mai mică prin eșantionarea sunetului. Prin reducerea frecvenței de eșantionare , frecvențele mai mari trebuie eliminate pentru a se conforma teoremei de eșantionare Nyquist-Shannon . Dacă filtrul anti-aliasing nu funcționează corect, veți experimenta distorsiuni digitale sau aliasing sub formă de frecvențe non-armonice reflectate în jurul frecvenței Nyquist . (de exemplu, un ton de 22,85 kHz procesat cu o frecvență Nyquist de 22,05 kHz va avea ca rezultat un ton de 22,05 - (22,85 - 22,05) = 21,25 kHz. În general ieșireF = NF x 2 - intrareF). Acest lucru poate fi subtil, dar niveluri mai ridicate de distorsiune se pot simți similare modulației inelului . Scăderea cantității de date (numărul de biți) capturate pentru fiecare eșantion poate provoca o pierdere a detaliilor și a gamei dinamice a sunetului. Pierderea calității în ambele metode va fi uniformă pe toată durata înregistrării.

O altă tehnică este încercarea de a elimina sunetele pe care urechea umană nu le poate percepe de obicei. Dacă o persoană nu poate percepe diferența, datele rezultate vor fi mai simple (și, prin urmare, pot avea o compresie mai bună folosind tehnici fără pierderi ). De exemplu, urechea umană nu poate percepe, în general, un sunet slab simultan cu un sunet similar de intensitate mai mare. O tehnică de compresie cu pierderi poate identifica acest sunet slab și poate încerca să îl elimine. Deoarece niciun algoritm nu este perfect și se pot aplica alte compromisuri pentru a elimina date suplimentare pentru a reduce rata de date , în unele cazuri, acest lucru duce la eliminarea sunetelor sonore. Dar, din moment ce aceste sunete sunt încă teoretic dificil de perceput, rezultatul va fi în general un sunet aplatizat sau „murdar”.

Multe sisteme încearcă să înlocuiască seria de mostre audio cu alte reprezentări. De obicei, aceste reprezentări fac mai ușor să încercați să eliminați sunetele inaudibile și astfel să facilitați comprimarea datelor folosind tehnici tradiționale de compresie fără pierderi. O tehnică obișnuită este reprezentarea sunetului ca suma unei serii de unde sinusoidale. Este posibil ca reprezentarea să nu fie perfectă; în schimbul unei descrieri comprimate mai simple a sunetului, precizia poate fi sacrificată.

Multe sisteme de compresie audio se străduiesc să mențină o rată de date de referință, de obicei exprimată în biți de date pe secundă de audio. Atunci când se utilizează o rată de date constantă, porțiunile simple ale înregistrării (de exemplu, un ton de tăcere) vor fi ușor comprimate respectând rata de date de referință; redarea rezultată va fi foarte asemănătoare cu sunetul original. Pe măsură ce sunt înregistrate secțiuni mai complexe, sistemul va fi obligat să reducă în mod serios calitatea pentru a respecta rata fixă ​​de date ; reproducerea rezultată va arăta mai multe artefacte. Multe sisteme de compresie acceptă codarea Variable Bit Rate , care modifică rata de referință a datelor în timp ce încearcă să mențină constantă calitatea redării.

Notă

  1. ^ (EN) Definiția zgomotului de țânțar , pe PCMag. Adus la 18 mai 2020 .

Elemente conexe

Alte proiecte

linkuri externe