MPEG-1

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

MPEG-1 este un standard introdus în 1991 de MPEG ( Moving Pictures Experts Group ).

Acesta a fost inițial optimizat pentru aplicații video cu viteză redusă de biți cu o rezoluție video de 352x240 pixeli cu 30 de cadre pe secundă pentru standardul TV NTSC sau 352x288 pixeli cu 25 de cadre pe secundă pentru standardul TV PAL . Aceste formate sunt denumite în mod obișnuit SIF ( Source Input Format ). MPEG-1 nu se limitează structural la aceste formate, deoarece poate ajunge, de exemplu, la 4095x4095 pixeli cu 60 de cadre pe secundă, dar în aplicații a condus viteza de transmisie a jocului și, prin urmare, sistemul a fost optimizat pentru o rată de biți de 1, 5 Mbit / s. Cea mai importantă limitare a sistemului MPEG-1 se datorează imposibilității de a procesa imagini întrețesute, cum ar fi cele utilizate în transmisia TV europeană, care necesită un proces de dublă codificare .

CD-urile video folosesc formatul MPEG-1. De ieșire de calitate la bitrate - tipică a unui CD video este cea a unui VHS VCR.

MPEG-1 layer 3 este numele complet al popularului format audio MP3 .

MPEG-1 este împărțit în mai multe părți:

  1. Sincronizarea și multiplexarea fluxurilor video și audio.
  2. Codec de compresie pentru semnale video neîntrețesute .
  3. Codec de compresie a semnalului audio. Standardul definește trei niveluri de codare audio.
  4. Proceduri pentru verificarea conformității.
  5. Software de referință.

Compresie video în MPEG-1

Structura cadrului

Algoritmul de compresie video din MPEG-1 funcționează pe secvențe de cadre (sau cadre ), fiecare dintre ele fiind reprezentat ca o matrice de pixeli . Fiecare pixel este asociat cu o triada de valori (Y, Cb, Cr) care descrie coordonatele sale în spațiul de culoare YCbCr . Componentele de crominanță (Cb și Cr) sunt eșantionate în spațiu cu un factor de 4: 1, pentru a reduce ocuparea lățimii de bandă rezultată din procesul de compresie. Componenta de luminanță (Y), pe de altă parte, nu este sub-eșantionată, deoarece este mult mai relevantă pentru calitatea semnalului video. Pentru a continua cu compresia, fiecare cadru este împărțit în macro-blocuri de 16x16 pixeli , fiecare dintre acestea conținând 4 blocuri 8x8 de probe de luminanță (Y) și 2 blocuri 8x8 pentru componentele de crominanță (Cb și Cr).

Tipuri de cadre

Există trei tipuri de cadre furnizate în MPEG-1: I ( Intra ), P ( Predict ) și B ( Bidirectional predicted ). Pentru fiecare dintre ele se utilizează o procedură de compresie diferită. Un cadru de tip I este procesat pe baza tehnicilor intra-cadru , adică folosind doar informațiile conținute în cadru în sine. Cadrele de tip P și B, pe de altă parte, sunt comprimate folosind tehnici inter-cadre , adică procesate pornind de la o predicție obținută din cadrele precedente și / sau ulterioare. Secvența video este împărțită în grup de imagini (GOP) în care diferitele tipuri de cadre alternează succesiv. De exemplu, un GOP ar putea fi reprezentat ca o secvență de tip IBBBPBBBP. Structura GOP este de obicei configurabilă pe baza nevoilor specifice ale aplicației în care este abandonat conținutul video. În comparație cu cadrul P sau B, cadrele I garantează o imunitate mai mare la propagarea erorilor (deoarece sunt decodificate fără referință la orice alt cadru), dar necesită un număr mai mare de biți (deoarece nu profită de tehnicile de predicție între cadre ) .

Comprimarea cadrelor I

Cadrele de tip I sunt comprimate fără ajutorul tehnicilor de predicție între cadre . Algoritmul de compresie este aplicat fiecăruia dintre blocurile 8x8 care alcătuiesc cadrul I (și independent pentru fiecare dintre coordonatele Y, Cb și Cr) și este împărțit în următorii pași:

  1. Transformare DCT : blocul 8x8 este reprezentat în domeniul transformat cu o matrice 8x8 de coeficienți DCT. Această transformare este foarte utilă deoarece, spre deosebire de pixelii care alcătuiesc blocul, coeficienții DCT sunt necorelați (sau nu foarte corelați) și, prin urmare, pot fi prelucrați independent unul de celălalt. Mai mult, DCT tinde să concentreze energia conținută în semnal în câțiva coeficienți din domeniul transformat (de obicei la frecvențe spațiale mici), făcând astfel posibilă obținerea unui factor de compresie ridicat. Dintre coeficienții DCT vom distinge termenul DC care este proporțional cu valoarea medie a componentei Y sau Cb sau Cr a blocului procesat, de ceilalți termeni AC.
  2. Cuantizare : coeficienții DCT sunt reprezentați pe un domeniu discret de valori. Această operațiune implică o pierdere de informații. Cu toate acestea, nu se aplică în mod egal tuturor coeficienților DCT. De fapt, coeficienții de frecvență joasă sunt cuantificați mai fin decât ceilalți, deoarece sunt mai relevanți pentru calitatea semnalului video. Mai mult, cuantificarea mai grosieră aplicată coeficienților la frecvențe înalte va face numărul acestora chiar mai mare cu valori apropiate de zero și, prin urmare, irelevante pentru determinarea ratei de biți globale.
  3. Codificarea diferențială a coeficientului de curent continuu ( DPCM ): coeficientul de curent continuu este reprezentat diferit de blocul anterior.
  4. Scanare în zig-zag : coeficienții DCT cuantificați sunt reprezentați succesiv, pentru creșterea frecvențelor.
  5. Codificare pe lungime de rulare : secvența coeficienților DCT cuantificați, fiind compusă de obicei dintr-un număr considerabil de zerouri, este reprezentată ca o succesiune de perechi de valori (x, y), unde x reprezintă valoarea coeficientului diferit de zero și y numărul de zerouri care o precedă. Ultima secvență de zerouri este reprezentată cu un cod ad hoc numit EOB ( End Of Block ).
  6. Codificare entropică : fiecare pereche de valori (x, y) determinate în punctul anterior este reprezentată cu o succesiune adecvată de biți, derivată dintr-un tabel de valori standardizate și obținută cu o abordare bazată pe codarea Huffman .

Comprimarea cadrelor P și B.

Comprimarea unui cadru P se obține dintr-o predicție a acestuia, făcută pornind de la un cadru anterior temporal în același GOP. Predicția este calculată prin estimarea și compensarea deplasării fiecărui macrobloc al cadrului de referință (în raport cu cadrul care trebuie comprimat) într-o fereastră de ± 15 pixeli (orizontal și vertical). În acest fel, predicția se obține prin traducerea și integrarea macroblocurilor imaginii de referință. Ulterior, cadrul care trebuie comprimat este comparat (prin scădere) cu cadrul prevăzut, obținându-se imaginea diferențială, care este comprimată prin intermediul tehnicilor intra-cadru . În cazul cadrului B, procedura este similară, dar predicția se obține prin combinarea a două predicții, derivând respectiv dintr-un cadru anterior și unul ulterior al GOP.

Bibliografie

  • JL Mitchell, WB Pennebaker, CE Fogg și J. LeGall. „MPEG Video Compression Standard”, Chapman & Hall, Digital Multimedia Standards Series, 1996

Elemente conexe

Alte proiecte

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT