MPEG

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Grupul de experți în imagini în mișcare
Mpeg logo.svg
Extensie .mpg, .mpeg, .mp2, .mp3
Tip MIME video/mpeg, video/x-mpeg, audio/mpeg, audio/x-mpeg, audio/x-mpeg-3
Dezvoltat de MPEG Software Simulation Group (MSSG)
Tip Diverse conținuturi multimedia
Site-ul web mpeg.chiariglione.org/

Moving Picture Experts Group , acronim MPEG , denumire oficială ISO / IEC JTC 1 / SC 29 / WG 11 intitulată Coding of motion images and audio , este un comitet tehnic mixt format de organizațiile internaționale ISO și IEC în 1988 .

A fost creat cu scopul de a defini standarde pentru reprezentarea digitală a conținutului audio , video și a altor tipuri de conținut multimedia pentru a satisface o mare varietate de aplicații.

fundal

Comitetul a fost format în ianuarie 1988 de Leonardo Chiariglione și Hiroshi Yasuda și s-a întrunit pentru prima dată în 10, 11 și 12 mai 1988 . Pagina sa de pornire a fost găzduită inițial de site-ul centrului CSELT [1] . În mod normal, se întâlnește în medie de patru ori pe an. La prima întâlnire au participat 25 de membri, în timp ce la întâlniri participă în prezent peste 350 de membri reprezentând peste 200 de companii și organizații din aproximativ 20 de țări din întreaga lume.

Standard MPEG

MPEG a definit următoarele standarde:

Nume Desemnare formală Titlul desemnării oficiale Traducerea titlului desemnării formale
MPEG-1 ISO / IEC 11172 Codificarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale până la aproximativ 1,5 Mbit / s Codificarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit / s
MPEG-2 ISO / IEC 13818 Codificare generică a imaginilor în mișcare și a informațiilor audio asociate Codificare generică a imaginilor în mișcare și a informațiilor audio asociate
MPEG-4 ISO / IEC 14496 Codificarea obiectelor audio-vizuale Codificarea obiectelor audiovizuale
MPEG-7 ISO / IEC 15938 Interfață de descriere a conținutului multimedia Interfață de descriere a conținutului multimedia
MPEG-21 ISO / IEC 21000 Cadru multimedia (MPEG-21) Arhitectură pentru multimedia (MPEG-21)
A fost conceput pentru a se încadra în bitrate-ul Compact Disc . Video CD , un tip de suport audiovizual pentru redarea acasă cu o calitate comparabilă cu cea a casetelor video VHS , a folosit acest standard. Cunoscutul format audio MP3 face, de asemenea, parte din MPEG-1, care este de fapt stratul 3 MPEG-1.
Este utilizat în televiziunea digitală și DVD-Video . Are o calitate superioară MPEG-1, dar necesită mai multe resurse hardware de procesare.
A fost abandonat. Dezvoltat inițial pentru HDTV, dar ulterior s-a dovedit a fi de prisos deoarece MPEG-2 sa dovedit a fi suficient pentru această aplicație.
Este o extensie a MPEG-1 capabilă să gestioneze fluxuri audio / video eterogene, conținut 3D, fluxuri video cu rată de biți redusă și drepturi digitale. Pentru codificarea video acceptă formatul MPEG-2 sau un nou codec foarte eficient numit MPEG-4 AVC .
Este un sistem formal de descriere a conținutului multimedia.
S-a născut pentru a dezvolta o platformă comună pentru viitoarele aplicații multimedia.

Caracteristici

Fiecare standard MPEG este împărțit în părți și fiecare parte este împărțită la rândul său în straturi . Fiecare parte corespunde unui document , care tratează aspecte specifice ale standardului.

Primele cinci părți ale standardelor MPEG-1 și MPEG-2 sunt identice; MPEG-2 adaugă încă cinci părți, rezultând un total de zece părți.

Algoritmii

Algoritmii dezvoltați de grupul MPEG sunt toți algoritmi de pierdere a informațiilor (lossy). Tehnica utilizată este următoarea:

  • fluxul video este eșantionat, este redus la segmente;
  • aceste segmente sunt procesate pentru a extrage informațiile fundamentale;
  • informațiile sunt codificate cu algoritmi de compresie fără pierderi de informații.

Grupul de standardizare nu emite specificații cu privire la modul în care ar trebui realizat codificatorul sau decodorul MPEG. Grupul lansează specificații care indică modul în care ar trebui să fie format formatul de fișier MPEG, astfel încât fiecare producător să poată crea codificatorul și decodorul după cum consideră potrivit, în timp ce aderă la formatul de fișier definit de consorțiul MPEG.

Metoda de eșantionare a fluxului audio

Formatul WAV , anterior MPEG, utilizează codarea PCM , care ocupă o cantitate considerabilă de spațiu, aproximativ 1,5 Mbit / s la 48 kHz. O modalitate de a reduce spațiul și lățimea de bandă este de a utiliza mai puțini biți pentru a reprezenta probe. Făcând acest lucru, totuși, scade calitatea sunetului reprodus, până la niveluri slabe. O soluție posibilă este reprezentarea semnalului în domeniul frecvenței și apoi eșantionarea acestuia cu câțiva biți, în acest fel pierderea fidelității este mult mai mică. Transformarea în domeniul frecvenței este efectuată de algoritmul MPEG printr-un banc de filtru care descompune semnalul în 32 de sub-benzi de amplitudine egală. Mulți au criticat această abordare deoarece nu reflectă modelul perceptiv uman, de fapt, studiile efectuate arată că ar fi mai corect să împărțim banda de frecvență în 26 de părți de dimensiuni crescânde cu o tendință logaritmică.

Două sunete cu frecvență diferită, dar în aceeași bandă sunt percepute ca fiind identice. Punctul de frontieră dintre două benzi se numește banda critică . Urechea noastră este mai sensibilă la variațiile frecvențelor joase, unde câteva zeci de hertz sunt suficiente pentru a ne face să percepem două sunete ca fiind diferite, în timp ce la frecvențe înalte sunt necesare mii de hertz.

În apărarea deciziei luate de MPEG, există totuși complexitatea operației de transformare, de fapt, numărul operațiunilor elementare care trebuie efectuate în cazul sub-benzilor cu lățimea fixă ​​este mare, dar acceptabil (câteva mii produse și sume), în timp ce în cazul benzilor secundare cu lățimi diferite complexitatea crește considerabil și dacă în faza de codificare acest lucru poate fi neglijat, deci nu se întâmplă în faza de decodare, fază care trebuie efectuată în timp real . De asemenea, trebuie amintit perioada istorică în care s-a făcut această alegere: dacă astăzi o sarcină de lucru similară este acceptabilă pentru un computer normal, nu a fost așa la sfârșitul anilor optzeci și, prin urmare, este probabil ca în viitor variabila sub-bandă modelul va fi implementat.

Modelul perceptiv

Prelucrarea semnalului în domeniul frecvenței oferă și alte avantaje. Urechea noastră nu este un instrument liniar, adică nu percepe toate sunetele și mai presus de toate nu le percepe pe toate în același mod. De aici ideea eliminării tuturor acelor componente de frecvență pe care nu le putem auzi. Aceasta este evident o tehnică cu pierderi : sunetul comprimat va fi diferit de cel original, dar simțurile noastre nu vor putea percepe diferența. Prin urmare, este necesar să se studieze modelul perceptiv, adică asupra percepției umane a sunetului . Banda de frecvență sonoră variază de la 16 Hz până la 20 kHz. În modelul MPEG-1 , prima reducere a frecvenței se face prin eliminarea frecvențelor prea mici sau prea mari. Pentru ca un sunet să fie perceptibil, acesta trebuie să fie suficient de puternic, adică trebuie să exercite un nivel minim de presiune asupra membranei timpanului urechii , însă acest prag nu este constant, dar variază, în funcție de frecvență .

În figură (unde este?) Există un grafic calitativ care arată care trebuie să fie presiunea minimă pe care trebuie să o aibă un sunet pentru a fi perceput. În abscise (la scară logaritmică) există frecvențe, în timp ce în ordonate există nivelurile de presiune acustică (în dB ). Toate sunetele care se află în zona gri pot fi suprimate.

La aceasta trebuie adăugat că percepția sunetului nu este constantă în timp, ci variază în funcție de ceea ce auzim. În practică, un ton puternic acoperă sunete de intensitate mai mică, nu numai la o anumită frecvență, ci și în cele vecine, de fapt, la fel ca toți senzorii, urechea nu are timpi de reacție zero, adică este nevoie de un anumit timp pentru a adaptați-vă la noile condiții și, mai presus de toate, este nevoie de timp pentru a vă liniști după o solicitare. Pentru ca un sunet să fie perceput este, prin urmare, necesar ca acesta să fie menținut o anumită perioadă de timp, fără perturbări. MPEG-1 , având în vedere factorii menționați mai sus, filtrează sunetul digital folosind o mască numită Prag de mascare global , care elimină partea de informații care nu este relevantă pentru urechea umană.

Notă

Bibliografie

  • Jonathan Sterne, MP3: Sensul unui format , Duke University Press, 2012.

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității VIAF (EN) 190 078 066 · LCCN (EN) sh99000015 · WorldCat Identities (EN) VIAF-190078066