MP3

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Notă despre dezambiguizare.svg Dezambiguizare - Dacă sunteți în căutarea altor semnificații, consultați MP3 (dezambiguizare) .
MPEG - 1/2 Audio Layer III
Mp3.svg
Extensie .mp3
Tip MIME audio/mpeg [1]
audio/MPA [2]
audio/mpa-robust [3]
Dezvoltat de Grupul de experți în imagini în mișcare
Proprietar Da
Licență Format brevetat (brevetat), specificații publice
Tip Compresie audio digitală
Comprimare Pierdător
Standard ISO / IEC 11172-3
ISO / IEC 13818-3
Site-ul web mpeg.chiariglione.org/

MP3 (formal Moving Picture Expert Group-1/2 Audio Layer 3), cunoscut și sub numele de MPEG-1 Audio Layer III și MPEG-2 Audio Layer III [4] este un algoritm de tip lossy de compresie audio , dezvoltat de grupul MPEG , capabil să reducă drastic cantitatea de date necesară pentru a stoca un sunet, păstrând în același timp o reproducere acceptabilă și fidelă a fișierului original necomprimat. Concepția sa se datorează unei echipe de lucru înființate la CSELT și coordonată de Leonardo Chiariglione . [5]

Istorie

Formatul face parte din activitatea de cercetare de codificare pentru mediile digitale de către operatorii de rețele de telecomunicații, în anii optzeci și nouăzeci. În acest domeniu, cercetarea italiană a centrului de cercetare CSELT a avut un grup activ pe plan internațional [6] .

Sigla MPEG

Codificarea „MPEG-1/2 Layer 2” a început ca un proiect la DAB și promovat de Fraunhofer IIS-A . A fost finanțat de Uniunea Europeană ca parte a unui program mai larg de cercetare numit EUREKA , cunoscut în mod obișnuit sub numele de codul UE-147.

În decembrie 1988 , grupul, inițial creat pentru codarea video pentru echipamentele de înregistrare, a înființat un grup de lucru pentru codificarea audio, prezidat de Hans-Georg Mussmann [7] . În iulie 1989 a fost publicat un apel la propuneri, care este o cerere din partea Comunității Europene de a prezenta unele din ale căror răspunsuri au derivat, pentru partea audio, tehnologiile care au dat naștere celor trei „straturi” ale ISO / IEC 11172-3 standard (denumit MPEG-1 Audio): straturile I și II prin tehnologia propusă de consorțiul MUSICAM format din CCETT , Philips și Institut für Rundfunktechnik și stratul III prin tehnologia propusă de consorțiul ASPEC format din AT&T , France Télécom , Fraunhofer- Gesellschaft și Thomson Consumer Electronics ; Printre membrii consorțiului s-a remarcat în special Karlheinz Brandenburg al lui Fraunhofer, care a abordat subiectul în teza sa de doctorat. În martie 1992, CSELT din Torino a demonstrat prima versiune de lucru a sistemului MPEG-1, atât local pe un computer personal, cât și în rețea. MPEG a aprobat în cele din urmă standardul ISO / IEC 11172-3 în noiembrie 1992. Acronimul MP3 a fost conceput în 1997 prin e-mail de către un grup de experți MPEG .

O altă fază a proiectului MPEG Audio s-a încheiat în 1994 cu crearea MPEG-2 , definit ca un standard internațional cu codul ISO / IEC 13818-3 și publicat în 1995 .

Eficiența unui algoritm de compresie este de obicei evaluată de rata de biți finală pe care o atinge, în timp ce metrica ratei de compresie, care ar părea mai naturală, depinde atât de frecvența, cât și de numărul de biți ai semnalului de intrare. Cu toate acestea, ratele de compresie sunt raportate în mod obișnuit folosind CD-urile ca referință, unul dintre cele mai frecvente fiind 44,1k Hz și 2x16 biți . Uneori sunt utilizați și parametri DAT SP (48 kHz, 2x16bit). Rata de compresie în acest sistem de referință este mai mare, ceea ce demonstrează dificultatea în definirea termenului de compresie ca o pierdere de calitate în codificare. Karlheinz Brandenburg a folosit CD - ul Suzannei Vega , „ Tom's Diner ” ca model de referință al algoritmului de compresie pentru MP3. Acest CD a fost ales pentru dulceața și simplitatea sa, facilitând ascultarea oricăror imperfecțiuni pe care le poate provoca compresia în timpul înregistrării.

Pagina oficială web publică următoarele rate de compresie pentru MPEG-1 Layer 1,2 și 3.

  • Strat 1: 384 kbit / s, compresie 4: 1
  • Stratul 2: 192 ... 256 kbit / s, compresia 6: 1 ... 8: 1
  • Stratul 3: 112 ... 128 kbit / s, 10: 1 ... 12: 1 compresie

Acestea sunt valori destul de aleatorii ca:

  • Calitatea depinde nu numai de formatul de codificare al fișierului , ci și de calitatea psihoacustică a codificatorului. Codificatorul tipic de strat 1 folosește un model psihoacustic de bază, care ajunge să necesite mai mulți biți pentru un rezultat satisfăcător.
  • Codificarea stratului 1 la 384 kbit / s, chiar și cu acest „psihoacustic” simplu este mai bună decât codarea stratului 2 la 192… 256 kbit / s.
  • Codificarea stratului 3 la 112 ... 128 kbit / s este mai slabă decât stratul 2 la 192 ... 256 kbit / s

O modalitate mai realistă de a lua în considerare rata de biți este:

  • Stratul 1: excelent la 384 kbit / s
  • Stratul 2: excelent la 256 ... 320 kbit / s, foarte bun la 224 ... 256 kbit / s, bun la 192 ... 224 kbit / s, nu trebuie utilizat sub 160 kbit / s
  • Stratul 3: excelent la 224 ... 256 kbit / s, foarte bun la 192 ... 224 kbit / s, bun la 160 ... 192 kbit / s, nu trebuie utilizat sub 128 kbit / s

Comparația unui nou format de fișier se face prin compararea calității medii de compresie a noului format cu un codificator de înaltă calitate și foarte optimizat al vechiului format.

Algoritmul care folosește formatul MP3 se bazează pe o transformare hibridă care transformă semnalul din domeniul timpului în cel al frecvențelor și invers.

AAC MPEG-4 este moștenitorul formatului MP3 întotdeauna conform specificațiilor MPEG . Printre succesorii formatului MP3 Ogg Vorbis este remarcabil pentru calitatea sa de codificare [fără surse ] și pentru că este un proiect de software liber . Aproape toate celelalte formate sunt legate de companii care dețin diverse brevete și licențe legate de specificațiile MPEG.

Răspândirea formatului MP3 aduce o mică revoluție în lumea muzicii, răspândirea listelor de redare. Anterior, piesele de succes erau intercalate cu atenție cu melodii mai puțin reușite pe CD-uri și casete audio care puteau fi auzite doar în ordinea studiată de producător. Odată cu apariția mass-media digitale, acest lucru nu se mai întâmplă și este posibilă o personalizare mai mare.

Caracteristici ale formatului

Se crede că, pentru o redare satisfăcătoare a MP3-ului, rata de biți trebuie să fie de cel puțin 128 kbit / s; cu toate acestea, calitatea unui MP3 comprimat la această rată de biți nu se apropie de cea a unui CD-Audio, garantând în același timp performanțe decente cu o dimensiune a fișierului foarte mică. Această rată de biți este rezultatul unei rate de compresie care se apropie de raportul de 11,02: 1 pentru piesele muzicale cu voce masculină, în timp ce, în cazul unei voci feminine, deoarece este mai acută și mai greu de comprimat, raportul devine aproximativ 10,17. : 1, cu condiția ca banda totală a semnalului audio să nu depășească 2,0629 MHz, altfel raportul scade drastic până la vârfuri de 2,13: 1. Testele de ascultare arată că, cu puțină practică, mulți sunt capabili să distingă un format MP3 de 128 kbit / s de un CD original. Pentru mulți alții, 128 kbit / s are o calitate redusă a ascultării. [ necesită citare ] Dintr-o analiză efectuată de revista SUONO , opinia dirijorilor la sfârșitul testului este că doar la cel puțin 256 kbit / s putem vorbi de înaltă fidelitate .

Codificatori posibili:

  • Cod de referință ISO dist10 : este cea mai proastă calitate; fișier MP3 defect (toate blocurile audio sunt marcate ca defecte).
  • Xing: bazat în principal pe codul ISO, calitate similară cu ISO dist10 .
  • Lama: calitate similară cu ISO dist10 .
  • FhG: unele dintre ele sunt bune, dar altele au defecte grave.
  • ACM Producer Pro: unele versiuni generează zgomot deranjant.
  • LAME ( acronim recursiv pentru L ame A in't an M P3 E ncoder, literalmente „LAME nu este un codificator MP3”) a început ca un patch demo (licențiat GPL ) realizat de Mike Cheng la începutul anului 1998, care a modificat codificatorul dist10 original . În mai 2000, ultimele rămășițe ale codului sursă ISO au fost eliminate, făcând din LAME un codificator MP3 în sine (cu cod sursă distribuit sub licența LGPL ), capabil să concureze cu principalele codificatoare de pe piață. [8]

Pe site-ul https://web.archive.org/web/20040409160037/http://www.jthz.com/mp3/ puteți găsi un front-end Windows pentru codificatorul LAME.

Calitatea unui fișier MP3 depinde de calitatea codificării și de dificultatea cu care semnalul trebuie codat. Codificatoarele bune au o calitate acceptabilă de la 128 la 160 kbit / s, claritatea perfectă a unei melodii se realizează de la 160 la 192 kbit / s. Un codificator de calitate scăzută poate fi recunoscut ascultând chiar și o melodie de 320 kbit / s. Acesta este motivul pentru care nu are sens să vorbim despre calitatea ascultării unei melodii de 128 kbit / s sau 192 kbit / s. Codificarea MP3 de 128 kb / s produsă de un codificator bun produce un sunet mai bun decât un fișier MP3 de 192 kb / s codificat cu un codificator slab.

O caracteristică importantă a MP3-ului este pierderea de date datorată compresiei - este modul în care informațiile sunt eliminate din fișierul audio original pentru a economisi spațiu. În codificatoarele MP3 moderne, cei mai eficienți algoritmi merg la lungimi mari pentru a se asigura că sunetele eliminate sunt cele care nu pot fi detectate și / sau care sunt mai puțin detectate de urechea umană. Acest rezultat a fost atins și datorită științei psihoacusticii .

Cu toate acestea, mulți ascultători pot face diferența comparând un CD original cu un format MP3 de 192 kbit / s și chiar 256 kbit / s al unor codificatoare mai puțin puternice și mai învechite. Este posibil să stocați fișiere audio cu fidelitate maximă utilizând compresie audio precum FLAC , SHN sau LPAC , care comprimă un fișier audio PCM de aproximativ 16 biți. 50-75% din original [ fără sursă ] (depinde de caracteristicile fișierului audio în sine).

Rata de biți

Rata de biți este numărul de unități binare care curg pe secundă și este variabilă pentru fișierele MP3. Regula generală este că, cu cât rata de biți este mai mare, cu atât puteți include mai multe informații din original, cu atât este mai mare calitatea fișierului audio comprimat. În prezent, pentru codificarea fișierelor MP3, acestea stabilesc o rată de compresie echivalentă pentru întregul fișier audio.

Pentru MPEG-1 layer 3, ratele de biți disponibile sunt: ​​32, 40, 48, 64, 80, 96, 112, 128, 160, 192, 224, 256 și 320 kbit / s, iar frecvențele eșantionate disponibile sunt 32, 44,1 și 48 kHz. Rata de eșantionare de 44,1 kHz este aproape întotdeauna utilizată pentru CD-uri audio, în timp ce 128 kbit / s este un fel de rată de biți standard „suficient de bună”. MPEG-2 și MPEG-2.5 (neoficial) au un număr mai mare de rate de biți: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144 și 160 kbit / s.

Fișierele audio MP3 sunt împărțite în sectoare („bucăți” în engleză) numite cadre , („cadre” în italiană). Fiecare dintre aceste sectoare este prevăzut cu un marker al ratei de compresie; în acest fel, în timp ce fișierul audio este redat, acesta poate fi editat dinamic. Această tehnică face posibilă utilizarea mai multor biți pentru partea dinamică ridicată a sunetului (sunete mai complexe) și mai puțini biți pentru partea dinamică joasă (sunete mai puțin complexe).

Canale

Formatul MP3 poate utiliza diferite tehnici pentru codificarea canalelor stereo:

  • Codificare forțată stereo: se codifică un singur canal audio, care este apoi împărțit în timpul redării, deci există o pierdere notabilă de calitate, deoarece canalele din stânga și din dreapta vor deveni aceleași.
  • Codare stereo standard: fluxurile stânga și dreapta sunt codificate independent.
  • Joint-Stereo (Mid \ Side Encoding): profită de faptul că canalele din stânga și din dreapta sunt în principiu foarte asemănătoare, prin urmare, doar un canal este codificat și informațiile despre diferențele dintre canalul din dreapta și din stânga, există un considerabil eficiență în termeni de compresie fără a pierde nicio informație de canal și veți obține o creștere a calității, deoarece biții cadrului nu sunt irosiți cu informații redundante.

Codificatoarele Lame implicite folosesc Joint-Stereo pentru CBR sub 160 kbit / s sau pentru VBR de q (indice de calitate) mai mare de 4, stereo în toate celelalte cazuri; în codificatoarele profesionale este totuși posibil să alegeți manual tipul de codare a canalului pe care Lame îl va folosi. Alegerea de a nu utiliza Joint-Stereo exclusiv se datorează faptului că unele dispozitive nu pot procesa corect informațiile Dolby Surround dacă se utilizează Joint-Stereo.

Probleme critice

Există mai multe defecte în formatul fișierelor MP3, care nu pot fi detectate nici măcar de cele mai bune codificatoare și sunt inerente caracteristicilor formatului în sine (între paranteze, formatul de fișier în care este corectat acest defect). [ fără sursă ]

  • Timp de rezoluție prea scăzut pentru un semnal tranzitoriu foarte mare ( AAC , Ogg Vorbis )
  • întârziere generală nedefinită de codificare / decodare (Ogg Vorbis)
  • fără factor de bandă pentru frecvențe peste 15,5 / 15,8 kHz (AAC, Ogg Vorbis)
  • Legarea stereo se face pe baza unui cadru sau „cadru” (AAC, Ogg Vorbis)
  • Rata de biți este limitată la 320 kbit / s (AAC, Ogg Vorbis)

Codificatori

Standardul MPEG-1 nu definește specificațiile precise pentru codificatoarele MP3. Algoritmul de decodare și formatul fișierului, pe de altă parte, sunt foarte bine definite. Se presupune că creatorul standardului a conceput un algoritm pentru a elimina informațiile corespunzătoare dintr-un fișier original, sau mai degrabă o reprezentare a domeniului de frecvență ( MDCT ). Acest proces se bazează de obicei pe codarea psihoacustică, adică acele sunete pe care urechea umană nu le poate percepe atât prin ureche cât și prin creier sunt eliminate.

Ca rezultat, există multe codificatoare MP3 diferite, fiecare capabil să redea fișiere de calitate diferită; începând cu 30 septembrie 2001, cel mai bun codificator cu o rată de biți mare (128 kbit / s și mai mare) este [1] [ link rupt ] . Pentru ratele de biți mai mici, cel mai bun codificator este Fraunhofer, dar există opinii diferite. Cu toate acestea, decodarea MP3 este bine definită de un standard. Multe decodoare sunt „ compatibile cu fluxul de biți ”, ceea ce înseamnă că pot reda exact o melodie din același fișier MP3 necomprimat.

ID3

Pictogramă lupă mgx2.svg Același subiect în detaliu: eticheta ID3 .

Etichetele ID3 vă permit să inserați titlu, artist, album, numărul piesei, descriere, imagine sau alte informații în fișiere MP3.

Alternative

Există multe alte codecuri audio alternative la MP3:

mp3PRO , MP3, AAC și MP2 sunt toți membri ai aceleiași familii de tehnologii și se bazează pe modele psihoacustice similare.

Fraunhofer Gesellschaft deține câteva licențe codec : Dolby Labs , Sony , Thomson / Technicolor , în timp ce AT&T deține alte brevete.

Există alte metode de compresie fără pierderi pe Internet; Deși nu sunt similare cu MP3, acestea sunt exemple bune de alte metode de compresie disponibile:

Formatul MP3 a fost conceput pentru a fi utilizat în paralel cu formatul video MPEG-1/2 și, prin urmare, nu poate reproduce în mod adecvat sunete sub 48 kbit / s (mono) sau 80 kbit / s (stereo).

Deși unii susținători de codecuri mai noi, cum ar fi WMA, mp3PRO și RealAudio, susțin că algoritmii lor respectivi sunt capabili să obțină o calitate CD de până la 64 kbit / s, testele de ascultare oarbă par să le infirme. Cu toate acestea, trebuie apreciată superioritatea incontestabilă a acestor și a altor formate față de MP3 cu aceeași lățime de bandă utilizată. [ fără sursă ]

Printre altele, Xiph.Org Foundation , dezvoltatorul algoritmului Vorbis utilizat împreună cu containerul multimedia Ogg , oferă pe o pagină web câteva teste de ascultare comparate între diferite formate audio.

Licențe și brevete

Un player mp3

Thomson / Technicolor deține brevetul MPEG-1/2 Layer 3 în SUA și Japonia . Microsoft, care a proiectat sistemul de operare Windows, a ales să-și creeze propriul format propriu WMA în loc să folosească MP3, evitând astfel să plătească redevențele aferente.

Sub președinția lui Mario Monti , antitrustul european a amendat Microsoft pentru abuzul de poziție dominantă cu sancțiunea maximă: 10% din cifra de afaceri . Microsoft a fost obligat să permită instalarea pe Windows a unor playere audio, altele decât Windows Media Player-ul nativ, inclus în sistemul său de operare ; aceste programe au permis ascultarea mp3 și alte formate, altele decât wma. În cele din urmă, software-ul Windows Media Player în sine a fost modificat pentru a citi multe codecuri și a le arde, inclusiv mp3.

În ciuda acestor alegeri, formatul mp3 continuă să fie utilizat pe scară largă. Aici pentru că:

  • până acum majoritatea utilizatorilor sunt familiarizați cu formatul;
  • cea mai mare parte a muzicii disponibile este în format mp3;
  • o mare varietate de software și hardware au beneficiat foarte mult de acest format, revoluționând industria muzicală și legile drepturilor de autor;
  • nu există controale asupra copierii și distribuției mp3-urilor (absența DRM, Digital Rights Management);
  • mp3 este în general un fișier mai puțin greu decât multe alte formate; Cu toate acestea, este depășit în calitate / bit rate atât de WMA, cât și de Ogg Vorbis , AAC . [ fără sursă ] Oferă o calitate audio mai bună decât fișierele care ocupă între 3 și 5 MB (MegaByte), pentru o melodie tipică de 5 minute, comprimată la o rată de biți de 128 kbit / s. Acest lucru permite descărcarea melodiilor individuale chiar și pentru utilizatorii care nu au o conexiune ADSL , pentru a stoca câteva ore de muzică în playere media.
  • revoluția mp3 constă în faptul că modelele psihoacustice utilizate pentru codificarea fluxului audio exploatează fenomenul de mascare; urechea umană, de fapt, este incapabilă să perceapă anumite sunete suprapuse. În acest fel, se codifică mai puține informații, fără a perturba totuși calitatea perceptivă.

La 23 aprilie 2017, Fraunhofer-Gesellschaft a anunțat că toate brevetele în format MP3 deținute de Fraunhofer-Gesellschaft și Technicolor au expirat. [9] [10]

Notă

  1. ^ RFC 3003
  2. ^ RFC 3555
  3. ^ RFC 5219
  4. ^ Un format de încărcare utilă RTP mai tolerant la pierderi pentru MP3 Audio
  5. ^ Mp3, frumoasă oportunitate irosită , pe archivi.panorama.it , panorama.it. Adus la 26 februarie 2014 (arhivat din original la 27 ianuarie 2013) .
  6. ^ "CSELT a fost printre primele organizații de cercetare care au investit în direcția compresiei ridicate a informațiilor audiovizuale ca singurul instrument capabil să ofere operatorilor posibilitatea de a furniza servicii video fără a fi nevoie să aștepte apariția rețelelor complet noi. În 1988, la inițiativa CSELT, a fost înființat în ISO Grupul de experți în imagini în mișcare (MPEG) care, odată cu dezvoltarea celor două standarde MPEG-1 și MPEG-2 și cu sprijinul obținut de industrie în dezvoltarea VLSI necesar pentru operatorilor posibilitatea de a trimite semnale audiovizuale de înaltă calitate pe rețeaua telefonică actuală. CSELT a fost primul, în martie 1992, care a demonstrat o implementare completă a standardului MPEG-1 cu un decodor integrat într-o aplicație de pe un computer personal, mai întâi local și ulterior online. Această primă realizare a fost urmată de alte dezvoltări din ce în ce mai vizate pentru a permite experimentarea serviciilor multimedia interactive. " Luat de la: Prof. Luigi Bonavoglia (editat de) „CSELT - Treizeci de ani”, 1995. - pag. 240.
  7. ^ Mp3 Genesis: Copie arhivată ( PDF ), pe users.ipfw.edu . Adus la 26 iulie 2011 (arhivat din original la 17 ianuarie 2012) . August 2006
  8. ^ Dezvoltare Lame la Sourceforge
  9. ^ (EN) mp3 , pe iis.fraunhofer.de.
  10. ^ (RO) Alive and Kicking - Software mp3, brevete și licențe , pe audioblog.iis.fraunhofer.com, 18 mai 2017.

Bibliografie

Elemente conexe

Alte proiecte

linkuri externe

Controllo di autorità LCCN ( EN ) sh00000865 · BNF ( FR ) cb13542060m (data)
Informatica Portale Informatica : accedi alle voci di Wikipedia che trattano di informatica