Formarea zgomotului

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Similar cu dither , modelarea zgomotului este o tehnică de reducere a bitului utilizată pentru a minimiza eroarea de cuantificare. Noise shaping are diverse aplicații în procesarea semnalului digital , inclusiv audio digital și video digital.

Ditherul reduce efectiv eroarea de cuantificare prin adăugarea prealabilă de zgomot la procesul de cuantificare (pentru o explicație mai cuprinzătoare a modului în care funcționează, consultați elementul dither ). Un dezavantaj al scuturării este că introduce zgomot alb la semnal, uneori cu colorare, prin ridicarea unui nivel de zgomot la un anumit nivel sub scală completă (aproximativ 6 dB pe bit ). În cazurile în care receptorul (urechea umană, în cazul sunetului digital) este mai sensibil la unele frecvențe decât la altele, modelarea zgomotului poate fi utilizată pentru a „modela” răspunsul în frecvență al zgomotului într-un mod avantajos.

Principiul de funcționare

Formarea zgomotului acționează plasând eroarea de cuantificare într-o buclă retroactivă (buclă de feedback). Fiecare buclă retroactivă funcționează ca un filtru : eroarea poate fi apoi filtrată după cum se dorește prin crearea unei bucle retroactive dedicate. Un exemplu de bază ar putea fi următorul:

unde y reprezintă valoarea eșantionului de ieșire, x a celui primit, n indică numărul progresiv al eșantionului măsurat și E (x) eroarea dintre valoarea inițială și cea cuantificată. Această formulă poate fi, de asemenea, citită astfel: „Eșantionul de ieșire este același cu eșantionul de intrare, plus eroarea eșantionului de intrare anterior”.

Ori de câte ori faceți o reducere a rezoluției (definită mai precis adâncimea de biți , adâncimea de biți) a unui eșantion, eroarea de cuantizare rezultată (diferența dintre valoarea inițială și trunchiul) este măsurată și stocată: această valoare va fi adăugată la următoarea eșantion, înainte de cuantificarea acestuia. Efectul obținut în acest caz este că eroarea de cuantizare în sine (și nu semnalul valid) este plasată într-o buclă retroactivă. Acest exemplu de bază arată un filtru unipolar sau un filtru cu o pantă de 6 dB / octavă: frecvența de întrerupere a filtrului poate fi controlată de cantitatea de eroare anterioară a eșantionului introdusă în bucla retroactivă. De exemplu, modificând valoarea lui A în următoarea formulă:

frecvența centrală a buclei retroactive se va schimba.

Algoritmi mai complecși pot fi folosiți pentru a crea curbe mai complexe, care utilizează erori de eșantionare multiple utile pentru declanșarea unui feedback. Următoarea formulă:

este legat de un formator de zgomot cu comandă nouă, capabilă de formare de zgomot foarte complex.

Mai mult, procesul de modelare a zgomotului trebuie să furnizeze întotdeauna o cantitate adecvată de dithering , pentru a preveni apariția unor erori determinabile și corelate în semnalul însuși. Dacă nu se folosește nici un dither , modelarea zgomotului acționează doar ca modelarea distorsiunii : este capabilă să deplaseze energia distorsiunii (generată de eroarea de cuantificare) pe diferite benzi de frecvență, dar distorsiunea nu se transformă în zgomot. Dacă procesul este integrat cu adăugarea de dither , ca în exemplul următor:

eroarea de cuantificare este de fapt transformată în zgomot, iar procesul produce de fapt formarea zgomotului .

Formarea zgomotului în sunetul digital

Formarea zgomotului în sunet, în majoritatea cazurilor, este implementată ca o schemă de reducere a bitului. Ditherul liniar generează o eroare de cuantificare a răspunsului plat (zgomot alb complet): urechea umană, cu toate acestea, la niveluri de ascultare scăzute, este mai puțin sensibilă la unele frecvențe decât la altele (așa cum este ilustrat în diagrama Fletcher-Munson ). Formarea zgomotului poate fi exploatată pentru a manipula distribuția erorii de cuantificare, astfel încât să fie mai concentrată în afara spectrului sonor. Rezultatul este o reducere considerabilă a erorii de cuantificare pe benzile critice, datorită concentrației mai mari de zgomot pe benzile la care urechea este mai puțin sensibilă.

Un algoritm popular de formare a zgomotului este POW-R , dezvoltat de consorțiul POW-R . Folosește un formator de zgomot de ordinul 9 pentru a reduce semnalele de 24 de biți la 16 biți. Datorită unui astfel de formator de zgomot abrupt, este capabil să elimine majoritatea zgomotului din banda critică de 1-4 kHz pentru a-l transfera în benzile de 20-60 Hz și 12+ kHz, unde pragul de audibilitate este semnificativ mai mare. Algoritmul de modelare a zgomotului poate astfel păstra o precizie eficientă pe 24 de biți cât poate aprecia urechea, oferind un interval dinamic de 150 dB atunci când este necesar, chiar dacă zgomotul în bandă largă (zgomotul cumulativ al întregului spectru de frecvență) este încă menținut la -98,08 dbFS [1] .

Nu toți algoritmii care reduc adâncimea de biți cu difuzia zgomotului sunt formatori de zgomot . Apogee lui UV-22 și UV-algoritmi de 22 h, de exemplu, sunt 24- la 16 biți reducere cuantizare care pur și simplu utilizați cuantizare colorate (model sau răspuns filtrat). Aceasta nu implică nici utilizarea unei bucle retroactive și nici o filtrare a erorilor de cuantificare - este doar o prefiltrare a zgomotului de scurgere .

Transformarea zgomotului și convertoarele de 1 bit

Din 1989, modulatorii delta-sigma de 1 bit au fost folosiți în conversia analog-digital : semnalul audio este eșantionat la o rată de eșantionare extrem de mare (2,8224 MHz , de exemplu), dar folosind doar 1 bit. Cu o rezoluție atât de mică, acest tip de convertor are o dinamică de doar 7,78 dB; podeaua de zgomot , totuși, este distribuită uniform pe întregul interval de frecvență eșantionat (adică sub frecvența Nyquist , în acest caz egală cu 1,4112 MHz, conform teoremei Nyquist-Shannon ). Mai mult, prin exploatarea modelării zgomotului , este posibil să atenuați în continuare zgomotul care cade în banda sonoră (20-20.000 Hz) și să-l concentrați deasupra acestuia. Aceasta implică o dinamică medie (în banda 0-1.411.200 Hz, în acest exemplu) de numai 7,78 dB, dar nu uniformă în toate benzile de frecvență: în cele inferioare (prima dintre acestea, spectrul sonor), intervalul dinamic este semnificativ mai mare (mai mare de 100 dB). Formarea zgomotului este integrată în fiecare modulator delta-sigma.

Convertorul de 1 bit este baza formatului DSD al Sony. O critică a convertorului de 1-bit (și a sistemului DSD) este faptul că, deoarece un singur bit este utilizat atât în ​​procesarea semnalului, cât și în bucla retroactivă, nu este posibil să se utilizeze o cantitate adecvată de dither în bucla retroactivă. ., provocând distorsiuni sonore în anumite condiții. Majoritatea convertoarelor AD fabricate din 2000 utilizează modulatoare delta-sigma la rezoluții mai mari, care returnează o ieșire de peste 1 bit, astfel încât cantitatea adecvată de dither să fie adăugată la bucla retroactivă. Pentru eșantionarea tradițională PCM , semnalul este apoi decimat la 44,1 kHz sau alte rate de eșantionare adecvate.

Notă

Elemente conexe