MBROLA

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

MBROLA este un algoritm de sinteză a vorbirii , în special este un software dezvoltat pe un proiect de colaborare la nivel mondial și distribuit gratuit, dar numai în format binar . Site-ul web al proiectului MBROLA [1] oferă baze de date de diphones pentru sinteza vorbirii într-un număr considerabil de limbi diferite.

Software-ul MBROLA nu este un sistem complet de tip text-to-speech (generarea de vorbire de sinteză pornind de la un text); De fapt, MBROLA oferă în principal baze de date foneme și diphone specifice unei anumite limbi, dar textul care urmează să fie sintetizat trebuie să fie deja convertit în foneme și informații prosodice în formatul cerut de algoritm. Această conversie preliminară necesită în mod normal utilizarea unui software separat și, prin urmare, necesită operațiuni suplimentare.

Calitatea sintezei obținute cu MBROLA este considerată a fi mai mare decât majoritatea sintetizatoarelor bazate pe diphones ; acest lucru se datorează parțial faptului că sistemul se bazează pe o preprocesare a diphone-urilor (impunând tonalități constante și faze armonice ) care îmbunătățește concatenarea acestora prin minimizarea calității segmentelor.

MBROLA, ca și PSOLA , este un algoritm de domeniu în timp, care implică o sarcină de calcul foarte redusă în timpul sintezei. Spre deosebire de PSOLA, însă, MBROLA nu necesită marcarea preliminară a perioadelor tonale. Această caracteristică a făcut posibilă dezvoltarea proiectului MBROLA în jurul algoritmului cu același nume, datorită căruia numeroase laboratoare de cercetare, companii sau persoane din întreaga lume au produs baze de date de telefoane pentru mai multe limbi și tonuri de voce ( din care numărul este de departe cel mai mare disponibil pentru un sistem de sinteză a vorbirii); cu toate acestea, există încă deficiențe semnificative, cum ar fi sinteza vocală a chinezei .

Referințe