Vocea comună

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Vocea comună
site-ul web
Siglă
URL voice.mozilla.org/it
Tipul site-ului Colector de voce
Limbă O multime de limbi straine
Înregistrare Opțional
Proprietar Fundația Mozilla
Creat de Fundația Mozilla
Lansa 19 iunie 2017
Starea curenta activ

Common Voice este un proiect realizat de Fundația Mozilla , al cărui scop este de a colecta, prin contribuția voluntarilor, un număr suficient de ore de înregistrare vocală pe care să instruiască diverse programe de recunoaștere a vorbirii , precum cel bazat pe algoritmul DeepSpeech (de asemenea de Mozilla Foundation), fără restricții sau costuri.

Proiectul acceptă voci în orice limbă, accent, sex și vârstă (> 19 ani) tocmai pentru a permite crearea de recunoașteri vocale capabile să recunoască orice voce.

Oricine are vârsta sub 19 ani, conform Termenilor de utilizare, necesită acordul unui părinte sau tutore.

Există, de asemenea, o aplicație Android neoficială a proiectului care vă permite să contribuiți prin intermediul smartphone-ului [1] .

Contribuții

Contribuția la proiect este foarte simplă și nu necesită înregistrare obligatorie. Cu toate acestea, vă puteți conecta în diferite moduri: e-mail, Firefox, GitHub sau cont Google.

Puteți contribui în două moduri, în principal: „Vorbind”, adică să înregistrați fraze care apar pe ecran sau „Ascultați”, adică să validați înregistrările altor voluntari.

Site-ul web poate fi utilizat atât de pe desktop, cât și de pe dispozitive mobile, cu toate acestea pentru sistemul de operare iOS este necesar să instalați aplicația oficială din App Store .

Crearea contului

De asemenea, puteți crea un cont, conectându-vă cu e-mail, Firefox, GitHub sau cont Google, datorită căruia va fi posibil să accesați o zonă „rezervată”: Panou.

În această secțiune puteți vizualiza clasamentul colaboratorilor din întreaga lume sau numai a limbilor la care contribuiți.

Datorită contului este, de asemenea, posibil să urmăriți, oricând și oriunde, progresele realizate. Deci atât propoziții înregistrate, cât și propoziții validate.

De asemenea, vă puteți șterge profilul în orice moment. Aceasta va elimina frazele înregistrate din setul de date.

Caracteristicile setului de date

Seturile de date, adică toate sunetele „îmbinate”, sunt disponibile în domeniul public cu licența CC0 și, prin urmare, pot fi descărcate public și gratuit din secțiunea Dataset și utilizate în propriul software, inclusiv în cele comerciale. Puteți descărca limba preferată din cele disponibile. [2]

Înainte de descărcare, sunt prezente unele informații, cum ar fi dimensiunea fișierului, orele validate, numărul total de ore, numărul de intrări, accente, vârste, sex și alte date.

Setul de date de voce comun în limba engleză este a doua cea mai mare bază de date de voce accesibilă după LibriSpeech. Începând cu 29 noiembrie 2017, peste 20.000 de utilizatori din întreaga lume colectaseră 400.000 de înregistrări de sentințe validate pentru o durată totală de 500 de ore. [3]

În februarie 2019, au fost lansate primele colecții lingvistice pentru utilizare. Această versiune a inclus 18 limbi, printre care, pe lângă engleză , franceză , germană și mandarină , au existat și limbi mai puțin populare, cum ar fi galeză și kabylie . În total, această versiune a inclus peste 1400 de ore de înregistrări vocale de la peste 42000 de colaboratori. [4]

Notă

  1. ^ Donați-vă vocea: CV Project - Aplicație pe Google Play , pe play.google.com . Adus la 20 martie 2021 .
  2. ^ (EN) Common Voice de Mozilla , pe voice.mozilla.org. Adus la 6 iunie 2020 .
  3. ^ (RO) Sean White, Anunțând lansarea inițială a programului de recunoaștere a vorbirii și a modelului de date vocale open source Mozilla , pe blogul Mozilla. Adus la 6 iunie 2020 .
  4. ^ (EN) Mozilla actualizează setul de date Common Voice cu 1.400 de ore de vorbire în 18 limbi , VentureBeat, 28 februarie 2019. Accesat pe 6 iunie 2020.

Alte proiecte

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT