Baza de date MNIST

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Baza de date modificată a Institutului Național de Standarde și Tehnologie ( MNIST ) este o bază de date mare de figuri scrise de mână, care este folosită în mod obișnuit ca set de instruire în diferite sisteme de procesare a imaginilor [1] [2] . Baza de date este, de asemenea, utilizată ca set de instruire și testare în domeniul învățării automate [3] [4] . Baza de date a fost creată prin amestecarea imaginilor prezente în setul de date NIST .

Exemple de imagini MNIST.
Un exemplu de date de testare MNIST

Baza de date MNIST conține 60 000 de imagini de antrenament și 10 000 de imagini de testare [5] ; jumătate din setul de antrenament și jumătate din setul de testare au fost preluate din setul de antrenament NIST, în timp ce cealaltă jumătate au fost obținute din setul de testare NIST [6] . Mai multe lucrări raportate în publicațiile științifice s-au concentrat asupra obiectivului de a obține o rată de eroare scăzută; într-o publicație, care documentează o lucrare bazată pe utilizarea unui sistem ierarhic de rețele neuronale convoluționale , este raportată o rată de eroare de 0,23% [7] . Autorii setului de date MNIST păstrează o listă a unor metode care au fost folosite pe acesta [8] : au folosit, în publicația lor originală, un SVM , obținând o rată de eroare de 0,8% [9] .

Setul de date

Imaginile din baza de date sunt combinația a două baze de date din NIST: baza de date specială 1 și baza de date specială 3 , care sunt alcătuite respectiv din cifre scrise de mână de elevi de liceu și de angajați ai biroului de recensământ [8] .

Notă

  1. ^ ( EN ) Suport pentru recunoașterea modelului de viteză al mașinilor vectoriale - Proiectarea sistemelor de viziune , pe proiectarea sistemelor de viziune . Adus la 17 august 2013 .
  2. ^ (EN) Sachin Gangaputra, bază de date cifrată de mână , pe cis.jhu.edu. Adus la 17 august 2013 .
  3. ^ (RO) Qiao Yu, BAZA DE DATE MNISTĂ a cifrelor scrise de mână , pe gavo.tu-tokyo.ac.jp, 2007. Accesat la 18 august 2013 (depus de „ url-ul original 11 februarie 2018).
  4. ^ (EN) John C. Platt, Utilizarea QP analitice și a rarității pentru a accelera antrenamentul mașinilor vectoriale de suport (PDF), în Advances in Neural Information Processing Systems, 1999, pp. 557-563. Adus la 18 august 2013 (arhivat din original la 4 martie 2016) .
  5. ^ Ernst Kussul și Tatiana Baidyk, Metodă îmbunătățită de recunoaștere a cifrelor scrise de mână testată pe baza de date MNIST , în Image and Vision Computing , vol. 22, n. 12, 2004, pp. 971–981, DOI : 10.1016 / j.imavis.2004.03.008 .
  6. ^ Bin Zhang și Sargur N. Srihari, Fast k -Nearest Neighbor Classification Using Cluster-Based Trees ( PDF ), în IEEE Transactions on Pattern Analysis and Machine Intelligence , vol. 26, n. 4, 2004, pp. 525-528, DOI : 10.1109 / TPAMI . 2004.1265868 , PMID 15382657 . Adus la 18 august 2013 .
  7. ^ Dan Cires¸an, Ueli Meier și Jürgen Schmidhuber, Rețele neuronale profunde cu coloane multiple pentru clasificarea imaginilor ( PDF ), în 2012 IEEE Conference on Computer Vision and Pattern Recognition , 2012, pp. 3642–3649, DOI : 10.1109 / CVPR.2012.6248110 , ISBN 978-1-4673-1228-8 , arXiv : 1202.2745 .
  8. ^ a b Yann LeCun, Corinna Cortes și Christopher JC Burges, baza de date cu cifre manuscrise MNIST, Yann LeCun, Corinna Cortes și Chris Burges , la yann.lecun.com . Adus la 17 august 2013 .
  9. ^ Yann LeCun, Léon Bottou, Yoshua Bengio și Patrick Haffner, Gradient-Based Learning Applied to Document Recognition ( PDF ), în Proceedings of the IEEE , vol. 86, nr. 11, 1998, pp. 2278–2324, DOI : 10.1109 / 5.726791 . Adus la 18 august 2013 .

Elemente conexe

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT