ImageNet

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

ImageNet este o bază de date mare de imagini, creată pentru utilizare, în domeniul viziunii computerizate, în domeniul recunoașterii obiectelor . Setul de date este format din peste 14 milioane de imagini [1] [2] care au fost adnotate manual cu indicația obiectelor pe care le reprezintă și caseta de delimitare care le delimitează. [3] Obiectele identificate au fost clasificate în mai mult de 20.000 de categorii [2] : unele categorii de obiecte frecvente, precum „balonul” sau „căpșuna”, constau în câteva sute de imagini. [4] Baza de date cu adnotări referitoare la imagini de la terți este disponibilă gratuit direct de la ImageNet, chiar dacă imaginile nu fac parte din proiect (de fapt, este furnizat doar linkul către acestea). [5] Din 2010, un concurs numit ImageNet Large Scale Visual Recognition Challenge (ILSVRC) are loc în fiecare an: cu această ocazie, programele software sunt create pentru a concura pentru a clasifica și detecta corect obiectele și scenele conținute în imagini. Ca parte a competiției, se utilizează o listă redusă de imagini cu obiecte aparținând unei mii de categorii care nu se suprapun. [6]

Setul de date

Baza de date a fost prezentată pentru prima dată în 2009 în Florida, ca parte a CVPR ( Conference on Computer Vision and Pattern Recognition ), de către un grup de cercetători aparținând departamentului de informatică al Universității Princeton . [7] [8] Cercetătorii implicați includ Fei-Fei Li , profesor de informatică la Universitatea Stanford . [9] În proiectul ImageNet, procesul de adnotare se desfășoară în crowdsourcing [7] [10] : în special, în 2012 ImageNet a fost cel mai mare utilizator academic al serviciului Amazon Mechanical Turk . [2] În adnotarea la nivel de imagine vi se cere să indicați prezența sau absența unor categorii de obiecte, de exemplu „ există tigri în această imagine ” sau „ nu există tigri în această imagine ”. În adnotările la nivelul unui singur obiect, este indicată caseta de delimitare în jurul părții vizibile a obiectului.

Importanța în domeniul învățării profunde

La 30 septembrie 2012, ca parte a competiției anuale ILSVRC, utilizând o rețea neuronală convoluțională numită AlexNet [11] , s-a obținut o rată de eroare de 15,3%, cu un decalaj mai mare de 10,8 puncte procentuale la al doilea clasificat. Acest rezultat a fost posibil prin utilizarea GPU-urilor în faza de instruire în rețea [11] : utilizarea GPU s-a dovedit a fi un ingredient esențial al „revoluției învățare profundă (în engleză deep learning). Potrivit The Economist , un interes brusc pentru inteligența artificială s-a născut în urma acestui eveniment, nu numai în cadrul comunităților de cercetare, ci în întregul sector tehnologic. [4] [12] [13] Cu ocazia competiției promovate de ImageNet în 2015, AlexNet a fost depășit de o rețea neuronală convoluțională foarte profundă propusă de Microsoft, formată din peste 100 de niveluri. [14]

Concursul ImageNet pe scară largă de recunoaștere vizuală (ILSVRC)

Tendința istorică a ratei de eroare în diferitele ediții ale ILSVRC din 2011 până în 2016: graficul prezintă cele mai bune rezultate obținute în fiecare an de diferite echipe (până la maximum 10 pe an)

Competiția ILSVRC s-a născut pe urmele PASCAL VOC, o altă competiție de recunoaștere a obiectelor lansată în 2005, unde totuși a fost luat în considerare un set de date format din doar 20.000 de imagini pe 20 de clase de obiecte. [6] Începând din 2010, cercetătorul Fei-Fei Li, unul dintre principalii exponenți ai proiectului ImageNet, a propus echipei PASCAL VOC să înceapă o colaborare: echipele de cercetare ar evalua performanța algoritmilor lor pe un set dat de date. , concurând pe cine a avut cele mai bune rezultate în diferite curse bazate pe recunoașterea obiectelor. [8] Această colaborare a avut ca rezultat competiția anuală cunoscută astăzi sub numele de ImageNet Large Scale Visual Recognition Competition (ILSVRC). Un subset de ImageNet este utilizat în diferitele ediții ale ILSVRC, cu doar 1000 de categorii de imagini, inclusiv 90 din cele 120 de rase de câini clasificate în setul de date complet. [6] S-au înregistrat progrese semnificative în ceea ce privește rezultatele începând cu 2010. În timp ce în 2011 o rată de eroare de clasificare bună a fost de aproximativ 25%, în ediția din 2012 a competiției, o rețea neuronală convoluțională numită AlexNet a atins o rată de eroare de 15,3%; în următorii doi ani, rata de eroare a scăzut la câteva puncte procentuale. [15] Aceste îmbunătățiri au contribuit la trezirea unui interes puternic pentru inteligența artificială la nivel industrial. [4] În 2015, o echipă de cercetători Microsoft a propus o CNN capabilă să obțină o rată de eroare atât de mică încât să depășească capacitățile umane (în limitele sarcinilor stabilite pentru ILSVRC), estimată la aproximativ 4%. [14] [16] [17] Cu toate acestea, așa cum a subliniat Olga Russakovsky, printre organizatorii competiției, software-ul se limitează la identificarea obiectelor cuprinse într-o imagine între câteva mii de categorii, în timp ce o ființă umană are capacitatea să recunoască un obiect dintr-un număr considerabil mai mare de categorii și poate, spre deosebire de software, să contextualizeze o imagine. [18]

Notă

  1. ^ (EN) Matt Reynolds, New computer vision provocare vrea să învețe roboții să vadă în 3D , în New Scientist , 7 aprilie 2017. Accesat la 3 februarie 2018 (depus de „Original url 30 octombrie 2018).
  2. ^ a b c ( EN ) John Markoff, For Web Images, Creating New Technology to Seek and Find , în The New York Times , 19 noiembrie 2012. Accesat la 3 februarie 2018 (arhivat din original la 16 februarie 2019) .
  3. ^ (RO) IMAGEnet Summary and Statistics , pe image-net.org, IMAGEnet. Adus la 22 iunie 2016 (Arhivat din original la 20 martie 2019) .
  4. ^ a b c ( EN ) De la nefuncționare la rețea neuronală , în The Economist , 25 iunie 2016. Accesat la 3 februarie 2018 (arhivat din original la 31 decembrie 2016) .
  5. ^ (RO) Prezentare generală IMAGEnet , pe IMAGEnet. Adus la 22 iunie 2016 (arhivat din original la 4 iulie 2016) .
  6. ^ a b c ( EN ) Olga Russakovsky, Jia Deng, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg și Li Fei-Fei, ImageNet Large Scale Provocarea recunoașterii vizuale , în International Journal of Computer Vision , vol. 115, nr. 3, Springer , decembrie 2015, pp. 211-252, DOI : 10.1007 / s11263-015-0816-y , ISSN 0920-5691 ( WC ACNP ) .
  7. ^ a b ( EN ) Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li și Li Fei-Fei, IEEE, ImageNet: A large-scale hierarchical image database , 2009 IEEE Conference on Computer Vision and Pattern Recognition , Miami, IEEE, 18 august 2009, pp. 248-255, DOI : 10.1109 / CVPR.2009.5206848 .
  8. ^ a b ( EN ) Dave Gershgorn, Datele care au transformat cercetarea AI - și posibil lumea , pe Quartz , Atlantic Media Co., 26 iulie 2017. Accesat 26 iulie 2017 .
  9. ^ (EN) Fei-Fei Li, Cum învățăm computerele să înțeleagă imaginile , pe ted.com. Adus la 16 decembrie 2018 .
  10. ^ Claudio Leonardi, ImageNet, noul mod de a găsi imagini pe web , în La Stampa , 23 noiembrie 2012 (arhivat din original pe 29 noiembrie 2012) .
  11. ^ A b (EN) Alex Krizhevsky, Ilya Sutskever și Geoffrey E. Hinton, clasificare IMAGEnet cu rețele neuronale convoluționale profunde (PDF), în Communications of the ACM , vol. 60, n. 6, iunie 2017, pp. 84–90, DOI : 10.1145 / 3065386 , ISSN 0001-0782 ( WC ACNP ) . Adus pe 24 mai 2017 .
  12. ^ (EN) Mașinile „bat oamenii” pentru un număr tot mai mare de sarcini , în Financial Times , 30 noiembrie 2017. Accesat pe 3 februarie 2018.
  13. ^ (RO) Dave Gershgorn, Povestea interioară a modului în care AI a ajuns să fie suficient de bună pentru a domina Silicon Valley , pe Quartz, 18 iunie 2018. Accesat pe 10 decembrie 2018 (depus de 'url original 24 mai 2019).
  14. ^ a b ( EN ) Kaiming He, Xiangyu Zhang, Shaoqing Ren și Jian Sun, Deep Residual Learning for Image Recognition ( PDF ), în 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , 2016, pp. 770-778 (arhivat din original la 12 iulie 2018) .
  15. ^ (RO) Martin Robbins, Este nevoie de o inteligență artificială să facă dragoste cu iubita lui Rembrandt pentru a face artă? , în The Guardian , 6 mai 2016. Adus la 22 iunie 2016 (arhivat din original la 11 aprilie 2019) .
  16. ^ (EN) Academiile Naționale de Științe, Inginerie și Medicină, Tehnologia Informației și Forța de Muncă din SUA: Unde suntem și unde mergem de aici? , National Academies Press, 2017, p. 44, ISBN 978-0-309-45402-5 .
  17. ^ (EN) John Markoff, A Learning Advance in Artificial Intelligence Rivals Human Abilities in The New York Times , 10 decembrie 2015. Accesat la 22 iunie 2016.
  18. ^ (EN) Jacob Aron, Forget the Turing test - există modalități mai bune de a judeca AI , în New Scientist , 21 septembrie 2015. Accesat la 22 iunie 2016 (depus de „Adresa URL originală 11 aprilie 2019).

Elemente conexe

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT