CAPTCHA

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Această CAPTCHA (versiunea 1) a „smwm” evită interpretarea mesajului său de către un computer prin rotirea unor litere, deformarea lor și adăugarea unei nuanțe de albastru deschis pe fundal.

Acronimul englez CAPTCHA (pronunțat: [ˈkæp.tʃə] ) denotă în domeniul informaticii un test format din una sau mai multe întrebări și răspunsuri pentru a determina dacă utilizatorul este un om și nu un computer sau, mai exact, un bot .

Acronimul, presupus derivat din engleza „ C ompletely A utomated P ublic T uring-test-to-tell C omputers and H umans A part ” („ Testul Turing public și complet automat pentru a distinge între computere și oameni”), de fapt reproduce fonetic expresia colocvială „Te-am prins!” (Te-am prins!) . Termenul a fost inventat în 2000 de Luis von Ahn , Manuel Blum și Nicholas J. Hopper de la Universitatea Carnegie Mellon și John Langford de la IBM .

Un test CAPTCHA utilizat de obicei este unul în care utilizatorul este rugat să scrie ce litere sau cifre sunt prezente într-o secvență, care apare distorsionată sau neclară pe ecran .

Deoarece testul este tratat de un computer, în timp ce testul original Turing este tratat de un om, testul CAPTCHA este uneori descris ca un test invers Turing; cu toate acestea, aceasta este o definiție înșelătoare, deoarece ar putea indica și un test Turing în care ambii participanți încearcă să demonstreze că nu sunt oameni; de fapt, vorbind literalmente, ești un robot .

Descriere

Origini

CAPTCHA-urile au fost dezvoltate pentru prima dată în 1997 de către departamentul de cercetare și dezvoltare al AltaVista condus de Andrei Broder , pentru a împiedica roboții să adauge adrese URL la motorul lor de căutare . Broder și colegii săi au încercat să creeze imagini rezistente la atacurile OCR și astfel au consultat manualul scanerelor Brother , care indica toate caracteristicile pe care trebuie să le aibă un text pentru a fi recunoscute de scaner: caractere bine definite și liniare, lipsa de diferențele dintre fonturile utilizate în text, un fundal omogen care se distinge clar de text și așa mai departe. Dimpotrivă, aplicând aceste indicații, a fost posibil să se obțină cea mai gravă situație posibilă, adică un text a cărui scanare ar fi fost foarte dificilă: caractere strâmbe, fonturi diferite, culori ale textului similare cu cele ale fundalului sau dispozitive similare. Broder a susținut că introducerea acestei tehnologii a redus spam-ul cu peste 95%.

Independent de echipa AltaVista, Luis von Ahn și Manuel Blum au dezvoltat și diseminat ideea testului CAPTCHA în 2000 , adică orice tip de program care era capabil să facă distincția între oameni și computere. Au inventat diferite tipuri de teste, inclusiv primul care a primit o difuzare largă datorită utilizării de către Yahoo!

Aplicații

CAPTCHA-urile sunt utilizate pentru a împiedica roboții să utilizeze anumite servicii, cum ar fi forumurile , înregistrarea pe site-uri web , scrierea de comentarii și, în general, orice lucru care ar putea fi utilizat pentru a crea spam sau pentru a încălca securitatea cu operațiuni de piratare , cum ar fi forța brută . Acest tip de test a fost, de asemenea, utilizat pentru a combate spamul generat de bot, forțând expeditorul unui mesaj de e-mail necunoscut de destinatar să treacă un test CAPTCHA înainte de a permite livrarea mesajului.

Caracteristici

Prin definiție, testele CAPTCHA sunt complet automate și nu necesită în mod normal intervenția umană pentru administrare sau întreținere, cu avantaje fără îndoială în ceea ce privește costurile și fiabilitatea.

Algoritmii utilizați pentru efectuarea testelor sunt adesea dezvăluite publicului, deși în multe cazuri sunt protejați prin brevete. Această politică de transparență vizează demonstrarea faptului că siguranța metodei nu constă în cunoașterea unui algoritm secret (care ar putea fi obținut cu tehnici de inginerie inversă sau în mod fraudulos); dimpotrivă, pentru a „sparge” algoritmul, este necesar să se rezolve o problemă clasificată ca „dură” în domeniul inteligenței artificiale .

Nu este obligatorie utilizarea tehnicilor vizuale: orice problemă de inteligență artificială care are același grad de complexitate, cum ar fi recunoașterea vorbirii , este potrivită pentru a servi drept bază pentru un test de acest tip. Unele implementări permit utilizatorului să aleagă alternativ un test bazat pe tehnici auditive, chiar dacă această abordare a suferit o dezvoltare mai lentă și nu este neapărat la fel de eficientă ca cea vizuală. În plus, este posibil să recurgeți la alte tipuri de teste care necesită o activitate de înțelegere a textului, cum ar fi răspunsul la o întrebare sau la un test logic, urmând instrucțiuni specifice pentru a crea o parolă etc. De asemenea, în acest caz, datele privind rezistența acestor tehnici la contramăsuri sunt rare.

O tehnică promițătoare care s-a dezvoltat în ultimii ani folosește teste bazate pe recunoașterea unei fețe într-o imagine familiară. Pentru acest tip de CAPTCHA vorbim de RTT bazat pe recunoașterea fețelor . În literatura de specialitate, în prezent, au fost implementate doar două metode bazate pe acest tip de CAPTCHA : ARTiFACIAL [1] și un CAPTCHA bazat pe recunoașterea facială . [2] [3]

Accesibilitate

Utilizarea testelor CAPTCHA bazate pe citirea textelor sau a altor activități legate de percepția vizuală împiedică sau limitează sever accesul la resursele protejate pentru utilizatorii cu probleme de vedere și, deoarece aceste teste sunt concepute special pentru a nu putea fi citite de instrumentele automate, tehnologia normală ajutoarele utilizate de utilizatorii nevăzători sau cu deficiențe de vedere nu pot să le interpreteze; dar chiar și utilizatorii daltonici pot să nu poată trece testul. Utilizarea testelor CAPTCHA , legate în general de fazele inițiale de acces sau înregistrare pe site-uri și uneori repetate pentru fiecare acces, poate constitui o discriminare împotriva acestor utilizatori cu dizabilități, astfel încât, în unele jurisdicții, constituie o încălcare a legii.

În noile generații de CAPTCHA , create pentru a rezista celor mai sofisticate programe de recunoaștere a textului, poate deveni destul de complicat, dacă nu chiar imposibil, să poți recunoaște textul de către mulți utilizatori, chiar și în deplină posesie a capacității lor vizuale.

W3C a realizat un raport care subliniază unele dintre problemele de accesibilitate asociate cu utilizarea acestor tehnici. [4]

Contramăsuri

După utilizarea masivă a CAPTCHA , au fost descoperite unele contramăsuri care permit spammerilor să treacă testele.

Software-ul inteligent este acum capabil să rezolve CAPTCHA-uri de diferite tipuri. [5]

Greg Mori și Jitendra Malik au prezentat în 2003 un studiu [6] care ilustrează cum să ocolească unul dintre cele mai populare sisteme pentru efectuarea testelor CAPTCHA , EZ-Gimpy; această abordare sa dovedit a fi eficientă în 92% din cazuri. Comparativ cu sistemul Gimpy mai sofisticat, dar mai puțin răspândit, eficacitatea metodei scade la 33%. În prezent, însă, nu se știe dacă acest algoritm a fost implementat în afara contextului cercetării.

Unele programe au fost, de asemenea, create pentru a căuta o soluție în mod repetat și altele pentru a recunoaște caracterele scrise, folosind tehnici speciale și nu cele standard ale OCR . Proiecte precum PWNtcha [7] au făcut pași mari, contribuind la migrația generală către CAPTCHA care este din ce în ce mai dificilă.

O altă modalitate de a trece un CAPTCHA este de a profita de sesiunile în care testul a trecut deja, salvând testele și apoi creând o arhivă de soluții.

Dar cea mai eficientă metodă este de a folosi un om pentru a rezolva CAPTCHA : este de fapt posibil să încredințezi persoanelor plătite sarcina de a rezolva CAPTCHA . Documentul W3C menționat mai sus [4] afirmă că un operator poate rezolva cu ușurință sute de teste CAPTCHA într-o oră.

Această posibilă soluție ar necesita o investiție economică care nu este întotdeauna justificată, dar s-a descoperit o metodă mai ieftină pentru a obține aceleași rezultate: spammerul folosește în acest scop un site de Internet cu un serviciu pe care utilizatorii umani îl solicită. un forum, dar și o colecție de imagini pornografice. Astfel, atunci când un utilizator cere să se conecteze, i se oferă un CAPTCHA obținut de pe site-ul extern pe care spammerul vrea să îl atace: testul este apoi rezolvat de utilizator, care primește în schimb o remunerație care are un cost neglijabil pentru spammer , în timp ce sistemul „reciclează” soluția de testare pentru a depăși bariera țintă.

reCaptcha

Sigla ReCaptcha

Testele CAPTCHA au avut utilizări secundare care nu au legătură doar cu eliminarea spamului: cel mai cunoscut se referă la recunoașterea textelor conținute în cărțile antice și se numește reCaptcha . Multe biblioteci își convertesc digital colecțiile de texte antice (inclusiv manuscrise); această conversie se obține prin digitalizarea paginilor și analiza ulterioară a acestora printr-un program OCR , care analizează imaginile paginilor și extrage textul conținut în acestea. Cu toate acestea, programele OCR întâmpină dificultăți în interpretarea literelor decolorate și a paginilor îngălbenite ale textelor antice și, atunci când sunt incapabile să recunoască un text cu certitudine, necesită intervenția umană, ceea ce încetinește procesul și crește costul digitalizării.

Cercetătorii Universității Carnegie Mellon au decis să utilizeze sistemele CAPTCHA pentru a interpreta cuvintele discutabile identificate de programele OCR. Când două sisteme OCR identifică diferit un cuvânt, acesta este asociat cu un cuvânt cunoscut și trimis unui utilizator care trebuie să treacă un test CAPTCHA pentru a accesa un serviciu. Se presupune că, dacă un utilizator poate găsi corect cuvântul cunoscut, atunci va găsi și cuvântul necunoscut cu o probabilitate mare. Când trei utilizatori dau același răspuns, sistemul stochează cuvântul corect. Acest sistem a permis conversia a 440 de milioane de cuvinte cu o precizie de 99%. Începând din august 2008, acest sistem transforma 4 milioane de cuvinte pe zi. [8] Proiectul a devenit ulterior o companie de start-up care în septembrie 2009 a fost achiziționată de Google , care a început o procedură de scanare a zeci de milioane de cărți stocate în sute de librării din întreaga planetă și intenționează să exploateze proiectul reCaptcha pentru a corecta erorile rezultate din Scanarea OCR a textelor. [9] ReCaptcha poate fi asimilat categoriei de jocuri cu un scop (GWAP) . [ fără sursă ]

CAPTCHA în cultura internetului

Unul dintre fenomenele de internet născut pe 4chan se referă la CAPTCHA . Se referă la un cod în care s-a citit „Inglip Summoned”: a rezultat în falsa legendă că un zeu întunecat, precum Inglip, s-a întors pe pământ pentru al trage în întuneric. Există, de asemenea, mai multe videoclipuri pe YouTube în care Inglip ar da ordine adepților săi, întotdeauna prin coduri CAPTCHA extravagante și adesea de neînțeles. [10]

Notă

  1. ^ Copie arhivată ( PDF ), la research.microsoft.com . Accesat la 14 martie 2010 ( arhivat la 7 ianuarie 2010) .
  2. ^ Descărcări gratuite de Captcha Face Recognition: Luxand FaceSDK by Luxand Development, Luxand Blink! Pro by Luxand Development and More
  3. ^ IEEE Xplore - Pagina abstractă
  4. ^ a b ( EN ) Matt May, Inaccesibilitatea testelor anti-robot orientate vizual , în nota grupului de lucru W3C , 23 noiembrie 2005. Accesat la 12 iulie 2011 ( arhivat la 19 iulie 2011) .
  5. ^ Startupul american creează software pentru a rezolva Captcha folosind inteligența artificială , pe CesarNews . Arhivat din original la 28 octombrie 2013. Accesat la 26 martie 2021 .
  6. ^ (EN) Greg Mori, Jitendra Malik, Recognising Objects In Adversarial Clutter: Breaking a Visual CAPTCHA (PDF) pe cs.sfu.ca. Adus la 12 iulie 2011 ( arhivat la 29 septembrie 2011) .
  7. ^ PWNtcha - Caca Labs , pe sam.zoy.org . Adus la 3 octombrie 2005 ( arhivat la 11 septembrie 2005) .
  8. ^ Textele antice au un viitor „O metodă antispam îi va salva” , pe repubblica.it . Adus la 19 august 2008 ( arhivat la 21 august 2008) .
  9. ^ Google cumpără reCaptcha , pe macitynet.it . Adus la 16 septembrie 2009 ( arhivat la 22 septembrie 2009) .
  10. ^ Inglipedia , în inglipnomicon.wikia.com , 16 septembrie 2009. Accesat la 5 iunie 2011 ( arhivat la 18 iunie 2011) .

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității LCCN (EN) sh2009002990 · GND (DE) 4828986-3 · BNF (FR) cb17001362r (data)
Securitate IT Portal de securitate IT : accesați intrările Wikipedia care se ocupă cu securitatea IT