Ajutor: Cum să detectați posibile încălcări ale drepturilor de autor
Acesta este un ghid pentru identificarea încălcărilor politicii Wikipedia privind drepturile de autor constând în „copiere și lipire” de pe alte site-uri web.
![]() |
Indicații ale contribuțiilor care ar putea fi rezultatul copierii și lipirii
Există mai multe indicii că o contribuție ar fi putut fi introdusă în enciclopedie printr-o operație de „ copiere și lipire ”. Niciunul dintre acestea nu constituie în mod evident dovezi copleșitoare, dar dacă mai multe dintre aceste indicii apar în același timp, este rezonabil să ne îndoim de autenticitatea intervenției. În cele din urmă, trebuie acordată o atenție specială intrărilor utilizatorilor cu precedente, mai ales dacă acestea au fost reiterate de mai multe ori.
- Semne de avertizare (dar poate contribuția este nevinovată) [1]
- intrări non- wikified (titluri care nu sunt în conformitate cu standardele Mediawiki, lipsă de wikilink și așa mai departe) sau, dacă există, au legături excesive, cu fiecare apariție a unui cuvânt sau frază convertită într-un wikilink (ca și cum ar fi fost folosit „găsiți și înlocuiți” pentru a insera linkuri)
- intrări de text masive într-o perioadă scurtă de timp
- ar putea fi lipsa unor modificări minore, cum ar fi corecțiile de greșeală
- stilul de scriere și completitudinea textului: dacă „prea bine pentru a fi adevărat”, sau excesiv de accentuat, ar putea proveni din surse specializate sau din bloguri și altele asemenea
- Arta ASCII nu apare corect când este copiată
- Puternic indicativ al unei apariții de „copiere și lipire”
- Cod HTML care nu este valid sau utilizat în mod obișnuit în Wikipedia, cum ar fi
HEAD
,BODY
,TITLE
și eticheteHTML
. Aceasta sugerează o încercare de copiere și lipire din sursa unei pagini HTML, mai degrabă decât din pagina afișată - expresii revelatoare precum „această broșură” sau „imaginea din dreapta” (care nu există)
- cuvinte sau expresii izolate sau în afara contextului, cum ar fi sus , mergeți sus, pagina următoare , faceți clic aici , care au făcut inițial parte din structura de navigare a site-ului web sursă
- referințe false, cum ar fi „vezi figura 1.4”, sau citarea bibliografică precum „Smith, J. (2001)”
- caractere care nu sunt prezente pe tastatură, cum ar fi cotele inteligente Microsoft (""); în acest caz, este necesar să fim atenți, deoarece textul ar fi putut fi scris de către cei care l-au introdus prin programe de scriere video precum Microsoft Word sau, pentru unele caractere precum (ʿʾ) și («»), folosind lista de caractere prezente în modul de editare sub avertismentul care poate fi inserat făcând clic cu butonul stâng al mouse-ului.
- personaje cu drepturi de autor (™, ®) și altele asemenea, semne tipice ale textelor comerciale
- stil de scriere similar cu cel al reclamelor sau al agențiilor de știri
- Încălcarea sigură a drepturilor de autor
Unele pagini copiate conțin chiar notificarea privind drepturile de autor a site-ului original. Copiat intact! În acest caz, puteți presupune că sunt aproape sigur încălcări ale drepturilor de autor, cu excepția cazului în care contribuitorul este de fapt titularul drepturilor de autor, caz în care sarcina probei revine contribuitorului, care trebuie să demonstreze că este acea persoană (sau să aibă dreptul de a transfera drepturi care nu sunt inițial ale sale). Vedeți cum să dați material Wikipedia .
Verificați motoarele de căutare
Când unul sau mai multe dintre aceste semne vă alarmează, copiați o propoziție a textului și căutați-l într-un motor de căutare, cum ar fi:
- Google ( http://www.google.com )
- Bing ( http://www.bing.com )
- Google Books ( http://books.google.it/ ), pentru suspiciuni asupra textelor pe hârtie
Alegeți o propoziție despre care credeți că ar fi putut fi modificată cu greu: unii, de fapt, prevăzând acest tip de control, modifică unele puncte ale fiecărei propoziții, gândindu-se să împiedice recunoașterea plagiatului. Atenție: mici modificări și / sau modificări în ordinea de scriere a paragrafelor nu fac ca încălcarea drepturilor de autor să dispară, deci dacă diferențele dintre texte sunt limitate la câteva cuvinte, articole, punctuație, încălcarea există în continuare.
Când rezultatele sunt multe, încercați să restrângeți căutarea punând textul căutat între ghilimele (""): motorul de căutare se va limita la raportarea numai a cazurilor în care șirul de căutare este prezentat așa cum a fost introdus, în același succesiune de cuvinte. Dacă nu obțineți rezultate în acest fel, poate doriți să modificați șirul de căutare, de exemplu prin reducerea lungimii acestuia sau prin împărțirea acestuia în mai multe părți.
În principalele motoare este posibil să adăugați șirul -wikipedia la textul căutat pentru a exclude Wikipedia în sine și site-urile care o clonează din căutare.
Nu uitați să căutați și mai ales printre paginile duplicate, pe care unele motoare de căutare le omit implicit pentru a simplifica rezultatele. În cazul Google, faceți clic pe repetați căutarea, inclusiv rezultatele omise, dacă apare la sfârșitul rezultatelor.
Utilizatorii unor browsere web precum Firefox pot găsi câteva extensii utile care permit accelerarea căutării pe Google pornind de la simpla selecție a textului; [2] din versiunea 3.0, trebuie doar să selectați o frază și să acționați pe aceasta prin Ctrl+Tasto sinistro del mouse
pentru a începe căutarea acelui șir. O funcționalitate similară este, de asemenea, prezentă nativ în Internet Explorer 7 . În browsere precum Google Chrome este prezentă o funcție similară, în care trebuie să apăsați butonul drept al mouse-ului (sau tasta tab a tastaturii) după selectarea textului și selectați „căutare” <text selectat> „pe Google”, unde <text selectat> este textul selectat, iar Google poate fi modificat de obicei din setări.
Rețineți că uneori textele sunt preluate din documente în formate non-HTML, de exemplu fișiere de tipurile .pdf, .rtf, .doc, .xls (și altele); pentru majoritatea dintre ele Google permite citirea directă a acestor documente în HTML făcând clic pe „cache” (funcție care evidențiază și cuvintele căutate cu culoare), dar uneori va fi necesar să deschideți fișierul în formatul original (după verificarea virusului:). Dacă rezultatul este pozitiv, adică dacă ați găsit de unde a fost copiat textul în cauză, copiați adresa web a documentului pentru raportare, nu adresa paginii cache Google.
Rețineți, de asemenea, că dacă pe site-ul unde găsiți textul nu există indicații de drepturi, trebuie să presupunem că textul este acoperit de drepturi de autor ; lipsa simbolului ©, absența notificărilor privind drepturile de autor, nu sunt de fapt nicio indicație a renunțării la drepturi de către proprietarul legitim (drepturile de autor sunt încă în așteptare chiar și în absența unor specificații). Singurul caz în care este permisă obținerea textului respectiv în Wikipedia este atunci când citiți în mod expres că textul este eliberat în domeniul public , sau sub licența GFDL sau în categoriile admise din Creative Commons . Folosiți-vă de bunul simț pentru a vă întreba de fiecare dată dacă oricine lansează textul cu drepturi de interes al nostru este cu adevărat proprietarul (în general este, dar nu întotdeauna; totuși, nu inițiați o investigație, ci încercați să înțelegeți fiabilitatea indicațiilor oferite de proprietarul site-ului sau de webmaster).
Pentru mai multă precizie, repetați căutarea și în grupurile de știri ( Usenet ).
Cine copiază cine?
Când se descoperă că textul de pe Wikipedia este identic cu un text găsit pe o pagină web, poate apărea întrebarea: care dintre cele două a copiat? În primul rând, consultați pagina Wikipedia: Clone , care listează site-urile care copiază în mod sistematic Wikipedia, integral sau parțial. De asemenea, uitați-vă la istoricul intrării Wikipedia în cauză: așa cum am menționat mai sus, dacă intrarea crește treptat, cu mai mulți utilizatori care contribuie, aproape sigur a fost celălalt site web care a copiat, nu Wikipedia (un indicator clasic este prezența pe site-ul extern de mici ajustări făcute la intrarea Wikipedia numai după prima sa versiune): în acest caz, veți fi confruntați cu așa-numitul copiol invers .
În Firefox există o fereastră „Informații pagină” (accesibilă din meniul „Instrumente” sau „Instrumente”) care indică, printre altele, data ultimei modificări a unei pagini web. Poate fi util, dar rețineți că:
- Este posibil ca data ultimei modificări să nu coincidă cu data creării paginii web.
- Site-urile web cu conținut dinamic , precum cele bazate pe MediaWiki , pagina este „construită” de server în momentul accesării, astfel încât data afișată de „Informații pagină” este întotdeauna data de astăzi, deci ar trebui ignorată.
În caz de îndoială, un instrument util este Wayback Machine , un serviciu furnizat de site-ul Internet Archive , accesibil la http://web.archive.org . La fel ca un motor de căutare, explorează periodic internetul urmând linkuri între pagini, dar spre deosebire de motoarele de căutare normale, salvează mai multe versiuni ale aceleiași pagini web în arhiva sa. Având în vedere adresa URL a oricărei pagini web, aceasta prezintă un fel de „pseudo-cronologie” a versiunilor salvate. Poate fi decisiv să risipim îndoiala „Cine copiază pe cine”, dar limitele sale trebuie luate în considerare:
- În prezent (2009) nu are un motor de căutare intern: de aceea nu este posibil să căutați în mod liber text, dar este necesar să cunoașteți cu precizie adresa URL a paginii pentru care urmează să se obțină pseudo-cronologia. Prin urmare, nu exclude utilizarea motoarelor de căutare normale.
- În 2019, pentru a căuta un site arhivat, trebuie să selectați „Căutați site-uri web arhivate” sub linie pentru a introduce textul de căutat (apare când selectați linia pentru a introduce textul, dar pe dispozitivele portabile nu funcționează corect) .
- Dacă o pagină web a fost redenumită sau mutată de pe un site pe altul (de exemplu, deoarece proprietarul a schimbat furnizorul), nu o poate urmări.
- Nu arhivează site-urile care i-au refuzat accesul prin intermediul robots.txt .
- Explorează internetul la intervale mai lungi decât cele ale unui motor de căutare, poate dura câteva luni până când apare o pagină web acolo (dacă o pagină web nu apare în Arhiva Internetului, se poate datora faptului că este foarte recentă, dar ar putea se încadrează în problema din punctul anterior, o pagină care a schimbat serverele sau care refuză accesul prin robots.txt ), alte pagini, pe de altă parte, au mai multe versiuni arhivate în aceeași zi. De asemenea, nu va reuși să „capteze” orice modificări aduse paginii web, cu siguranță nu cu granularitatea istoriei Wikipedia cu care suntem obișnuiți. De exemplu, comparați cronologia intrării în limba latină cu pseudo-cronologia corespunzătoare oferită de Archive . Rețineți că intrarea este creată la 26 februarie 2004 și postată în Arhiva Internet doar la 28 iunie 2004, pe de altă parte, în noiembrie 2015 au existat trei modificări la 1 noiembrie, 2 modificări la 6, 2 modificări la 21 , 1 modificări la 23, 2 modificări la 26 și 1 modificări la 29, dar web.archive.org a detectat 2 modificări („instantanee”) într-o singură dată pe 3 noiembrie (nu arhivate), 20 de modificări la 7 momente diferite pe 5 noiembrie (din care doar una este arhivată), 6 modificări în 3 ori pe 6 noiembrie (din care doar una este arhivată) și o schimbare pe 26 noiembrie (arhivată).
Imagini
Când vine vorba de imagini, rețineți că uneori cei care încarcă o imagine „preluată” de pe alte site-uri pe Wikipedia o fac fără să-și schimbe numele, ceea ce face ca încălcarea să fie ușor identificabilă prin utilizarea secțiunilor de căutare a imaginilor din motoarele de căutare, cu numele fișierului (de exemplu, dacă imaginea se numește „Imagine: Exemplu.jpg”, introduceți „Exemplu.jpg”, fără ghilimele, în caseta de căutare. Dacă imaginea a fost încărcată cu un nume diferit, astfel de instrumente sunt în mod egal adesea util, căutând după cuvinte cheie în funcție de subiectul imaginii.
Pentru a urmări sursa unei imagini suspecte, motorul de căutare http://tineye.com poate fi util. Adesea, poate chiar să afle dacă o anumită imagine a fost decupată dintr-una mai mare (dar nu va da rezultate dacă și imaginea a fost modificată digital). Recent (2011), Google a introdus și un sistem de căutare a imaginilor bazat pe similaritate.
Dacă se descoperă o încălcare
Dacă există dovezi de identitate între textul (sau o imagine) prezent într-o intrare Wikipedia și echivalentul găsit pe net, nu este necesar să apelați poliția de fiecare dată pentru a le cere să investigheze incidentul. Problema cu cea mai mare urgență directă este încetarea situației neregulate de pe paginile noastre.
Cel mai important element este adresa ( URL ) a paginii web sau a imaginii căreia am descoperit „clonarea” sau orice date utile pentru a permite urmărirea sursei originale. Avem Wikipediști specializați în analiza și soluționarea situațiilor de acest fel, așa că, dacă nu doriți să procedați singur sau vă este frică să nu faceți anumite inexactități, vă rugăm să le contactați în liniște folosind paginile de servicii dedicate (consultați linkurile din partea de sus a acestui pagină), încercând să furnizați cu exactitate toate elementele pe care le-ați obținut din verificare.
Lucruri mici de reținut
- Nu mușcați noii veniți : mulți dintre cei care s-au gândit să contribuie la Wikipedia cu o „copiere-lipire” rapidă, nu știu bine că au comis o neregulă foarte gravă. Aceștia sunt adesea utilizatori nou-veniți, cu puțină practică a legilor drepturilor de autor (care sunt încă greu de găsit, citit și interpretat pentru persoana obișnuită) și puțină practică a proiectului nostru. Dintre acestea, s-a întâmplat să descoperim, unii care erau, de asemenea, savanți pasionați și foarte învățați (nu prin lege, totuși ...). Nimic din toate acestea nu ameliorează gravitatea încălcării drepturilor de autor, dar nu trebuie să presupunem la prima vedere că fapta este un indiciu al unei daune voite. Prin urmare, solicitați imediat autorului contribuțiilor clarificări pe pagina sa de discuție, dacă este un utilizator înregistrat. Dacă autorul este de bună credință (ceea ce se întâmplă mai des decât crezi), explicarea modului de a contribui va fi cu siguranță mai utilă decât urmărirea lui.
- Uneori veți întâlni alarme false : de exemplu, dacă contribuitorul este autorul textului respectiv sau al acelei imagini, este posibil să găsiți acel text sau imagine și în altă parte, poate cu un alt tip de licență. De fapt, nimic nu împiedică autorul (caz tipic) să-și gestioneze propriul site personal sub rezerva drepturilor (și cu simbolul ©) și în același timp să decidă să-și vândă lucrările către Wikipedia cu licențele necesare, GFDL și CC BY - SA ; în acest caz, el trebuie să ne dea permisiunea prin e-mail, dar textul său în altă parte nu este o problemă. Un alt caz deloc neobișnuit este acela în care se găsește material aparent eliberat cu licențe incompatibile cu Wikipedia, dar în realitate născut și creat cu licențe originale gratuite, de exemplu în domeniul public: în multe cazuri este vorba de abuzuri sau atribuții inexacte ale drepturilor (de exemplu, drepturile depind de grafica și aspectul site-ului, dar nu de text). Verificați întotdeauna cu atenție. Dacă aflați că aveți de-a face cu o alarmă falsă, vă rugăm să lăsați o notă proeminentă pe pagina de discuție a articolului cât mai curând posibil.
Notă
- ^ Un utilizator poate introduce o intrare "dintr-o singură lovitură în formă completă" nu pentru că a copiat-o, ci pentru că a lucrat mult în sandbox și stilul poate fi "prea bun pentru a fi adevărat" ... deoarece utilizatorul în cauză este foarte bun. Chiar și ceea ce pare a fi un utilizator nou poate fi deja versat în cum să compileze intrări, de exemplu, dacă provine din alte proiecte Wikimedia .
- ^ Toate extensiile . Iată câteva dedicate în mod explicit căutării textului selectat, nu numai pe Google: Define , RCSearch , SlimSearch , Research Word .