Eroare 404

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Eroarea 404 sau Not Found (în italiană Not Found ) este un cod de stare standard al protocolului HTTP [1] . Acesta indică faptul că clientul este capabil să comunice cu serverul , dar că serverul nu a găsit ceea ce a fost solicitat sau a fost configurat în așa fel încât să nu poată finaliza solicitarea. Eroarea 404 nu trebuie confundată cu „serverul nu a fost găsit” sau erori similare, unde conexiunea la server nu poate fi deloc stabilită.

Prezentare generală

Atunci când comunică prin HTTP, un server trebuie să răspundă la o solicitare, cum ar fi o cerere de browser web pentru o pagină web, cu un cod de răspuns numeric și un mesaj opțional, necesar sau nepermis (în funcție de codul de stare). În codul 404, prima cifră indică o eroare a clientului, cum ar fi un URL de ortografie greșit Uniform Resource Locator (URL). Următoarele două cifre indică eroarea specifică întâlnită. Utilizarea HTTP a codurilor din trei cifre este similară cu utilizarea acelor coduri în protocoale anterioare, cum ar fi FTP și NNTP. La nivel HTTP, un cod de răspuns 404 este urmat de o „frază motiv” care poate fi citită de om. Specificația HTTP sugerează expresia „Not Found” [2] și multe servere web emit în mod implicit o pagină HTML care include atât codul 404, cât și expresia „Not Found”.

Exemplu pagina 404

O eroare 404 este adesea returnată atunci când paginile au fost mutate sau șterse. În primul caz, cel mai bine este să utilizați maparea URL-ului sau redirecționarea URL-ului prin returnarea unui răspuns 301 Moved Permanently, care poate fi configurat în majoritatea fișierelor de configurare a serverului sau prin rescrierea URL-ului; în acest din urmă caz ​​trebuie returnat un 410 Gone. Deoarece aceste două opțiuni necesită o configurație specială a serverului, majoritatea site-urilor web nu le folosesc.

Erorile 404 nu trebuie confundate cu erorile DNS, care apar atunci când adresa URL furnizată face referire la un nume de server care nu există. O eroare 404 indică faptul că serverul în sine a fost găsit, dar serverul nu a reușit să recupereze pagina solicitată.

Erori soft 404

Unele site-uri web raportează o eroare „nu a fost găsită” prin returnarea unei pagini web standard cu un cod de răspuns „200 OK”, raportând incorect că pagina s-a încărcat cu succes; aceasta este cunoscută sub numele de soft 404 [3] . Termenul „soft 404” a fost introdus în 2004 de Ziv Bar-Yossef și colab. [4] .

Soft 404 sunt problematice pentru metodele automate de a afla dacă un link este defect. Unele motoare de căutare, cum ar fi Yahoo și Google, utilizează procese automate pentru a detecta soft 404s [5] . Acestea pot apărea ca urmare a erorilor de configurare atunci când se utilizează anumite programe de server HTTP, de exemplu cu software-ul Apache HTTP Server , când un document de eroare 404 (specificat într-un fișier .htaccess) este specificat ca o cale absolută (de exemplu [ link rupt ] ) mai degrabă decât o cale relativă (/error.html). [6] Acest lucru se poate face și intenționat pentru a forța unele browsere (cum ar fi Internet Explorer învechit [7] ) să afișeze un mesaj de eroare personalizat 404, mai degrabă decât să înlocuiască ceea ce vine cu un mesaj de eroare "descriptiv" specific browserului (în Internet Explorer , acum învechit, acest comportament a fost declanșat atunci când este oferit un 404 și codul HTML primit este mai scurt decât o anumită lungime și poate fi dezactivat manual de către utilizator).

Există, de asemenea, erori „soft 3XX” în care conținutul este returnat cu o stare de 200 dar provine dintr-o pagină redirecționată, cum ar fi atunci când paginile lipsă sunt redirecționate către pagina principală / rădăcina domeniului.

Server proxy

Unele servere proxy generează o eroare 404 atunci când un cod de eroare de interval 500 ar fi mai corect. Dacă serverul proxy nu este în măsură să furnizeze o cerere pentru o pagină din cauza unei probleme cu gazda la distanță (cum ar fi erorile de rezoluție a numelui de gazdă sau conexiunile TCP refuzate), aceasta ar trebui descrisă ca o eroare internă a serverului 5xx, dar ar putea furniza în schimb un 404 Acest lucru poate confunda programele care așteaptă și acționează asupra unor răspunsuri specifice, deoarece acestea nu mai pot distinge cu ușurință între un server web absent și o pagină web lipsă pe un server web existent.

404 intenționat

În iulie 2004, furnizorul britanic de telecomunicații BT Group a implementat sistemul de blocare a conținutului Cleanfeed, care returnează o eroare 404 la orice cerere de conținut identificată ca fiind potențial ilegală de către Fundația Internet Watch [8] . Alți furnizori de servicii Internet returnează o eroare HTTP 403 „interzisă” în aceleași circumstanțe. [9] Practica utilizării erorilor false 404 ca mijloc de ascundere a cenzurii a fost raportată și în Thailanda [10] și Tunisia [11] . În Tunisia, unde cenzura era severă înainte de revoluția din 2011, oamenii au realizat natura erorilor false 404 și au creat un personaj fictiv numit „Ammar 404” care reprezintă „cenzorul invizibil” [12] .

Coduri de eroare 404 pentru subestarea Microsoft Internet Server

Software-ul web server dezvoltat de Microsoft, Internet Information Services (IIS), returnează o serie de coduri de stare secundare cu cele 404 de răspunsuri. Codurile de stare secundare iau forma numerelor zecimale adăugate la codul de stare 404. Codurile de stare secundare nu sunt recunoscute oficial de IANA și nu sunt returnate de servere care nu sunt Microsoft.

Coduri de stare secundare

Serverul IIS 7.0, IIS 7.5 și IIS 8.0 Microsoft definesc următoarele sub coduri de stare HTTP pentru a indica o cauză mai specifică a unei erori 404:

  • 404.0 - Nu a fost găsit.
  • 404.1 - Site-ul nu a fost găsit.
  • 404.2 - restricție ISAPI sau CGI.
  • 404.3 - restricție de tip MIME.
  • 404.4 - Niciun manager configurat.
  • 404.5 - Refuzat de cererea de configurare a filtrului.
  • 404.6 - Verb refuzat.
  • 404.7 - Extensia de fișier refuzată.
  • 404.8 - Spațiu de nume ascuns.
  • 404.9 - Atribut de fișier ascuns.
  • 404.10 - Cererea antetului este prea lungă.
  • 404.11 - Cererea conține o secvență de evacuare dublă.
  • 404.12 - Cererea conține caractere bit mari.
  • 404.13 - Lungimea conținutului este prea mare.
  • 404.14 - Adresa URL este prea lungă.
  • 404.15 - Șir de interogare prea lung.
  • 404.16 - Cerere DAV trimisă managerului de fișiere statice.
  • 404.17 - Conținut dinamic mapat la managerul de fișiere statice utilizând o mapare MIME cu caractere wildcard.
  • 404.18 - Secvența șirurilor de interogare refuzată.
  • 404.19 - Refuzat de regula de filtrare.
  • 404.20 - Prea multe segmente URL.

Pagini de eroare personalizate

Serverele web pot fi de obicei configurate pentru a afișa o pagină de eroare 404 personalizată, incluzând o descriere mai naturală, branding site-ul părinte și, uneori, un sitemap, un formular de căutare sau un widget de 404 de pagini.

Exemplu de 404 de pagini personalizate

Fraza la nivel de protocol, care este ascunsă de utilizator, este rareori personalizată. Internet Explorer, cu toate acestea, nu a afișat pagini personalizate decât dacă acestea sunt mai mari de 512 octeți, alegând în schimb să afișeze o pagină de eroare „simplă” [13] . O altă problemă este că, dacă pagina nu oferă un favicon și există o pagină personalizată 404 separată, traficul suplimentar și timpii de încărcare mai mari vor fi generați pe fiecare vizualizare de pagină [14] [15] .

Multe organizații folosesc 404 de pagini de eroare ca o oportunitate de a injecta umor în ceea ce altfel ar putea fi un site web serios. De exemplu, Metro UK arată un urs polar pe un skateboard, iar agenția de dezvoltare web Left Logic are un program de desen simplu. [16] În timpul campaniei electorale din 2015 pentru Marea Britanie, partidele politice majore și-au folosit 404 de pagini pentru a viza adversarii politici sau pentru a arăta politicile relevante potențialilor susținători. [17]

În timp ce multe site-uri web trimit informații suplimentare într-un mesaj de eroare 404, cum ar fi un link către o pagină de pornire a site-ului web sau o casetă de căutare, unele încearcă, de asemenea, să găsească pagina web corectă pe care o dorește utilizatorul. În acest scop, sunt disponibile extensii pentru unele sisteme de management al conținutului (CMS) [18] .

Inițiative caritabile

NotFound.org (în colaborare cu Telefono Azzurro , Missing Children Europe , Famous și Amazon ), colectând rapoarte despre copii dispăruți în Uniunea Europeană , a lansat o inițiativă pentru personalizarea și utilizarea solidară a paginii de eroare 404 Prin instalarea unei aplicații, de către integrând un iframe în pagina de eroare 404, acesta afișează un banner cu fotografia și descrierea unui copil dispărut [19] .

Monitorizarea erorilor 404

Există o serie de instrumente care scanează un site web pentru a găsi pagini care returnează coduri de stare 404. Aceste instrumente pot fi utile pentru a găsi link-uri care există într-un anumit site web. Limitarea acestor instrumente constă în faptul că acestea găsesc doar link-uri într-un anumit site web și ignoră 404-urile rezultate din legăturile de pe alte site-uri web. Prin urmare, aceste instrumente pierd 83% din 404-urile de pe site-uri web. [20] O modalitate de a rezolva această problemă este de a găsi erori 404 prin analiza legăturilor externe [21] .

Una dintre cele mai eficiente modalități de a afla despre erorile 404 este de a utiliza Google Search Console, Google Analytics sau software-ul de accesare cu crawlere.

O altă metodă obișnuită este de a monitoriza traficul către 404 de pagini utilizând analiza fișierului jurnal. [22] Acest lucru poate fi util pentru a înțelege mai multe despre ceea ce utilizatorii 404 au realizat pe site. O altă metodă de monitorizare a traficului la 404 de pagini este utilizarea instrumentelor de monitorizare a traficului bazate pe JavaScript [23] .

Notă

  1. ^ (EN) Definiții cod de stare pe w3.org. Adus la 1 februarie 2019 .
  2. ^ 404 , pe tools.ietf.org .
  3. ^ Crawlerul dvs. solicită adrese URL ciudate care nu au existat niciodată pe site-ul meu, cum ar fi /piopio/darkness-halo-bottom-camera.htm. Căutați o gazdă greșită? - Yahoo Help , pe web.archive.org , 15 iulie 2014. Adus 1 februarie 2021 (arhivat din original la 15 iulie 2014) .
  4. ^ Ziv Bar-Yossef, Andrei Z. Broder și Ravi Kumar, Sic transit gloria telae: către o înțelegere a decăderii webului , în Proceedings of the 13th international conference on World Wide Web , Association for Computing Machinery, 17 mai 2004, pp. 328–337, DOI : 10.1145 / 988672.988716 . Adus la 1 februarie 2021 .
  5. ^ Crawlerul dvs. solicită adrese URL ciudate care nu au existat niciodată pe site-ul meu, cum ar fi /piopio/darkness-halo-bottom-camera.htm. Căutați o gazdă greșită? - Yahoo Help , pe web.archive.org , 15 iulie 2014. Adus 1 februarie 2021 (arhivat din original la 15 iulie 2014) .
  6. ^ (RO) Adio la 404 de pe softul oficial al Google Webmaster Central Blog. Adus la 1 februarie 2021 .
  7. ^ Dario d'Elia, Microsoft 365 va abandona Internet Explorer 11 din august 2021 , în Corriere della Sera , 21 august 2020. Adus 1 februarie 2021 .
  8. ^ LINX Public Affairs »Cleanfeed: the facts , pe web.archive.org , 13 mai 2011. Accesat la 1 februarie 2021 (arhivat din original la 13 mai 2011) .
  9. ^ ( RO ) 403 Eroare interzisă: ce este și cum să o remediem , pe Airbrake , 12 octombrie 2017. Adus 1 februarie 2021 .
  10. ^ Thailanda , pe bangkokpost.com .
  11. ^ Jurnalistul tunisian dă în judecată agenția guvernamentală pentru blocarea Facebook, revendică daune pentru utilizarea mesajului de eroare 404 în loc de 403 | Inițiativa OpenNet , pe opennet.net . Adus la 1 februarie 2021 .
  12. ^ (EN) Mișcarea anti-cenzură în Tunisia: creativitate, curaj și speranță! , în Global Voices Advox , 27 mai 2010. Accesat la 1 februarie 2021 .
  13. ^ Pagini de eroare HTTP prietenoase - IEInternals ale lui EricLaw - Pagina principală a site-ului - Bloguri MSDN , la web.archive.org , 2 decembrie 2010. Accesat la 1 februarie 2021 (arhivat din original la 2 decembrie 2010) .
  14. ^ favicon , la thesitewizard.com .
  15. ^ (EN) Eroarea „favicon.ico nu a fost găsită” pe https://internetfolks.com/ . Adus la 1 februarie 2021 .
  16. ^ (RO) De la urși de skateboarding la copii dispăruți: Puterea paginii de eroare 404 , pe Metro, 16 aprilie 2013. Adus la 1 februarie 2021.
  17. ^ (RO) Războiul politic Pagina 404 , în BBC News, 27 aprilie 2015. Adus la 1 februarie 2021.
  18. ^ (RO) Faceți cele 404 de pagini mai utile pe blogul oficial Google Google Webmaster Central. Adus la 1 februarie 2021 .
  19. ^ (EN) Mesajele pentru copii lipsă apar pe 404 de pagini de eroare , în BBC News, 27 septembrie 2012. Adus la 1 februarie 2021.
  20. ^ (RO) Cum să găsiți și să remediați erorile 404 pe site , Matthew Edgar, 4 mai 2019. Accesat la 1 februarie 2021.
  21. ^ O abordare centrată pe date pentru identificarea a 404 de pagini care trebuie salvate , pe motorul de căutare , 2 aprilie 2013. Accesat la 1 februarie 2021 .
  22. ^ 404 , la 404errorpages.com .
  23. ^ (RO) Cum să găsiți și să remediați erorile 404 pe site , Matthew Edgar, 4 mai 2019. Accesat la 1 februarie 2021.

Elemente conexe

Alte proiecte

Internet Portal internet : accesați intrările Wikipedia care se ocupă de internet