Metaetichetă

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Meta tag - uri, sau tag - uri meta, sunt metadate care pot fi utilizate în HTML pentru a transmite informații suplimentare referitoare la pagina web pe care le utilizări. În general, acestea sunt analizate și utilizate prin intermediul sistemelor automate (cum ar fi browsere sau motoare de căutare ), care le pot procesa pentru a oferi servicii sau funcționalități specifice.

Spre deosebire de multe alte etichete , metaetichetele nu furnizează browserului informații strict legate de formatarea paginii, care nu afectează aspectul grafic. Cu excepția cazului în care sunt procesate special, acestea sunt, în general, invizibile pentru utilizator, cu excepția afișării codului sursă al paginii sau prin ferestrele de proprietăți ale browserului.

Metaetichetele, care nu sunt codificate formal, pot fi utilizate la discreția webmasterului în funcție de nevoile lor. Singurele elemente cerute de gramatica formală sunt utilizarea unui atribut „nume” și a unui atribut „conținut”.

Origine

Nașterea metaetichetelor se datorează inițial necesității de a oferi suport motoarelor de căutare pentru indexarea corectă a site-urilor și paginilor, când încă nu existau algoritmi avansați capabili să analizeze textul paginii și pe baza unor variabile mai complexe.

Din motive de putere de calcul și memorie, de fapt, crawlerele utilizate de motoarele de căutare s-au limitat la colectarea și analizarea primelor șiruri de text ale paginii. Din acest motiv, webmasterii au inserat etichete în antetele paginii destinate în mod special să conțină metadate care să rezume întregul conținut al paginii. Totuși, acest ajutor oferit de webmasteri a lăsat spațiu suficient pentru comportamente oportuniste menite să devieze funcționarea corectă a motorului de căutare, în încercarea de a apărea într-un număr mai mare de căutări. Acest lucru a fost posibil prin inserarea în metadate a informațiilor care nu sunt pertinente pentru conținutul paginii, dar legate de alte subiecte de interes căutate de utilizatori.

Cu toate acestea, în curând, depășirea limitărilor tehnice și rafinarea algoritmilor din ce în ce mai sofisticați au făcut posibilă eludarea utilizării necorespunzătoare a metaetichetelor, orientând analiza paginilor de pe texte, asupra conținutului, asupra numărului de linkuri care intră site-ul., numărul de clicuri primite și numeroase alte variabile.

Acest lucru a condus la depășirea metaetichetelor printre elementele utile pentru poziționare , deși legenda urbană nu a dispărut încă conform căreia pot aduce contribuții semnificative în rezultatele motoarelor de căutare. [1] . Metaeticheta „cuvinte cheie”, de exemplu, se numără printre cele care nu sunt recunoscute oficial de Google [2], care analizează altele în scopuri tehnice care nu au legătură cu poziția de pe paginile cu rezultate.

Structura

Structura metaetichetelor este relativ simplă și flexibilă, cu doar două atribute :

 < meta name = " property " content = " value " />
  • atributul nume indică tipul de informații conținute în etichetă
  • atributul de conținut , pe de altă parte, este conținutul informațiilor

Prin urmare, primele sunt amintite de un cuvânt specific, în timp ce acestea din urmă sunt variabile și contextuale pentru site-ul sau pagina la care se referă. Atributul nume poate fi ales și într-un mod variabil, dar numai cele mai frecvente sunt recunoscute de sistemele de analiză standardizate.

Există, de asemenea, un atribut, numit http-equiv , care, împreună cu atributul de conținut, oferă browserului anteturi http. Câteva exemple sunt:

 < meta http-equiv = " refresh " content = " 5 " />
< meta http-equiv = " Content-Type " content = " text / html; charset = iso-8859-1 " />

Care, respectiv, reîmprospătează pagina la fiecare 5 secunde și oferă informații browserului despre conținutul și codificarea paginii.

O metaetichetă nu este specificată pentru a indica data la care pagina a fost creată și ultima actualizare.

Metadate pentru motoarele de căutare

Descriere

Metadatele description sunt destinate să conțină o scurtă descriere a conținutului paginii. Poate fi folosit, la discreția motorului de căutare, ca text rezumat pe pagina de rezultate. Spre deosebire de primele zile ale internetului, acesta nu are niciun efect asupra clasamentului. [3] .

Cuvinte cheie

Metadatele keywords fost destinate să conțină o serie de cuvinte cheie reprezentative pentru conținutul paginii, adresate în principal motoarelor de căutare pentru identificarea subiectului. Abuzul acestor etichete a decretat sfârșitul utilizării lor. Motorul principal de căutare, Google, nu îl listează printre etichetele recunoscute. [2] Cu toate acestea, este de părere că motoarele de căutare analizează în continuare această etichetă într-un mod subordonat pentru a verifica cuvintele înșelătoare care nu sunt prezente în textul paginii, penalizând astfel un comportament incorect.

Prin urmare, content atributului de content este o listă de cuvinte. Nu există opinii unanime cu privire la modul în care acești termeni ar trebui separați, de exemplu cu virgule sau spații. Nu toate motoarele consideră virgulele ca separatoare, din acest motiv este adesea adoptată soluția utilizării unei virgule urmată de un spațiu.

Roboți

Eticheta meta- robots se adresează exclusiv păianjenilor , oferind două tipuri distincte de directive: dacă indexați pagina sau nu, sau dacă urmăriți sau nu linkurile din pagina în cauză către alte persoane; prin urmare, atributul de conținut conține anumite variabile:

index
pentru a indica faptul că pagina poate fi indexată .
noindex
pentru a indica în schimb să nu indexați pagina.

Cele două tipuri de directive pot fi combinate în mod liber în funcție de nevoile webmasterului:

 ... content = " index , follow " 

dispoziția este irelevantă, dar nu poate conține indicații contradictorii. Dacă metaeticheta „roboți” nu este inserată, păianjenii acționează în mod implicit ca și cum ar fi indicat indexul și urmărirea , a căror combinație poate fi indicată și cu valoarea all , la fel cum niciuna nu deselectează ambele posibilități. [4]

Depinde de motorul de căutare să urmeze aceste indicații, [4] deși netiqueta o prevede.

La aceste etichete inițiale se adaugă:

urma
pentru a indica urmarea linkurilor către alte pagini legate;
nofollow
pentru a indica să nu urmăriți paginile legate;
nosnippet
pentru a indica să nu se afișeze fragmente în rezultatele căutării;
noarhiv
pentru a indica să nu salvați o copie a paginii în memoria cache a motorului.
la tine acasa
pentru a indica să nu indexați o pagină de la o anumită dată. Indicii anteriori nu sunt șterse și nu există metaetichetă disponibilă pentru a seta o dată de la care pagina nu mai este vizibilă în rezultatele motorului și / sau în memoria cache.

Atribute suplimentare pentru motoarele de căutare

NOODP

Motoare de căutare Google, Yahoo! și MSN folosesc uneori titlul și rezumatul listei DMOZ a unui site web (denumit și Open Directory Project) pentru titlu și / sau descriere (numită și fragment sau rezumat) în paginile cu rezultatele motorului de căutare (SERP). Pentru a oferi webmasterilor posibilitatea de a specifica că conținutul proiectului Open Directory nu ar trebui să fie utilizat pentru listarea site-urilor lor, Microsoft a introdus în mai 2006 noua valoare NOODP „„ pentru elementul robots „„ al metatagurilor. Google a urmat în iulie 2006 [5] și Yahoo! în octombrie 2006 [6] .

Sintaxa este aceeași pentru toate motoarele de căutare care acceptă eticheta.

 <meta name = "robots" content = "noodp">

Webmasterii pot decide dacă doresc să interzică utilizarea listei lor ODP pe baza motorului de căutare

Google :

 <meta name = "googlebot" content = "noodp">

Yahoo!

 <meta name = "Slurp" content = "noodp">

MSN și Live Search (prin bingbot, anterior msnbot):

<meta name = "bingbot" content = "noodp">

NOYDIR

Yahoo! postează conținut din Yahoo! director de lângă lista ODP. În 2007 au introdus o metaetichetă care permite designerilor web să renunțe [7] .

Adăugarea etichetei NOYDIR la o pagină va împiedica Yahoo! de pe Yahoo! Titluri de directoare și rezumate.

 <meta name = "robots" content = "noydir"> 
<meta name = "Slurp" content = "noydir">
Roboți-Fără conținut

Yahoo! De asemenea, a fost introdus în mai 2007, valoarea atributului: class="robots-nocontent" . [8] Acesta nu este un metaetichet, ci un atribut și o valoare, care pot fi utilizate în etichetele de pagină web acolo unde este necesar. Conținutul paginii în care este utilizat acest atribut va fi ignorat de Yahoo! crawler și neincluse în indexul motorului de căutare.

Exemple de utilizare a etichetei robots-nocontent :

 <div class = "robots-nocontent"> conținut exclus </ div> 
<span class = "robots-nocontent"> conținut exclus </ span> 
<p class = "robots-nocontent"> conținut exclus </ p>

language

Atributul de language spune motoarelor de căutare în ce limbă naturală este scris site-ul web (de exemplu, engleză, spaniolă sau franceză), spre deosebire de limbajul de codare (de exemplu, HTML). În mod normal, este o etichetă de limbă IETF pentru numele limbii. Este deosebit de util atunci când un site web este scris în mai multe limbi și poate fi inclus pe fiecare pagină pentru a indica motoarelor de căutare în ce limbă este scrisă o anumită pagină [9] . Utilizatorul poate (și face) să folosească informațiile despre limbă pentru a selecta caracterele corespunzătoare limbii, ceea ce îmbunătățește experiența generală a utilizatorului paginii [10] .

 < link rel = "alternate" hreflang = "ro-US" href = "http://example.com/page.html"

Exemplu de limbă

en

fr

be

Exemplu de limbă și regiune

fr-CA

en-CA

en-US

Variații ale scripturilor lingvistice

Variațiile scriptului de limbă pot fi abordate direct folosind ISO 15924.

Exemple

zh-Hant: Chinese (Traditional)

zh-Hans: Chinese (Simplified)

Meta reîmprospătare

Meta refresh este o metodă de instruire a unui browser web să actualizeze automat pagina web sau cadrul curent după un anumit interval de timp, utilizând un element HTML cu parametrul setat la „” și un parametru care oferă intervalul de timp în secunde. De asemenea, puteți instrui browserul să recupereze o adresă URL diferită atunci când pagina este actualizată, incluzând adresa URL alternativă în parametru. Prin setarea intervalului de timp de reîmprospătare la zero (sau o valoare foarte mică), reîmprospătarea meta poate fi utilizată ca metodă de redirecționare URL. metahttp-equivrefreshcontentcontent.

Exemplu:

 < meta http-equiv = "refresh" content = "0; url = https: //example.com/" >
Dezavantaje

Etichetele de reîmprospătare au unele dezavantaje:

  • Dacă o pagină este redirecționată prea repede (mai puțin de 2-3 secunde), utilizarea butonului „Înapoi” de pe pagina următoare poate face ca unele browsere să revină la pagina de redirecționare, după care redirecționarea va avea loc din nou. Acest lucru este rău pentru utilizare, deoarece poate cauza blocarea jucătorului pe ultimul site web.
  • Un cititor poate dori sau nu să fie redirecționat către o altă pagină, ceea ce poate duce la nemulțumirea utilizatorilor sau poate ridica probleme de securitate [11] .
Alternative

Redirecționare:

 < body onload = "window.location = 'http://example.com/'" > 

<! - conținut -> 

</ Corp>

Actualizări:

 Pagina <A href = "javascript: location.reload (true)""> Actualizați </ a>

Cache-Control

Definește un timp de expirare pentru informațiile HTML încărcate [12] :

 < meta http-equiv = "expires" content = "expiration time in seconds" />
 < meta http-equiv = "expires" content = "0" />

< meta http-equiv = "expires" content = "43200" />
 < meta http-equiv = "expires" content = "Sâmbătă, 07 februarie 2016 00:00:00 GMT" />

Alte metaetichete

Metaetichetele pot fi utilizate la discreția webmasterului pentru propria utilizare. Singurul element necesar pentru gramatica formală este utilizarea unui atribut „nume” și a unui atribut „conținut”.

Alte metaetichete populare includ [13] :

  • „autor”, pentru a indica autorul paginii
  • „generator”, pentru a indica sistemul care a generat pagina.
  • „drept de autor”, pentru a indica proprietarul site-ului
  • „viewport”, pentru a indica dispozitivul
  • "set de caractere", specifică codificarea caracterelor
 < meta name = "author" content = "autor name" />
< meta name = "copyright" content = "proprietar de site" />
< meta charset = "UTF-8" >
< meta name = "author" content = "John Doe" >
< meta name = "viewport" content = "width = device-width, initial-scale = 1.0" >

Studii academice

Google nu folosește cuvinte cheie HTML sau elemente de metaetichetă pentru indexare. Directorul de căutare Google, Monika Henzinger, a fost citat (în 2002) spunând: „În prezent nu avem încredere în metadate pentru că ne este teamă să fim manipulați”. [14] Alte motoare de căutare au dezvoltat tehnici pentru a penaliza site-urile web considerate „fraude de sistem”. De exemplu, un site web care repetă același cuvânt cheie meta de mai multe ori ar putea experimenta o scădere a clasamentului de la un motor de căutare care încearcă să elimine această practică, deși acest lucru este puțin probabil. Este mai probabil ca un motor de căutare să ignore în totalitate meta-elementul cuvânt cheie și majoritatea o fac indiferent de numărul de cuvinte utilizate în element.

Cu toate acestea, Google folosește elemente de metaetichetă pentru a afișa linkuri către site. Etichetele de titlu sunt utilizate pentru a lega în rezultatele căutării:

 <titlu> Numele site-ului - Titlul paginii - Descrierea cuvântului cheie </ title>

Meta descrierea apare adesea în rezultatele căutării Google pentru a descrie linkul:

 <meta name = "description" content = "Aici este afișat un text pentru a descrie conținutul paginii">

În plus, pornirea căutării corporative Swiftype consideră metaetichetele ca un mecanism de semnalizare a relevanței motorului de căutare a site-ului său web, introducând și propria extensie numită Metaeticheta 2 [15] .

Redirecționări

Elementele de reîmprospătare pot fi folosite pentru a instrui un browser web să reîmprospăteze automat o pagină web după o anumită perioadă de timp. De asemenea, este posibil să specificați o adresă URL alternativă și să utilizați această tehnică pentru a redirecționa utilizatorul către o altă locație [16] . Actualizarea automată prin intermediul unui element META a fost depreciată de mai bine de zece ani [17] și recunoscută anterior ca fiind problematică [18] .

W3C sugerează că agenții utilizator ar trebui să le permită utilizatorilor să îl dezactiveze, altfel actualizarea META nu ar trebui utilizată de paginile web. Pentru setările de securitate Internet Explorer (acum învechite în favoarea Microsoft Edge ), în categoria „Diverse”, reîmprospătarea meta poate fi dezactivată de utilizator, dezactivând astfel capacitatea de redirecționare. În Mozilla Firefox poate fi dezactivat în fișierul de configurare cu numele cheii „accessibility.block Autorefresh” [19] .

Multe tutoriale de design web subliniază, de asemenea, că redirecționarea din partea clientului tinde să interfereze cu funcționarea normală a butonului „Înapoi” al browserului web. După ce a fost redirecționat, făcând clic pe butonul Înapoi, utilizatorul va reveni la pagina de redirecționare, care îl redirecționează din nou.

Redirecționările automate prin markup (spre deosebire de redirecționările de pe server) nu sunt conforme cu W3C - Ghidul de accesibilitate a conținutului web ( WCAG ) 1.0 (ghidul 7.5) [20] .

Anteturi de mesaje HTTP

Elementele meta ale modulului <meta http-equiv="foo" content="bar"> pot fi utilizate ca alternative la anteturile HTTP. De exemplu, <meta http-equiv="expires" content="Wed, 21 June 2006 14:25:27 GMT"> spune browserului că pagina „expiră” pe 21 iunie 2006 la 14:25:27 GMT și că poate stoca pagina în siguranță până în acel moment. Specificația HTML 4.01 permite opțional ca această etichetă să fie analizată de serverele HTTP și setată ca parte a anteturilor de răspuns HTTP, dar niciun server web nu implementează în prezent acest comportament[21] . În schimb, agentul utilizatorului emulează comportamentul unor antete HTTP ca și cum ar fi fost trimise în antetul de răspuns în sine.

Alternativă la metaelemente

Unele elemente și atribute HTML gestionează deja anumite bucăți de metadate și pot fi folosite de autori în locul META pentru a specifica acele bucăți: elementul TITLE, elementul ADRESĂ, elementele INS și DEL, „titlul și„ atributul. „Citați” atribut [22] .

O alternativă la elementele meta pentru un acces mai bun la subiectele dintr-un site web este utilizarea unui index de stil de tip back-of-book pentru site-ul web. Pentru un exemplu, consultați site-ul American Society of Indexers.

În 1994, ALIWEB a folosit și un fișier index pentru a furniza tipul de informații găsite în mod obișnuit în atributele meta cuvintelor cheie.

În cazurile în care valoarea atributului de conținut este o adresă URL , mulți autori decid să folosească un element de legătură cu o valoare adecvată și pentru atributul său rel [23] .

Notă

  1. ^ Motoare de căutare Metaetichete
  2. ^ a b Meta-etichete recunoscute de Google - Ghidul instrumentelor pentru webmasteri
  3. ^ Conținutul metaetichetei de descriere
  4. ^ a b "Eticheta meta ROBOTS" în Etichetele meta "
  5. ^ Vanessa Fox (13 iulie 2006), Mai mult control asupra fragmentelor de pagină , Inside Google Sitemaps , recuperat 3 iunie 2007
  6. ^ Yahoo! Căutare (24 octombrie 2006), Yahoo! Căutați actualizarea vremii și asistență pentru „NOODP” , Yahoo! Search Blog , recuperat pe 3 iunie 2007
  7. ^ Yahoo! Căutare (28 februarie 2007), Yahoo! Căutare asistență pentru metaetichete „NOYDIR” și actualizare meteo Arhivat 6 noiembrie 2008 la Internet Archive ., Yahoo! Search Blog , recuperat pe 3 iunie 2007
  8. ^ Yahoo! Căutare (02 mai 2007), Introducerea roboților-Nocontent pentru secțiunile de pagină Arhivat 20 august 2014 la Internet Archive ., Yahoo! Search Blog , recuperat pe 23 martie 2013
  9. ^ 1 Designer de site-uri web Utilizarea metatagurilor de limbă în site-uri web 19 februarie 2008
  10. ^ Vishal Jaiswal, Creați metaetichete | Instrument Advance Meta Generator Tool , pe createmetatags.blogspot.com , Blogspot. Adus pe 10 mai 2020 .
  11. ^ (EN) LinkedIn, Cum se folosește corect eticheta Meta Refresh pe LifeWire. Adus pe 5 februarie 2021 .
  12. ^ O prezentare generală a celor mai importante metaetichete , pe IONOS Digitalguide . Adus pe 5 februarie 2021 .
  13. ^ Metaetichetă HTML , la www.w3schools.com . Adus pe 5 februarie 2021 .
  14. ^ Greta de Groat (2002). „Perspective on the Web and Google: Monika Henzinger , Director of Research, Google”, Journal of Internet Cataloging , Vol. 5 (1), pp. 17-28, 2002.
  15. ^ Meta Tags 2 , pe Swiftype , 10 martie 2014. Adus pe 8 noiembrie 2017 .
  16. ^ Bine ați venit la Mall-ul virtual! , pe www.w3.org . Adus la 15 octombrie 2018 .
  17. ^ Bine ați venit la Mall-ul virtual! , pe www.w3.org . Adus la 15 octombrie 2018 .
  18. ^ Bine ați venit la Mall-ul virtual! , pe www.w3.org . Adus la 15 octombrie 2018 .
  19. ^ Accessibility.block autorefresh mozillaZine, arhivat 2 iunie 2009 din original
  20. ^ Recomandarea W3C (5 mai 1999), Linii directoare 1.0 privind accesibilitatea conținutului web - Linia directoare 7 . W3.org , accesat la 28 septembrie 2007
  21. ^ Stack Overflow , meta http-equiv - este trimis ca parte a unui antet HTTP sau clientul analizează corpul pentru metaetichete? , dintr-o discuție tehnică privind standardele web de la Londra.
  22. ^ (EN) Structura globală a unui document HTML , pe www.w3.org. Adus la 15 octombrie 2018 .
  23. ^ (EN) Structura globală a unui document HTML , pe www.w3.org. Adus la 15 octombrie 2018 .
Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT