PageRank

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Schema sistemului PageRank

PageRank este un algoritm de analiză care atribuie o greutate numerică fiecărui element al unui set de documente conectate prin intermediul hyperlinkurilor , de exemplu setul de pagini din World Wide Web, cu scopul de a cuantifica importanța relativă a interiorului întregului însuși .

Algoritmul poate fi aplicat tuturor seturilor de obiecte legate de citate și referințe reciproce. Ponderea numerică atribuită unui anumit element E se mai numește „PageRank-ul lui E”, parafată în PR (E). Algoritmul PageRank a fost brevetat ( brevetul SUA 6285999 ) de Universitatea Stanford ; este, de asemenea, un termen care a intrat acum de facto în lexicul utilizatorilor serviciilor oferite de motoarele de căutare. Numele PageRank este o marcă comercială a Google și numele său se datorează lui Larry Page [1] , unul dintre cei doi fondatori ai acelei companii.

În 2008, vicepreședintele Google, Udi Manber, a scris că PageRank este „cea mai importantă parte a algoritmului de clasare Google”. [...] „ PageRank continuă să fie utilizat (în evaluările de clasificare a site-urilor web), dar a devenit parte a unui sistem mult mai avansat.”

De ceva timp, PageRank nu mai este singurul parametru cu care algoritmul de poziționare Google poziționează site-urile în paginile sale de rezultate , deși rămâne, potrivit cercetătorilor, principalul [2] (trebuie luat în considerare faptul că studiul în cauză este din 2013 ). De asemenea, trebuie să ne amintim un fapt și mai important: algoritmul încearcă să definească, nu să determine „valoarea” unei pagini web; de fapt, în general, algoritmul identifică o corelație , deci nu trebuie să se creadă că activitatea algoritmului generează o relație cauză-efect („corelația nu implică cauzalitate”). [3]

Elemente generale

Literalmente traductibil ca rangul unei pagini web (dar și un joc de cuvinte legat de numele unuia dintre inventatorii săi, Larry Page ), PageRank poate fi cu ușurință urmărit până la conceptul de popularitate tipic relațiilor sociale umane și indică sau promite pentru a indica paginile sau site-urile cu cea mai mare relevanță în raport cu termenii căutați. Algoritmii care fac posibilă indexarea materialului prezent pe net folosesc și gradul de popularitate al unei pagini web pentru a defini poziția acesteia în rezultatele căutării.

Această metodă poate fi descrisă ca fiind analogă unei alegeri în care oricine poate publica o pagină web are dreptul de a vota, iar votul este exprimat prin linkurile din aceasta. Voturile nu au toate aceeași pondere: cele mai populare pagini web vor exprima, cu link - urile lor, voturi de valoare mai mare.

Cu toate acestea, interpretarea și definirea popularității unui site nu sunt legate numai de aceste voturi , ci iau în considerare și relevanța conținutului unei pagini, precum și a paginilor conexe, cu termenii și criteriile căutării. executat. Un alt element important care leagă un site de popularitatea sa este legat de difuzare, popularitatea subiectului tratat în acesta. Pentru subiectele nesolicitate, site-urile ajung cu ușurință în primele poziții în căutări, dar la fel de probabil dețin și mențin un rang care ar putea fi foarte scăzut. Toate acestea permit sau cel puțin au scopul de a efectua o verificare încrucișată care garantează validitatea rezultatelor căutării.

Vizualizarea popularității unui site

Pentru a obține informații referitoare, de exemplu, la notorietatea unei pagini web în Google, este posibil să instalați Bara de instrumente Google în browserul de navigare sau puteți utiliza servicii oferite de terți capabili să determine aceste informații și pot fi implementate pe site-uri web. Pentru a crește rangul paginii puteți profita de câteva trucuri mici. Unul dintre cele mai utilizate este să încerci să atragi atenția utilizatorilor care sunt interesați de subiecte legate de site-ul sau blogul nostru.

Scopul este de a cuceri utilizatorii care sunt cu adevărat interesați să urmărească postările noastre. Aceasta este utilizată pentru a confirma una dintre regulile Google: linkurile care pot indica un site trebuie să fie „naturale”, adică nu sunt necesare sau generate de schimbul de linkuri sau plătite. Dacă Google observă că un site face solicitări care nu respectă regulile motorului de căutare, acesta îl sancționează imediat, ajungând chiar să interzică proprietarului care se opune regulilor de conduită semnate la înregistrarea la serviciul motorului de căutare [4 ] . Pentru a încerca să obțineți legături naturale, este necesar să propuneți subiecte mereu actualizate, care nu sunt copiate, cu informații interesante pentru utilizatorii serviciului web.

Formula simplificată

Algoritmul complet pentru calcularea PageRank utilizează teoria procesului Markov și este clasificat în adevărata categorie de algoritmi de clasificare a analizei legăturilor . Din formula dezvoltată inițial de fondatorii Google, Sergey Brin și Larry Page , este posibil să înțelegem modul în care PageRank este distribuit între pagini:

Unde este:

  • PR [A] este valoarea PageRank a paginii A pe care dorim să o calculăm.
  • N este numărul total de pagini cunoscute.
  • n este numărul de pagini care conțin cel puțin un link către A. P k reprezintă fiecare dintre aceste pagini.
  • PR [P k ] sunt valorile PageRank ale fiecărei pagini P k .
  • C [P k ] reprezintă numărul total de linkuri conținute în pagina care oferă link-ul.
  • d (factorul de amortizare) este un factor decis de Google și care în documentația originală își asumă o valoare de 0,85. Poate fi ajustat de Google pentru a decide procentul de PageRank care trebuie să treacă de la o pagină la alta și valoarea minimă de PageRank atribuită fiecărei pagini din arhivă.

Prin urmare, este evident că, pe măsură ce crește numărul total de link-uri ale site-urilor care indică A, crește PageRank.

Notă

  1. ^ Google Press Center: Fun Facts , pe google.com , 24 aprilie 2009. Accesat la 4 mai 2015 (arhivat din original la 24 aprilie 2009) .
  2. ^ Sondaj și date de corelare a factorilor de clasare a motorului de căutare 2013 - Moz , pe moz.com . Adus la 4 mai 2015 .
  3. ^ Corelație și cauzalitate , la wikiversity.org . Adus pe 27 august 2015 .
  4. ^ Acest lucru ar pune diverse probleme legate de utilizarea serviciilor comerciale, cum ar fi publicitatea proprietarului site-ului, care ar putea risca, de asemenea, să nu fie inclus în circuitul Google.

Elemente conexe

Alte proiecte

linkuri externe