Motor de căutare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Ca parte a tehnologiei Internet , un motor de căutare (în limba engleză motor de căutare) este un sistem automat care, la cerere, analizează un set de date (adesea colectate de el însuși) și returnează un index al conținutului disponibil [1] clasificându-se automat pe baza pe formule statistico-matematice care indică gradul de relevanță dat unei chei de căutare specifice. Unul dintre domeniile în care motoarele de căutare găsesc o utilizare mai mare este cel al regăsirii informațiilor și pe web . Cele mai utilizate motoare de căutare din 2017 au fost: Google , Bing , Baidu , Qwant , Yandex , Ecosia , DuckDuckGo .

Descriere

Sigla Google , cel mai folosit motor de căutare din lume

Conceptual, un motor de căutare este un sistem foarte asemănător cu o aplicație web sau un sistem client - server , prin Internet , unde clientul este reprezentat de browserul web al utilizatorului care, la cererea acestuia, se conectează la un server care la rândul său efectuează o interogare de căutare, utilizând algoritmi de căutare corespunzători, pe baze de date ( baze de date distribuite ). În analiza rezultatelor furnizate, o componentă esențială este așa-numitul crawler sau păianjen. Un motor de căutare bun este cel care reușește să găsească cel mai mare număr de conținut în conformitate cu tipul de cerere, ordonându-le după importanță și relevanță în conformitate cu specificațiile de căutare.

Faze operaționale

Activitatea motoarelor de căutare este împărțită în principal în trei faze:

  • analiza domeniului de acțiune (prin utilizarea crawlerelor specifice);
  • catalogarea materialului obținut;
  • răspuns la solicitările utilizatorilor.

Catalogare

După analiza paginilor, conform unor criterii care variază de la motor la motor, unele dintre ele sunt inserate în baza de date și în indexul motorului de căutare.

Partea textuală stocată în timpul fazei de analiză va fi apoi analizată pentru a oferi răspunsuri la căutările utilizatorilor. Multe motoare de căutare web fac, de asemenea, o copie a datelor textuale ale fiecărei pagini stocate disponibile atunci când resursa originală nu este accesibilă: această funcție se numește cache .

Răspuns

Răspunsul la cererile utilizatorilor implică necesitatea listării site-urilor în ordinea relevanței față de cererea primită.

Pentru a stabili relevanța unui site, documentele care conțin cuvântul cheie introdus de utilizator sunt căutate în baza de date, după care fiecare motor de căutare folosește propriii algoritmi pentru a clasifica paginile, verificând, de exemplu, de câte ori se repetă cuvintele cheie, cum multe linkuri primesc acel document, în care puncte ale paginii sunt plasate cuvintele cheie, câte site-uri din baza de date conțin linkuri către acea pagină sau de câte ori un utilizator a vizitat acel site după o căutare.

Rafinarea cercetării

Capacitatea de a rafina căutarea variază de la un motor la altul, dar cele mai multe dintre ele vă permit să utilizați operatori booleeni : de exemplu, puteți căuta „ Ganymede AND satellite NOT cupbearer ” pentru a căuta informații despre Ganymede intenționate ca planetă și nu ca o figură mitologică .

Pe Google și pe cele mai moderne motoare este posibilă perfecționarea căutării în funcție de limba documentului, de cuvintele sau frazele prezente sau absente, de formatul de fișier ( Microsoft Word , PDF , PostScript etc.), în funcție de dată. a ultimei actualizări și multe altele. De asemenea, puteți căuta conținut pe un anumit site, de exemplu „ Ganymede site: nasa.gov ” va căuta informații despre Ganymede pe site-ul NASA .

Pe Exalead există o parte specială pentru a rafina căutarea mai intuitiv.

Indexare

Pictogramă lupă mgx2.svg Același subiect în detaliu: Indexarea (motoarele de căutare) .

Indexarea se referă la inserarea unui site web în baza de date a unui motor de căutare. Indexarea unui site web, cu alte cuvinte, este modul în care site-ul este dobândit și interpretat de motoarele de căutare și, prin urmare, apare în paginile lor de răspuns la întrebările utilizatorilor web.

Poziționare

Pictogramă lupă mgx2.svg Același subiect în detaliu: Poziționarea (motoarele de căutare) .

Termenul de poziționare înseamnă dobândirea de vizibilitate printre rezultatele motoarelor de căutare. Mai precis, este operațiunea prin care site-ul este optimizat pentru a apărea în rezultate într-o poziție cât mai favorabilă și relevantă posibil.

Optimizare

Pictogramă lupă mgx2.svg Același subiect în detaliu: Optimizare (motoare de căutare) .

Termenul de optimizare a motorului de căutare înseamnă, în limba internetului, toate acele activități care vizează îmbunătățirea vizibilității unui site web pe motoarele de căutare (cum ar fi Google, Yahoo! Etc.) pentru a îmbunătăți (sau a menține) poziționarea în paginile de răspuns la întrebările utilizatorilor web. La rândul său, poziționarea bună a unui site web în paginile de răspuns ale motoarelor de căutare este funcțională pentru vizibilitatea produselor / serviciilor vândute.

Rezultate sponsorizate

Motoarele de căutare oferă, de asemenea, rezultate sponsorizate, adică se afișează mai vizibil pe site-urile web SERP ( Search Engine Result Pages ) ale companiilor care plătesc pentru a fi printre primele rezultate atunci când caută termeni (numiți cuvinte cheie. ) Care sunt în raport cu zona de Competența companiei în sine. Rezultatele sponsorizate ale motorului pot apărea și pe site-urile care participă la programul lor de afiliere. În special, Google permite ca rezultatele plătite achiziționate cu programul AdWords să apară pe paginile sale de rezultate (clar distincte de rezultatele „naturale”). În plus, oferă și un serviciu de sponsorizare care se adresează tuturor site-urilor care au anumite cerințe, numit AdSense. Google AdSense (adesea abreviat cu Google AS) folosește capacitatea motorului de căutare de a interpreta tema paginii în care este plasat codul corespunzător pentru a difuza reclame tematice. Yahoo! Search a anunțat sosirea unui program similar numit Panama.

Motoare de căutare populare

Sigla Yahoo
Sigla Bing
Sigla Baidu
Sigla Ask.com
Logo Ecosia

Motoarele de căutare cu cea mai mare relevanță internațională în 2020 sunt:

  • Google , pe lângă faptul că este de departe cel mai utilizat direct, este și cel cu cel mai mare număr de site-uri care utilizează baza de date , datorită și programului de sponsorizare „AdSense pentru căutare” care aparține programului AdSense mai mare.
  • Microsoft Bing , motor creat de Microsoft și utilizat de Microsoft Network, mai cunoscut ca MSN .
  • Baidu , un motor de căutare chinezesc care colectează o bază de utilizatori pe atât de vastă pe cât este în creștere, având în vedere puterea copleșitoare totală asupra celorlalte motoare de căutare utilizate în China .
  • Yandex , motorul cu cea mai mare cotă de piață din Rusia .

Aceste 4 motoare de căutare sunt echipate cu tehnologie exclusivă.

Alte mențiuni importante sunt:

  • Qwant , un motor de căutare european care își propune să ofere utilizatorului o mai mare confidențialitate.
  • DuckDuckGo , motor de căutare prietenos cu confidențialitatea.
  • Ecosia , un motor de căutare ecologic german, produce mai puțin dioxid de carbon decât serverele concurente; 80% din încasări sunt folosite pentru a planta copaci în întreaga lume și pentru a reduce defrișările și a fost fondată în colaborare cu WWF .
  • Startpage , unul dintre puținele motoare de căutare din lume care garantează confidențialitatea , deoarece nu stochează și nu înregistrează IP - urile celor care efectuează căutări.
  • Yahoo! , acum total bazat pe tehnologia Bing.
  • Ask.com

Dintre acestea din urmă, singurele care sunt parțial echipate cu un indice proprietar sunt Qwant și parțial DuckDuckGo

In Italia

Logo Qwant
Sigla Yandex
  • Google este folosit și de Libero , Virgilio și Tiscali (care pot fi verificate imediat de oricine). În Italia, diferența dintre utilizarea Google și celelalte este atât de mare încât, deși datele sunt în mod evident variabile, procentul căutărilor efectuate pe Google este egal cu un multiplu al sumei tuturor celorlalte motoare de căutare puse împreună.
  • Istella Italia este un motor de căutare dezvoltat de Tiscali , dar, chiar dacă este accesibil, nu a mai fost actualizat din 2016

Listă

An Motor Eveniment Motor Starea curenta
1993 elvețian W3Catalog Lansa Inactiv
1993 elvețian Aliweb Lansa Inactiv
Scoţia JumpStation Lansa Inactiv
Statele Unite WWW Worm Lansa Inactiv
1994 Statele Unite WebCrawler Lansa Bing Activ
Statele Unite Go.com Lansa Inactiv
Statele Unite Infoseek Lansa Inactiv
Statele Unite Lycos Lansa Bing Activ
Italia Spenki fundație Inactiv
1995 Statele Unite AltaVista Lansa Inactiv, redirecționat către Yahoo!
Coreea de Sud Daum Lansa Activ
Statele Unite Magellan Lansa Inactiv
Statele Unite Excita Lansa Inactiv, numai știri
Portugalia ȘTIU Lansa Inactiv, numai știri
Statele Unite Yahoo! Lansa Inactiv (a devenit căutare Yahoo!)
1996 Statele Unite Dogpile Lansa Agregator Activ
Statele Unite Inktomi fundație Inactiv, achiziționat de Yahoo!
Statele Unite HotBot fundație Activ
Italia Arianna fundație Inactiv, încorporat în Libero
Italia Multisoft fundație Inactiv
Italia Virgil fundație Activ, rezultate Google
Statele Unite Întrebați-l pe Jeeves fundație Inactiv (rebranded to ask.com)
1997 Statele Unite Lumina Nordului Lansa Inactiv
Rusia Yandex Lansa Proprietar Activ
1998 Statele Unite Google Lansa Proprietar Activ
Europa Olanda Ixquick Lansa Agregator De asemenea, activ ca pagină de pornire
Statele Unite Căutare MSN Lansa Inactiv, devine Bing
Coreea de Sud empas Lansa Inactiv (fuzionat cu NATE)
1999 Norvegia Alltheweb Lansa Inactiv (URL redirecționat către Yahoo! )
Canada GenieKnows Lansa Inactiv
Coreea de Sud Naver Lansa Activ
Statele Unite Theoma fundație Cere Activ
Statele Unite Vivísimo fundație Inactiv, IMB
Italia superEva Lansa Inactiv, doar analiza tendințelor
2000 China Baidu fundație Proprietar Activ
Franţa Exalead Lansa Proprietar Activ
Statele Unite Gigablast Lansa Proprietar Activ
2001 Franţa Kartoo Lansa Inactiv
2003 Anglia Info.com Lansa Bing Activ
Scroogle Lansa Inactiv
2004 Statele Unite Yahoo! Căutare Lansare finală Bing Activ
Statele Unite A9.com Lansa Inactiv
China Sogou Lansa Activ
2005 Statele Unite Căutare Windows Live Lansare finală Inactiv
Statele Unite GoodSearch Lansa Inactiv
Statele Unite Cauta-ma Lansa Inactiv
2006 China Asa si asa Lansa Activ
Franţa Uniunea Europeană Quaero fundație Inactiv
Statele Unite Search.com fundație Proprietar Activ (numai căutare CBS)
Statele Unite Ask.com Lansa Activ
Statele Unite Căutare Windows Live Lansa Inactiv
Statele Unite ChaCha Lansare beta Inactiv
India Guruji.com Lansare beta Inactiv
2007 Statele Unite Wikiseek Lansa Inactiv
Statele Unite Sproose Lansa Inactiv
Statele Unite Căutare Wikia Lansa Inactiv
2008 Statele Unite Cuil Lansa Inactiv
Statele Unite Powerset Lansa Inactiv
Rusia Picollator Lansa Inactiv
Statele Unite Viewzi Lansa Inactiv
Anglia Boogami Lansa Inactiv
Statele Unite LeapFish Lansa Inactiv
Germania Forestle Lansa Inactiv
Australia Ecocho Lansa Inactiv
Statele Unite DuckDuckGo Lansa Bing + Algoritmi proprietari Activ
2009 Anglia Wolfram Alpha Lansa Proprietar Activ
Statele Unite Bing Lansa Proprietar Activ
Statele Unite Yebol Lansa Inactiv
Statele Unite Mugurdy Lansa Inactiv
Statele Unite Scout (Goby) Lansa Inactiv
Statele Unite Coozila! Lansa Inactiv
Germania Ecosia Lansa Bing + Algoritmi proprietari Activ
Coreea de Sud NATĂ Lansa Activ
2010 Statele Unite iAlgae Lansa Activ
Statele Unite Blekko Lansa Inactiv (vândut către IBM)
Statele Unite Cuil Lansa Inactiv
Rusia Yandex (versiunea

in engleza)

Lansa Activ
2011 Statele Unite YaCy Lansa Inactiv (software auto-găzduit)
2012 Italia Volunia Lansa Inactiv
Italia Idee Lansa Inactiv
2013 Italia Istella Lansa Proprietar Accesibil, inactiv
Europa Franţa Qwant Lansa Bing + Algoritmi proprietari Activ
Statele Unite Aoohe Lansa Inactiv
Vietnam Coc Coc Lansa Activ
Steagul Kurdistanului.svg Egerin Lansa Motor de căutare activ, kurd / sorani
2014 Searx Lansa Agregator Activ
elvețian Swisscows Lansa Bing Activ
2015 Europa Germania Cliqz Lansa Proprietar Inactiv
2017 Franţa Xaphir Beta Proprietar Inactiv, achiziționat de Qwant [2]

Majoritatea motoarelor de căutare care funcționează pe web sunt conduse de companii private care utilizează algoritmi proprietari și baze de date păstrate secrete. Cu toate acestea, există mai multe încercări de a crea motoare de căutare bazate pe software gratuit , unele exemple sunt:

Alte motoare de căutare active din martie 2020 sunt: ​​Metager (pentru confidențialitate), Serch Encrypt, SearX, Gibiru, YaCy (descentralizat), Yippi, Lukol și Boardreader.

Perspectivele de dezvoltare

Cele mai recente inovații în producția de algoritmi și sisteme de recuperare a informațiilor se bazează pe analiza semantică a termenilor și crearea consecventă a rețelelor semantice . Google însuși a adoptat sisteme pentru prevenirea erorilor și contextualizarea rezultatelor.

Este rezonabil să se prevadă că în câțiva ani motoarele de căutare își vor baza tehnologiile atât pe analiza cantitativă a conținutului (cuvintele în sine), cât mai ales pe cea calitativă (sensul cuvintelor). Motoarele de căutare vor putea, de exemplu, să distingă sensul cuvântului „ pescuit ” în funcție de contextul în care este cuprins cuvântul (pentru a înțelege dacă este fructul, sportul sau altul). Pentru a merge în această direcție, Google a achiziționat Oingo (cunoscut anterior ca „motorul conceptelor”) și tehnologia companiei care a creat-o, Applied Semantics.

Web 2.0 și viitorul motoarelor de căutare

Pictogramă lupă mgx2.svg Același subiect în detaliu: Web 2.0 .

Noua frontieră a motoarelor de căutare este web 2.0 . Prin adoptarea acestei logici, multe motoare și directoare internaționale vizează o participare mai mare a utilizatorilor la crearea conținutului motorului de căutare, pentru a elimina orice utilizare a păianjenilor sau a linkurilor sponsorizate. Cu această logică, utilizatorii pot raporta singuri linkurile și pot decide dacă vor da sau nu popularitate site-urilor raportate.

Web 2.0 vizează, de asemenea, o ușurință de utilizare mai rapidă, mai rapidă și mai intuitivă datorită utilizării motoarelor Metasearch (sau a mai multor motoare de căutare), cum ar fi:

Notă

  1. ^ Alta Vista , p. 6 .
  2. ^ ( FR ) Qwant represe Xilopix, creator du moteur Xaphir - Le Monde Informatique , în LeMondeInformatique . Adus la 15 ianuarie 2018 .
  3. ^ Winner tinooo.com un motor de căutare - Winner tinooo.com un motor de căutare care în câteva clicuri poate fi personalizat pentru a găsi orice pe web.

Bibliografie

  • Ghid pentru tehnici de cercetare pe internet , Milano, Loeacher, 2000.

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tesauro BNCF 37517 · LCCN (EN) sh00001050 · GND (DE) 4423007-2 · BNF (FR) cb13558463d (dată) · NDL (EN, JA) 00.964.483
Internet Portal internet : accesați intrările Wikipedia care se ocupă de internet