Motor de căutare
Această intrare sau secțiune despre aplicațiile de calculator nu menționează sursele necesare sau cei prezenți sunt insuficienți . |
Ca parte a tehnologiei Internet , un motor de căutare (în limba engleză motor de căutare) este un sistem automat care, la cerere, analizează un set de date (adesea colectate de el însuși) și returnează un index al conținutului disponibil [1] clasificându-se automat pe baza pe formule statistico-matematice care indică gradul de relevanță dat unei chei de căutare specifice. Unul dintre domeniile în care motoarele de căutare găsesc o utilizare mai mare este cel al regăsirii informațiilor și pe web . Cele mai utilizate motoare de căutare din 2017 au fost: Google , Bing , Baidu , Qwant , Yandex , Ecosia , DuckDuckGo .
Descriere

Conceptual, un motor de căutare este un sistem foarte asemănător cu o aplicație web sau un sistem client - server , prin Internet , unde clientul este reprezentat de browserul web al utilizatorului care, la cererea acestuia, se conectează la un server care la rândul său efectuează o interogare de căutare, utilizând algoritmi de căutare corespunzători, pe baze de date ( baze de date distribuite ). În analiza rezultatelor furnizate, o componentă esențială este așa-numitul crawler sau păianjen. Un motor de căutare bun este cel care reușește să găsească cel mai mare număr de conținut în conformitate cu tipul de cerere, ordonându-le după importanță și relevanță în conformitate cu specificațiile de căutare.
Faze operaționale
Activitatea motoarelor de căutare este împărțită în principal în trei faze:
- analiza domeniului de acțiune (prin utilizarea crawlerelor specifice);
- catalogarea materialului obținut;
- răspuns la solicitările utilizatorilor.
Catalogare
După analiza paginilor, conform unor criterii care variază de la motor la motor, unele dintre ele sunt inserate în baza de date și în indexul motorului de căutare.
Partea textuală stocată în timpul fazei de analiză va fi apoi analizată pentru a oferi răspunsuri la căutările utilizatorilor. Multe motoare de căutare web fac, de asemenea, o copie a datelor textuale ale fiecărei pagini stocate disponibile atunci când resursa originală nu este accesibilă: această funcție se numește cache .
Răspuns
Răspunsul la cererile utilizatorilor implică necesitatea listării site-urilor în ordinea relevanței față de cererea primită.
Pentru a stabili relevanța unui site, documentele care conțin cuvântul cheie introdus de utilizator sunt căutate în baza de date, după care fiecare motor de căutare folosește propriii algoritmi pentru a clasifica paginile, verificând, de exemplu, de câte ori se repetă cuvintele cheie, cum multe linkuri primesc acel document, în care puncte ale paginii sunt plasate cuvintele cheie, câte site-uri din baza de date conțin linkuri către acea pagină sau de câte ori un utilizator a vizitat acel site după o căutare.
Rafinarea cercetării
Capacitatea de a rafina căutarea variază de la un motor la altul, dar cele mai multe dintre ele vă permit să utilizați operatori booleeni : de exemplu, puteți căuta „ Ganymede AND satellite NOT cupbearer ” pentru a căuta informații despre Ganymede intenționate ca planetă și nu ca o figură mitologică .
Pe Google și pe cele mai moderne motoare este posibilă perfecționarea căutării în funcție de limba documentului, de cuvintele sau frazele prezente sau absente, de formatul de fișier ( Microsoft Word , PDF , PostScript etc.), în funcție de dată. a ultimei actualizări și multe altele. De asemenea, puteți căuta conținut pe un anumit site, de exemplu „ Ganymede site: nasa.gov ” va căuta informații despre Ganymede pe site-ul NASA .
Pe Exalead există o parte specială pentru a rafina căutarea mai intuitiv.
Indexare
Indexarea se referă la inserarea unui site web în baza de date a unui motor de căutare. Indexarea unui site web, cu alte cuvinte, este modul în care site-ul este dobândit și interpretat de motoarele de căutare și, prin urmare, apare în paginile lor de răspuns la întrebările utilizatorilor web.
Poziționare
Termenul de poziționare înseamnă dobândirea de vizibilitate printre rezultatele motoarelor de căutare. Mai precis, este operațiunea prin care site-ul este optimizat pentru a apărea în rezultate într-o poziție cât mai favorabilă și relevantă posibil.
Optimizare
Termenul de optimizare a motorului de căutare înseamnă, în limba internetului, toate acele activități care vizează îmbunătățirea vizibilității unui site web pe motoarele de căutare (cum ar fi Google, Yahoo! Etc.) pentru a îmbunătăți (sau a menține) poziționarea în paginile de răspuns la întrebările utilizatorilor web. La rândul său, poziționarea bună a unui site web în paginile de răspuns ale motoarelor de căutare este funcțională pentru vizibilitatea produselor / serviciilor vândute.
Rezultate sponsorizate
Motoarele de căutare oferă, de asemenea, rezultate sponsorizate, adică se afișează mai vizibil pe site-urile web SERP ( Search Engine Result Pages ) ale companiilor care plătesc pentru a fi printre primele rezultate atunci când caută termeni (numiți cuvinte cheie. ) Care sunt în raport cu zona de Competența companiei în sine. Rezultatele sponsorizate ale motorului pot apărea și pe site-urile care participă la programul lor de afiliere. În special, Google permite ca rezultatele plătite achiziționate cu programul AdWords să apară pe paginile sale de rezultate (clar distincte de rezultatele „naturale”). În plus, oferă și un serviciu de sponsorizare care se adresează tuturor site-urilor care au anumite cerințe, numit AdSense. Google AdSense (adesea abreviat cu Google AS) folosește capacitatea motorului de căutare de a interpreta tema paginii în care este plasat codul corespunzător pentru a difuza reclame tematice. Yahoo! Search a anunțat sosirea unui program similar numit Panama.
Motoare de căutare populare




Motoarele de căutare cu cea mai mare relevanță internațională în 2020 sunt:
- Google , pe lângă faptul că este de departe cel mai utilizat direct, este și cel cu cel mai mare număr de site-uri care utilizează baza de date , datorită și programului de sponsorizare „AdSense pentru căutare” care aparține programului AdSense mai mare.
- Microsoft Bing , motor creat de Microsoft și utilizat de Microsoft Network, mai cunoscut ca MSN .
- Baidu , un motor de căutare chinezesc care colectează o bază de utilizatori pe atât de vastă pe cât este în creștere, având în vedere puterea copleșitoare totală asupra celorlalte motoare de căutare utilizate în China .
- Yandex , motorul cu cea mai mare cotă de piață din Rusia .
Aceste 4 motoare de căutare sunt echipate cu tehnologie exclusivă.
Alte mențiuni importante sunt:
- Qwant , un motor de căutare european care își propune să ofere utilizatorului o mai mare confidențialitate.
- DuckDuckGo , motor de căutare prietenos cu confidențialitatea.
- Ecosia , un motor de căutare ecologic german, produce mai puțin dioxid de carbon decât serverele concurente; 80% din încasări sunt folosite pentru a planta copaci în întreaga lume și pentru a reduce defrișările și a fost fondată în colaborare cu WWF .
- Startpage , unul dintre puținele motoare de căutare din lume care garantează confidențialitatea , deoarece nu stochează și nu înregistrează IP - urile celor care efectuează căutări.
- Yahoo! , acum total bazat pe tehnologia Bing.
- Ask.com
Dintre acestea din urmă, singurele care sunt parțial echipate cu un indice proprietar sunt Qwant și parțial DuckDuckGo
In Italia


- Google este folosit și de Libero , Virgilio și Tiscali (care pot fi verificate imediat de oricine). În Italia, diferența dintre utilizarea Google și celelalte este atât de mare încât, deși datele sunt în mod evident variabile, procentul căutărilor efectuate pe Google este egal cu un multiplu al sumei tuturor celorlalte motoare de căutare puse împreună.
- Istella Italia este un motor de căutare dezvoltat de Tiscali , dar, chiar dacă este accesibil, nu a mai fost actualizat din 2016
Listă
An | Motor | Eveniment | Motor | Starea curenta |
---|---|---|---|---|
1993 | ![]() | Lansa | Inactiv | |
1993 | ![]() | Lansa | Inactiv | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
1994 | ![]() | Lansa | Bing | Activ |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Bing | Activ | |
![]() | fundație | Inactiv | ||
1995 | ![]() | Lansa | Inactiv, redirecționat către Yahoo! | |
![]() | Lansa | Activ | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv, numai știri | ||
![]() | Lansa | Inactiv, numai știri | ||
![]() | Lansa | Inactiv (a devenit căutare Yahoo!) | ||
1996 | ![]() | Lansa | Agregator | Activ |
![]() | fundație | Inactiv, achiziționat de Yahoo! | ||
![]() | fundație | Activ | ||
![]() | fundație | Inactiv, încorporat în Libero | ||
![]() | fundație | Inactiv | ||
![]() | fundație | Activ, rezultate Google | ||
![]() | fundație | Inactiv (rebranded to ask.com) | ||
1997 | ![]() | Lansa | Inactiv | |
![]() | Lansa | Proprietar | Activ | |
1998 | ![]() | Lansa | Proprietar | Activ |
![]() ![]() | Lansa | Agregator | De asemenea, activ ca pagină de pornire | |
![]() | Lansa | Inactiv, devine Bing | ||
![]() | Lansa | Inactiv (fuzionat cu NATE) | ||
1999 | ![]() | Lansa | Inactiv (URL redirecționat către Yahoo! ) | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Activ | ||
![]() | fundație | Cere | Activ | |
![]() | fundație | Inactiv, IMB | ||
![]() | Lansa | Inactiv, doar analiza tendințelor | ||
2000 | ![]() | fundație | Proprietar | Activ |
![]() | Lansa | Proprietar | Activ | |
![]() | Lansa | Proprietar | Activ | |
2001 | ![]() | Lansa | Inactiv | |
2003 | ![]() | Lansa | Bing | Activ |
Scroogle | Lansa | Inactiv | ||
2004 | ![]() | Lansare finală | Bing | Activ |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Activ | ||
2005 | ![]() | Lansare finală | Inactiv | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
2006 | ![]() | Lansa | Activ | |
![]() ![]() | fundație | Inactiv | ||
![]() | fundație | Proprietar | Activ (numai căutare CBS) | |
![]() | Lansa | Activ | ||
![]() | Lansa | Inactiv | ||
![]() | Lansare beta | Inactiv | ||
![]() | Lansare beta | Inactiv | ||
2007 | ![]() | Lansa | Inactiv | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
2008 | ![]() | Lansa | Inactiv | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Bing + Algoritmi proprietari | Activ | |
2009 | ![]() | Lansa | Proprietar | Activ |
![]() | Lansa | Proprietar | Activ | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Inactiv | ||
![]() | Lansa | Bing + Algoritmi proprietari | Activ | |
![]() | Lansa | Activ | ||
2010 | ![]() | Lansa | Activ | |
![]() | Lansa | Inactiv (vândut către IBM) | ||
![]() | Lansa | Inactiv | ||
![]() in engleza) | Lansa | Activ | ||
2011 | ![]() | Lansa | Inactiv (software auto-găzduit) | |
2012 | ![]() | Lansa | Inactiv | |
![]() | Lansa | Inactiv | ||
2013 | ![]() | Lansa | Proprietar | Accesibil, inactiv |
![]() ![]() | Lansa | Bing + Algoritmi proprietari | Activ | |
![]() | Lansa | Inactiv | ||
![]() | Lansa | Activ | ||
![]() | Lansa | Motor de căutare activ, kurd / sorani | ||
2014 | Searx | Lansa | Agregator | Activ |
![]() | Lansa | Bing | Activ | |
2015 | ![]() ![]() | Lansa | Proprietar | Inactiv |
2017 | ![]() | Beta | Proprietar | Inactiv, achiziționat de Qwant [2] |
Majoritatea motoarelor de căutare care funcționează pe web sunt conduse de companii private care utilizează algoritmi proprietari și baze de date păstrate secrete. Cu toate acestea, există mai multe încercări de a crea motoare de căutare bazate pe software gratuit , unele exemple sunt:
Alte motoare de căutare active din martie 2020 sunt: Metager (pentru confidențialitate), Serch Encrypt, SearX, Gibiru, YaCy (descentralizat), Yippi, Lukol și Boardreader.
Perspectivele de dezvoltare
Cele mai recente inovații în producția de algoritmi și sisteme de recuperare a informațiilor se bazează pe analiza semantică a termenilor și crearea consecventă a rețelelor semantice . Google însuși a adoptat sisteme pentru prevenirea erorilor și contextualizarea rezultatelor.
Este rezonabil să se prevadă că în câțiva ani motoarele de căutare își vor baza tehnologiile atât pe analiza cantitativă a conținutului (cuvintele în sine), cât mai ales pe cea calitativă (sensul cuvintelor). Motoarele de căutare vor putea, de exemplu, să distingă sensul cuvântului „ pescuit ” în funcție de contextul în care este cuprins cuvântul (pentru a înțelege dacă este fructul, sportul sau altul). Pentru a merge în această direcție, Google a achiziționat Oingo (cunoscut anterior ca „motorul conceptelor”) și tehnologia companiei care a creat-o, Applied Semantics.
Web 2.0 și viitorul motoarelor de căutare
Noua frontieră a motoarelor de căutare este web 2.0 . Prin adoptarea acestei logici, multe motoare și directoare internaționale vizează o participare mai mare a utilizatorilor la crearea conținutului motorului de căutare, pentru a elimina orice utilizare a păianjenilor sau a linkurilor sponsorizate. Cu această logică, utilizatorii pot raporta singuri linkurile și pot decide dacă vor da sau nu popularitate site-urilor raportate.
Web 2.0 vizează, de asemenea, o ușurință de utilizare mai rapidă, mai rapidă și mai intuitivă datorită utilizării motoarelor Metasearch (sau a mai multor motoare de căutare), cum ar fi:
- Ixquick
- MetaCrawler
- Tinooo [3]
- Searx
Notă
- ^ Alta Vista , p. 6 .
- ^ ( FR ) Qwant represe Xilopix, creator du moteur Xaphir - Le Monde Informatique , în LeMondeInformatique . Adus la 15 ianuarie 2018 .
- ^ Winner tinooo.com un motor de căutare - Winner tinooo.com un motor de căutare care în câteva clicuri poate fi personalizat pentru a găsi orice pe web.
Bibliografie
- Ghid pentru tehnici de cercetare pe internet , Milano, Loeacher, 2000.
Elemente conexe
- .htaccess
- Tractor pe şenile
- Egosurfing
- Googlebombing
- Hacks Google
- HTML
- Indexare (motor de căutare)
- Recuperarea informațiilor
- Metamotor
- Optimizare (motoare de căutare)
- PageRank
- Poziționare (motoare de căutare)
- Protocol de excludere a robotului
- Pagina de destinație
- Interogare
- G2p
- Motor de căutare distribuit
- Lista motoarelor de căutare
- Web 2.0
- Web semantic
- Căutare incrementală
- Etichetă semantică
Alte proiecte
-
Wikționarul conține lema dicționarului „ motor de căutare ”
-
Wikimedia Commons conține imagini sau alte fișiere pe motorul de căutare
linkuri externe
- ( RO ) Motor de căutare , pe Encyclopedia Britannica , Encyclopædia Britannica, Inc.
- ( RO ) Instrucțiuni de căutare avansată pe Google.com , pe lifewire.com . Adus la 19 martie 2018 (arhivat din original la 7 ianuarie 2018) .
- Motor de căutare , în Treccani.it - Enciclopedii online , Institutul Enciclopediei Italiene.
Controlul autorității | Tesauro BNCF 37517 · LCCN (EN) sh00001050 · GND (DE) 4423007-2 · BNF (FR) cb13558463d (dată) · NDL (EN, JA) 00.964.483 |
---|