CiteSeer

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

CiteSeer a fost un motor public de căutare și o bibliotecă digitală pentru texte științifice și academice, în principal în domeniul informaticii , care a fost înlocuit de CiteSeer X. Mulți consideră că este primul motor de căutare pentru lucrări academice. A devenit publică în 1998 și avea multe funcții noi care nu erau disponibile în motoarele de căutare academice la acea vreme, în ceea ce privește indexarea, căutarea, statisticile și legătura dintre documente și citările acestora.

Este adesea considerat primul sistem automatizat de indexare a citărilor, predecesorul instrumentelor de căutare academice precum Google Scholar și Microsoft Academic Search . Motoarele și arhivele CiteSeer colectează de obicei numai documente de pe site-urile disponibile public și nu parcurg site-urile editorilor. În consecință, este mai probabil ca autorii ale căror documente să fie disponibile în mod liber să apară în index.

Scopul CiteSeer a fost de a îmbunătăți diseminarea și accesul la literatura academică și științifică. Fiind un serviciu non-profit utilizabil în mod liber de către oricine, a fost considerat parte a mișcării în favoarea accesului deschis care încearcă să schimbe lumea publicațiilor academice și științifice pentru a promova un acces mai mare la literatura științifică. CiteSeer a furnizat Open Archives Initiative cu metadate pentru toate documentele indexate gratuit și a conectat documentele indexate la alte surse de metadate, cum ar fi DBLP și Portalul ACM, ori de câte ori este posibil .

CiteSeer X , care a preluat moștenirea CiteSeer, continuă această lucrare și, pentru a promova formate digitale deschise, își partajează datele cu alți cercetători printr-o licență Creative Commons.

Numele CiteSeer se bazează pe un joc dublu de cuvinte: pe de o parte, sună ca un vizitator , adică un turist care se uită la priveliști; pe de altă parte, cite seer este un cercetător care privește textele citate sau chiar un „văzător” al citatelor.

Istorie

CiteSeer și CiteSeer.IST

CiteSeer a fost creat de cercetătorii Lee Giles , Kurt Bollacker și Steve Lawrence în 1997 la NEC Research Institute (acum NEC Labs) din Princeton ( New Jersey ) din Statele Unite . Scopul CiteSeer a fost să cernă și să colecteze în mod activ articole academice și științifice pe web și să utilizeze indexarea autonomă a citatelor pentru a permite interogări prin citație sau prin document, sortându-le în funcție de „impactul” citatelor în sine. Pentru o vreme, sistemul a fost numit ResearchIndex.

După NEC, în 2004 a fost găzduit pe internet ca CiteSeer.IST la Colegiul de Științe ale Informației și Tehnologie al Universității de Stat din Pennsylvania , atingând un total de peste 700.000 de înregistrări. Versiuni similare ale motorului de căutare au fost găzduite de alte universități din Statele Unite și din străinătate pentru a permite un acces mai larg. Cu toate acestea, CiteSeer a dezvăluit o serie de limitări, atât în ​​ceea ce privește acuratețea rezultatelor cercetării asupra autorilor și documentelor acestora (mai mici decât cele ale altor sisteme precum Google Scholar ), cât și pentru costurile ridicate de întreținere ale sistemului.

Din aceste motive, începând din 2005 CiteSeer nu a mai fost actualizat, devenind din ce în ce mai limitat, până când în 2008 a fost implantat un nou sistem, CiteSeerX.

CiteSeer X

CiteSeer X a înlocuit CiteSeer și toate interogările efectuate anterior pe CiteSeer au fost redirecționate către acesta. La fel ca predecesorul său, CiteSeer X [1] este, de asemenea, un motor de căutare public și o bibliotecă digitală , precum și un repertoriu de texte academice și științifice dedicate în primul rând informaticii . [1]

Lansat în 2008, este o evoluție a CiteSeer și se bazează pe o nouă arhitectură „open source” sau open source , SeerSuite, și pe algoritmi noi, mai puternici. Dezvoltat de Isaac Councill și C. Lee Giles la Colegiul de Științe și Tehnologie a Informației al Universității de Stat din Pennsylvania , continuă să urmărească același scop ca CiteSeer de cernere și colectare de documente academice și științifice în rețeaua publică, asigurând indexarea acestora. pe baza citărilor și pentru a le clasifica în funcție de impactul citărilor în sine. Recent, a fost adăugată o funcție de căutare a tabelelor. [2] Proiectul a fost finanțat de National Science Foundation , NASA și Microsoft Research .

CiteSeerX continuă să fie clasificat drept unul dintre cele mai bune repertorii din lume și chiar clasat pe locul 1 în iulie 2010. [3] În prezent are peste 2 milioane de documente cu aproape 2 milioane de autori exclusivi și 40 de milioane de citate.

CiteSeerX partajează, de asemenea, software, date, baze de date și metadate cu alți cercetători, în prezent prin Amazon S3 și rsync . [4] Noua sa arhitectură și noul său software modular „open source” (disponibil pe SourceForge ) sunt construite pe Apache Solr și alte instrumente Apache și open source, permițându-i să servească drept apel de testare pentru noi algoritmi de colectare, sortare și indexare a extragerea documentelor și informațiilor.

Alte motoare de căutare bazate pe SeerSuite

Modelul CiteSeer a fost adoptat pentru lucrări academice în scopuri comerciale cu SmealSearch și pentru comerțul electronic cu eBizSearch , dar proiectele au fost ulterior abandonate din cauza dezangajării sponsorilor. Au fost construite alte sisteme de căutare și repertoriu asemănătoare Seerului pentru chimie ( Chem X Seer ) și arheologie (ArchSeer), precum și pentru căutarea fișierelor robots.txt ( BotSeer ). Toate aceste sisteme se bazează pe instrumentul open source SeerSuite , care utilizează indexatorul Lucene .

Notă

  1. ^ a b Despre CiteSeerX , pe citeseerx.ist.psu.edu . Adus pe 7 mai 2010 .
  2. ^ Echipa CiteSeerX , la citeseerx.ist.psu.edu , Universitatea de Stat din Pennsylvania. Adus la 24 iulie 2010 (arhivat din original la 26 ianuarie 2010) .
  3. ^ Clasament web al repozitoarelor mondiale: Top 800 de depozite , pe repositories.webometrics.info , Cybermetrics Lab, iulie 2010. Accesat la 24 iulie 2010 (arhivat din original la 24 iulie 2010) .
  4. ^ Despre CiteSeerX Data , la csxstatic.ist.psu.edu , Pennsylvania State University. Adus la 25 ianuarie 2012 (arhivat din original la 5 ianuarie 2012) .

Lecturi suplimentare

Elemente conexe

linkuri externe