Lucene

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Lucene
software
Siglă
Tip Interfață de programare a aplicației (nu este listată )
Dezvoltator Apache Software Foundation
Ultima versiune 8.9.0 (16 iunie 2021)
Sistem de operare Multiplatform
Limba Java
Licență Licență Apache 2.0
( licență gratuită )
Site-ul web lucene.apache.org

Lucene este un API gratuit și open source de recuperare a informațiilor implementat inițial în Java de Doug Cutting . Este susținut de Apache Software Foundation și este disponibil sub licența Apache . Lucene a fost ulterior reimplementat în Perl , C # , C ++ , Python , Ruby și PHP .

Deși conceput pentru a crea aplicații care necesită funcții de indexare și căutare a textului complet , Lucene este bine cunoscut și utilizat pentru crearea motoarelor de căutare atât pe World Wide Web, cât și pe Intranet-uri private. Acest lucru a condus la afirmarea percepției produsului ca motor de căutare echipat cu un păianjen web și un analizor HTML. În realitate, utilizarea Lucene necesită ca aceste module să fie furnizate extern.

Am reușit să Lucene datele sunt reprezentate ca documente (document) cu câmpuri (câmpuri) text. Această genericitate vă permite să creați, cu API-ul Lucene, produse independente de formatul fișierului: textele în PDF , HTML , Microsoft Word precum și în orice alt tip de fișier din care este posibil să extrageți informații pot fi indexate cu Lucene.

Lucene a fost, de asemenea, reimplementat (sau este reimplementat) în C, C ++, Delphi, C # /. NET, Perl, Ruby, PHP și Common Lisp.

Software-ul de căutare text Apache Tika a fost un subproiect al Lucene pentru o vreme, înainte de a deveni autonom în 2007.

Software care utilizează Lucene

  • Wikipedia folosește Lucene pentru căutări cu text integral.
  • Beagle folosește o versiune rescrisă C # a lui Lucene numită Lucene.net ca indexator.
  • DSpace folosește Lucene.
  • CNET folosește Lucene pentru căutări în categoriile sale de produse.
  • Nutch este un motor de căutare cuprinzător care folosește Lucene.
  • Zimbra groupware încorporează Lucene.
  • ANts P2P folosește Lucene pentru opțiunea „căutare”.
  • Alfresco , open source CMS corporativ.
  • La Repubblica folosește Lucene (prin Solr) pentru căutarea textului complet și fațetarea / navigarea în serviciul de anunțuri.

O listă mai exhaustivă de software care utilizează Lucene poate fi găsită pe pagina PoweredBy a wiki-ului Lucene.

Elemente conexe

linkuri externe

Controlul autorității GND ( DE ) 4800725-0