Apache Lucene

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ
Lucene
Apache Lucenelogo.svg
開発者Apache Software Foundation
初回リリース1999 ; 23年前 (1999
安定リリース
9.0.0 / 2021年12月7日; 2か月前[1] (2021-12-07
リポジトリ
で書かれているJava
オペレーティング・システムクロスプラットフォーム
タイプ検索インデックス作成
ライセンスApacheライセンス2.0
Webサイトlucene .apache .org

Apache Luceneは、無料のオープンソース 検索エンジン ソフトウェアライブラリであり、元々はDougCuttingによってJavaで作成されました。これは、 Apache Software Foundationによってサポートされており、 Apache SoftwareLicenseの下でリリースされています。Luceneは、研究以外の検索アプリケーションの標準的な基盤として広く使用されています。[2] [3] [4]

Luceneは、Object PascalPerlC#C ++PythonRubyPHPなどの他のプログラミング言語に移植されています。[5]

歴史

DougCuttingは1999年にLuceneを最初に作成しました。 [6] Luceneは彼の5番目の検索エンジンであり、以前はXerox PARCで2つ、Appleで1つ、Exciteで4つを作成していました。[7]当初は、 SourceForgeWebサイトの自宅からダウンロードできました。2001年9月にApacheSoftware FoundationのオープンソースJava製品のJakartaファミリーに加わり、2005年2月に独自のトップレベルのApacheプロジェクトになりました。Luceneという名前は、ダグカッティングの妻のミドルネームであり、母方の祖母のファーストネームです。[8]

Luceneには、以前はLucene.NET、 MahoutTikaNutchなどの多くのサブプロジェクトが含まれていましたこれら3つは、現在、独立したトップレベルのプロジェクトです。

2010年3月、Apache Solr検索サーバーがLuceneサブプロジェクトとして参加し、開発者コミュニティを統合しました。

バージョン4.0は2012年10月12日にリリースされました。[9]

2021年3月、Luceneはロゴを変更し、ApacheSolrLuceneから独立したトップレベルのApacheプロジェクトになりました。

機能と一般的な使用法

Luceneは、全文索引付けおよび検索機能を必要とするすべてのアプリケーションに適していますが、インターネット検索エンジンおよびローカルの単一サイト検索の実装におけるその有用性が認められています。[10] [11]

Luceneには、編集距離に基づいてあいまい検索を実行する機能が含まれています[12]

Luceneは、レコメンデーションシステムの実装にも使用されています。[13]たとえば、Luceneの「MoreLikeThis」クラスは、同様のドキュメントの推奨事項を生成できます。「MoreLikeThis」の用語ベクトルベースの類似性アプローチと、共引用や共引用近接分析などの引用ベースのドキュメント類似性測定との比較では、Luceneのアプローチは、非常に類似した構造特性とより狭い関連性を持つドキュメントの推奨に優れていました。 。[14]対照的に、引用ベースのドキュメント類似性測定は、より広く関連するドキュメントを推奨するのに適している傾向がありました。[14]は、引用ベースのアプローチが偶然の生成に適している可能性があることを意味します推奨される文書に本文中の引用が含まれている限り、推奨。

Luceneベースのプロジェクト

Lucene自体は単なるインデックス作成および検索ライブラリであり、クロールおよびHTML解析機能は含まれていません。ただし、いくつかのプロジェクトがLuceneの機能を拡張しています。

も参照してください

参考文献

  1. ^ 「ApacheLuceneへようこそ」Lucene™ニュースセクション。2020年2月12日にオリジナルからアーカイブされました2020年2月12日取得
  2. ^ カンフィス、クリス; de Vries、Arjen P。; ボイトソフ、レオニード; リン、ジミー(2020)、ホセ、ジョーモンM。; Yilmaz、Emine; Magalhães、João; Castells、Pablo(eds。)、「どのBM25を意味しますか?スコアリングバリアントの大規模な再現性研究」情報検索の進歩、Cham:Springer International Publishing、12036:28–34、doi10.1007 / 978-3 -030-45442-5_4ISBN 978-3-030-45441-8PMC  7148026、2021-06-07取得
  3. ^ グランド、エイドリアン; ミュア、ロバート; フェレンツィ、ジム; リン、ジミー(2020)、ホセ、ジョーモンM。; Yilmaz、Emine; Magalhães、João; Castells、Pablo(eds。)、「MAXSCOREからBlock-Max Wandへ:Luceneがクエリ評価のパフォーマンスを大幅に向上させたストーリー」情報検索の進歩、Cham:Springer International Publishing、12036:20–27、doi10.1007 / 978-3-030-45442-5_3ISBN 978-3-030-45441-8PMC  7148045、2021-06-07取得
  4. ^ アッツォパルディ、リーフ; Moshfeghi、Yashar; マーティン・ハルヴィー; Alkhawaldeh、Rami S。; バログ、クリスチャン; ディ・ブッチョ、エマヌエーレ; Ceccarelli、ディエゴ; フェルナンデス-ルナ、フアンM。; ハル、チャーリー; マニックス、ジェイク; Palchowdhury、Sauparna(2017-02-14)。「Lucene4IR:Luceneを使用した情報検索評価リソースの開発」ACMSIGIRフォーラム50(2):58–75。土井10.1145 /3053408.3053421ISSN0163-5840_ 
  5. ^ 「LuceneImplementations」apache.org2015年10月6日にオリジナルからアーカイブされました2015年9月23日取得
  6. ^ KeywordAnalyzer 「ApacheLuceneとSolrによるより良い検索」(PDF)2007年11月19日。2012年1月31日のオリジナル(PDF)からアーカイブ。
  7. ^ カッティング、ダグ(2019-06-07)。「私はXeroxPARCでいくつかの検索エンジンを作成し、次にAppleでV-Twinを作成し、次にExciteの検索を書き直し、次にLuceneを作成しました。したがって、LuceneはV-Twin 3.0と見なされる可能性がありますか?ほぼ25年後、V-Twinはまだ生きていますMac OS X検索キットとしてオンに!」@cutting 2019年6月19日取得
  8. ^ バーカー、ディーン(2016)。Webコンテンツ管理オライリー。p。233. ISBN 978-1491908105
  9. ^ 「ApacheLucene-ApacheLuceneへようこそ」apache.org2016年2月4日にオリジナルからアーカイブされました2016年2月4日取得
  10. ^ McCandless、Michael; ハッチャー、エリック; Gospodnetić、Otis(2010)。Lucene in Action、第2版マニング。p。 8ISBN 978-1933988177
  11. ^ 「GNU / Linuxセマンティックストレージシステム」(PDF)glscube.org2010年6月1日にオリジナル(PDF)からアーカイブされました
  12. ^ 「ApacheLucene-クエリパーサー構文」lucene.apache.org2017年5月2日にオリジナルからアーカイブされました。
  13. ^ J. Beel、S。Langer、およびB. Gipp、「Docearの研究論文推薦システムのアーキテクチャとデータセット」、ACM / IEEE合同会議での第3回国際鉱業科学出版物ワークショップ(WOSP 2014)の議事録デジタルライブラリ(JCDL 2014)、ロンドン、英国、2014年
  14. ^ a b M. Schwarzer、M。Schubotz、N。Meuschke、C。Breitinger、V。Markl、およびB. Gipp、https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016。 pdf「ウィキペディアのリンクベースの推奨事項の評価」、第16回ACM / IEEE-CSデジタルライブラリに関する合同会議(JCDL)、ニューヨーク、ニューヨーク、米国、2016年、191〜200ページ。
  15. ^ 「コンパスとElasticsearchの未来」男は従います。2015年10月15日にオリジナルからアーカイブされました2015年10月14日取得
  16. ^ ウェイナー、ピーター。「今すぐ調べる価値のある11の最先端データベース」InfoWorld。2015年9月21日にオリジナルからアーカイブされました2015年9月21日取得
  17. ^ 「Elasticsearch:RESTful、分散検索および分析-Elastic」Elastic.co2015年10月8日にオリジナルからアーカイブされました2015年9月23日取得
  18. ^ a b Natividad、アンジェラ。「SocialtextUpdatesSearch、GoesKino」CMSワイヤー。2012年9月29日にオリジナルからアーカイブされました2011年5月31日取得
  19. ^ マーヴィンハンフリー。"KinoSearch-検索エンジンライブラリ。-metacpan.org"p3rl.org 2015年9月23日取得
  20. ^ ディメント、キーレン; トラウト、マットS(2009)。「CatalystCookbook」。Catalystの決定的なガイド押してください。p。 280ISBN 978-1-4302-2365-8
  21. ^ ウィシャート、DS ; etal。(2009年1月)。「HMDB:人間のメタボロームのための知識ベース」Nucleic AcidsRes。37(データベースの問題):D603–10。土井10.1093 / nar / gkn810PMC2686599_ PMID18953024_   
  22. ^ リム、エミリア; ポン、アリソン; ジュンボウ、ヤニック; ノックス、クレイグ; Shrivastava、Savita; Guo、An Chi; Neveu、Vanessa; ウィシャート、デビッドS.(2010年1月)。「T3DB:一般的な毒素とその標的の包括的に注釈が付けられたデータベース」Nucleic AcidsRes38(データベースの問題):D781–6。土井10.1093 / nar / gkp934PMC2808899_ PMID19897546_  

参考文献

外部リンク