Webクエリ

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

WebクエリまたはWeb検索クエリは、ユーザーが情報のニーズを満たすためにWeb検索エンジンに入力するクエリですWeb検索クエリは、プレーンテキストであることが多く、ブール検索ディレクティブが使用されることはめったにないという点で特徴的です。これらは、キーワードまたは位置パラメータを持つコマンド言語として厳密な構文規則によって管理される標準のクエリ言語とは大きく異なります

タイプ

ほとんどのウェブ検索クエリをカバーする3つの広いカテゴリがあります:情報、ナビゲーション、およびトランザクション。[1]これらは「行う、知る、行く」とも呼ばれます。[2]この検索モデルは理論的には導き出されていませんが、分類は実際の検索エンジンクエリで経験的に検証されています。[3]

  • 情報クエリ–何千もの関連する結果が得られる可能性のある幅広いトピック(コロラドトラックなど)をカバーするクエリ。
  • ナビゲーションクエリ–単一のWebサイトまたは単一のエンティティのWebページ(たとえば、YouTubeまたはデルタ航空)を検索するクエリ。
  • トランザクションクエリ–車の購入やスクリーンセーバーのダウンロードなど、特定のアクションを実行するユーザーの意図を反映したクエリ。

検索エンジンは、使用頻度がはるかに低い4番目のタイプのクエリをサポートすることがよくあります。

  • 接続性クエリ–インデックス付けされたWebグラフの接続性を報告するクエリ(たとえば、このURLを指すリンクはどれですか?、このドメイン名からインデックス付けされたページ数は?)。[4]

特徴

検索クエリの検索候補のリスト

ほとんどの商用Web検索エンジンは検索ログを開示しないため、ユーザーがWeb上で何を検索しているかに関する情報を入手するのは困難です。[5]それにもかかわらず、調査研究は1998年に登場し始めました。[6] [7] Excite検索エンジンからのクエリを分析した2001年の調査[8]は、Web検索のいくつかの興味深い特徴を示しました。

  • クエリの平均の長さは2.4用語でした。
  • ユーザーの約半数が単一のクエリを入力し、ユーザーの3分の1弱が3つ以上の固有のクエリを入力しました。
  • ユーザーの半数近くが、結果の最初の1ページまたは2ページのみを調べました(1ページあたり10件の結果)。
  • ユーザーの5%未満が、高度な検索機能(AND、OR、NOTなどのブール演算子など)を使用していました。
  • 最も頻繁に使用された上位4つの用語は、(空の検索)、および、の、および性別でした。

同じExciteクエリログの調査では、クエリの19%に地理的な用語(地名、郵便番号、地理的特徴など)が含まれていることが明らかになりました。[9]

調査によると、短いクエリ(用語が少ないクエリ)に加えて、ユーザーがクエリを変更する方法の予測可能なパターンがあります。[10]

Yahooのクエリログに関する2005年の調査では、同じユーザーからのクエリの33%が繰り返しクエリであり、87%の場合にユーザーが同じ結果をクリックすることが明らかになりました。[11]これは、多くのユーザーが繰り返しクエリを使用して情報を再訪または再検索していることを示唆しています。この分析は、クエリの約30%がナビゲーションクエリであると述べたBing検索エンジンのブログ投稿によって確認されています。[12]

さらに、調査によると、クエリ用語の度数分布はべき法則、つまりロングテール分布曲線に準拠しています。つまり、大きなクエリログで観察された用語のごく一部(たとえば、1億を超えるクエリ)が最も頻繁に使用され、残りの用語は個別に使用される頻度は低くなります。[13]このパレートの法則(または80–20ルール)の例により、検索エンジンはインデックスやデータベースのパーティショニングキャッシングなどの最適化手法を採用できます。とプリフェッチ。さらに、Webクエリがナビゲーション、情報、またはトランザクションのいずれであるかを認識できる言語指向の属性についての調査が実施されました。[14]

2011年の調査によると、クエリの平均の長さは時間の経過とともに着実に増加し、英語以外の言語のクエリの平均の長さは英語のクエリよりも増加しました。[15] Googleは、より多くの検索が会話型であるため、より長い検索クエリを処理するために2013年8月にハチドリの更新を実装しました(たとえば、「最寄りのコーヒーショップはどこですか?」)。[16]

構造化クエリ

ブール演算子と括弧をサポートする検索エンジンを使用すると、図書館員が従来使用していた手法を適用できます。いくつかのトピックまたはファセットをカバーするドキュメントを探しているユーザーは、などの特徴的な単語の論理和によってそれらのそれぞれを説明したい場合がありますvehicles OR cars OR automobilesファセットクエリは、そのようなファセットの組み合わせです(electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)たとえば、 「電子」または「投票」、あるいはその両方という単語の1つが省略されている場合でも、電子投票に関するドキュメントが見つかる可能性が高いなどのクエリ。[17]

も参照してください

参考文献

  1. ^ Broder、A。(2002)。Web検索の分類法。SIGIRフォーラム、36(2)、3–10。
  2. ^ ギボンズ、ケビン(2013-01-11)。「実行、認識、実行:購入サイクルの各段階でコンテンツを作成する方法」検索エンジンウォッチ2014年5月24日取得
  3. ^ Jansen、BJ、Booth、D。、およびSpink、A。(2008)、情報処理および管理の情報、ナビゲーション、およびトランザクションの意図の決定。44(3)、1251-1266。
  4. ^ ムーア、ロス。「接続サーバー」ケンブリッジ大学出版局2014年5月24日取得
  5. ^ Dawn Kawamoto and Elinor Mills(2006)、 AOLはユーザー検索データの公開をお詫びします
  6. ^ Jansen、BJ、Spink、A.、Bateman、J。、およびSaracevic、T.1998。実際の情報検索:Webでのユーザークエリの調査SIGIRフォーラム、32(1)、5-17。
  7. ^ Silverstein、C.、Henzinger、M.、Marais、H。、およびMoricz、M。(1999)。非常に大きなWeb検索エンジンのクエリログの分析SIGIRフォーラム、33(1)、6–12。
  8. ^ アマンダ・スピンク; ディートマー・ウォルフラム; メジャーBJヤンセン; テフコサラセビッチ(2001)。「ウェブの検索:一般の人々とその質問」(PDF)アメリカ情報科学技術学会誌52(3):226–234。CiteSeerX10.1.1.23.9800_ doi10.1002 / 1097-4571(2000)9999:9999 <:: AID-ASI1591> 3.3.CO; 2-I  
  9. ^ Mark Sanderson&Janet Kohler(2004)。「地理的クエリの分析」地理情報に関するワークショップ(SIGIR '04)の議事録
  10. ^ Jansen、BJ、Booth、DL、&Spink、A。(2009)Web検索中のクエリ変更のパターンアメリカ情報科学技術学会誌。60(3)、557-570。60(7)、1358-1371。
  11. ^ Jaime Teevan; エイタンアダール; ロージージョーンズ; マイケルポッツ(2005)。「履歴は繰り返されます:Yahooのクエリログでクエリを繰り返します」(PDF)情報検索における研究開発に関する第29回ACM会議(SIGIR '06)の議事録pp。703–704。土井10.1145 /1148170.1148326 [永久リンク切れ]
  12. ^ http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx [リンク切れ]
  13. ^ リカルドバエザ-イェーツ(2005)。「Webクエリマイニングのアプリケーション」。情報検索の進歩コンピュータサイエンスの講義ノート。3408.スプリンガーベルリン/ハイデルベルク。pp。7–22。土井10.1007 / 978-3-540-31865-1_2ISBN 978-3-540-25295-5
  14. ^ アレハンドロフィゲロア(2015)。「Webクエリの背後にあるユーザーの意図を認識するための効果的な機能の調査」業界のコンピュータエルゼビア。68:162–169。土井10.1016 /j.compind.2015.01.005
  15. ^ モナタガビ; アフマド・パテル; ニキータシュミット; クリストファーウィルズ; Yiqi Tew(2011)。「検索エンジンのクエリ分散パターンアプローチによるWebプロキシログの分析」。Journal of Computer Standards&Interfaces34(1):162–170。土井10.1016 /j.csi.2011.07.001
  16. ^ サリバン、ダニー(2013-09-26)。「FAQ:新しいGoogleの「ハチドリ」アルゴリズムのすべて」検索エンジンランド2014年5月24日取得
  17. ^ VojkanMihajlović; ジェルド・ヒエムストラ; ヘンク・エルンスト・ブロック; Peter MG Apers(2006年10月)。「クエリ構造とドキュメント構造を活用してドキュメント検索の有効性を向上させる」(PDF) {{cite journal}}引用ジャーナルには|journal=ヘルプ)が必要です