検索エンジン

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ
ウェブベースの画像検索エンジンで「月食」という用語を検索した結果

検索エンジンは、Web検索を実行するように設計されソフトウェアシステムです。彼らは、テキストのWeb検索クエリ指定された特定の情報を体系的に検索します検索結果は通常、検索エンジン結果ページ(SERP)と呼ばれる一連の結果で表示されます。情報は、 Webページ、画像、ビデオ、インフォグラフィック、記事、研究論文、およびその他の種類のリンクの組み合わせである場合があります。ファイル。一部の検索エンジンは、データベースまたはオープンディレクトリで利用可能なデータもマイニングします。ようではない人間の編集者によってのみ維持されるWebディレクトリ、検索エンジンはWebクローラーでアルゴリズムを実行することによってリアルタイム情報も維持します。ウェブ検索エンジンで検索できないインターネットコンテンツは、一般的にディープウェブと呼ばれます。

歴史

タイムライン(全リスト
エンジン 現在のステータス
1993年 W3カタログ アクティブ
Aliweb アクティブ
JumpStation 非活性
WWWワーム 非活性
1994年 WebCrawler アクティブ
Go.com 非アクティブ、ディズニーにリダイレクト
ライコス アクティブ
インフォシーク 非アクティブ、ディズニーにリダイレクト
1995年 Yahoo! 検索 アクティブ、最初はYahoo!の検索機能 ディレクトリ
ダウム アクティブ
マゼラン 非活性
エキサイト アクティブ
SAPO アクティブ
MetaCrawler アクティブ
AltaVista 非アクティブ、Yahoo!が買収 2003年、2013年以降はYahoo!にリダイレクトされます。
1996年 ランクデックス 非アクティブ、 2000年 にBaiduに組み込まれました
ドッグパイル アクティブ、アグリゲーター
インクトミ 非アクティブ、Yahoo!が買収
HotBot アクティブ
ジーブスに聞く アクティブ(リブランドされたask.com)
1997年 AOL NetFind アクティブ(1999年から AOL Searchのブランド名を変更)
ノーザン・ライト 非活性
Yandex アクティブ
1998年 グーグル アクティブ
Ixquick Startpage.comとしてアクティブ
MSN検索 Bingとしてアクティブ
エンパス 非アクティブ(NATEとマージ)
1999年 AlltheWeb 非アクティブ(URLはYahoo!にリダイレクトされます)
GenieKnows アクティブでブランド変更されたYellowee(justlocalbusiness.comへのリダイレクト)
ネイバー アクティブ
テオマ アクティブ(©APN、LLC)
2000 Baidu アクティブ
Exalead 非活性
ギガブラスト アクティブ
2001年 Kartoo 非活性
2003年 Info.com アクティブ
2004年 A9.com 非活性
Clusty アクティブ(Yippyとして)
モジーク アクティブ
捜狗 アクティブ
2005年 私を探して 非活性
KidzSearch アクティブなGoogle検索
2006年 まあまあ 非アクティブ、捜狗と合併
Quaero 非活性
Search.com アクティブ
ChaCha 非活性
Ask.com アクティブ
ライブ検索 Bingとしてアクティブ、ブランド変更されたMSN検索
2007年 wikiseek 非活性
Sproose 非活性
Wikia Search 非活性
Blackle.com アクティブなGoogle検索
2008年 パワーセット 非アクティブ(Bingにリダイレクト)
ピコレーター 非活性
Viewzi 非活性
ブーガミ 非活性
LeapFish 非活性
フォレストル 非アクティブ(Ecosiaにリダイレクト)
DuckDuckGo アクティブ
2009年 Bing アクティブでブランド変更されたライブ検索
イェボル 非活性
Mugurdy 資金不足のため非アクティブ
スカウト(ハゼ) アクティブ
NATE アクティブ
エコシア アクティブ
Startpage.com Ixquickのアクティブな姉妹エンジン
2010年 ブレッコ 非アクティブ、IBMに販売
キュイル 非活性
Yandex(英語) アクティブ
パルシジョー アクティブ
2011 YaCy アクティブ、P2P
2012年 ヴォルニア 非活性
2013年 Qwant アクティブ
2014年 エゲリン アクティブ、クルド人/ソラニー
スイスカウズ アクティブ
Searx アクティブ
2015年 ユズ アクティブ
Cliqz 非活性
2016年 キドル アクティブなGoogle検索
2020 花弁 アクティブ

1990年代以前

増え続ける科学研究の集中インデックスで情報を見つけることのますます困難になることを克服することを目的とした公開情報を見つけるためのシステムは、1945年にVannevar Bushによって説明されました。彼は、 The AtlanticMonthlyに「 AsWeMayThinkというタイトルの記事を書きました[1 ]彼は、現代のハイパーリンクとは異なり、接続された注釈を備えた研究のライブラリを構想しました[2] リンク分析は、最終的にはHyperSearchやPageRankなどのアルゴリズムを介した検索エンジンの重要なコンポーネントなります[3] [4]

1990年代:検索エンジンの誕生

最初のインターネット検索エンジンは1990年12月のWebのデビューに先立っています。WHOISユーザー検索は1982年にさかのぼり[5]Knowbot InformationServiceマルチネットワークユーザー検索は1989年に最初に実装されました。[6]最初の十分に文書化された検索コンテンツファイル、つまりFTPファイルを検索するエンジンは、1990年9月10日にデビューしたArchieでした。 [7]

1993年9月以前は、ワールドワイドウェブは完全に手作業で索引付けされていました。Tim Berners-Leeによって編集され、 CERNWebサーバーでホストされているWebサーバーのリストがありました1992年のリストのスナップショットが1つ残っていますが[8]、ますます多くのWebサーバーがオンラインになるにつれて、中央のリストはもはや追いつくことができなくなりました。NCSAサイトでは、 「What'sNew!」というタイトルで新しいサーバーが発表されました。[9]

インターネット上で(ユーザーではなく)コンテンツを検索するために使用された最初のツールArchieでした。[10]名前は「v」のない「アーカイブ」を表します。[11] AlanEmtageによって作成されました[11] [12] [13] [14] カナダのケベックモントリオールにあるマギル大学のコンピュータサイエンスの学生プログラムは、パブリック匿名FTP(ファイル転送プロトコル)サイトにあるすべてのファイルのディレクトリリストをダウンロードし、ファイル名の検索可能なデータベースを作成しました。ただし、Archie検索エンジンデータ量が限られているため、手動で簡単に検索できるため、これらのサイトのコンテンツのインデックスを作成しませんでした。

Gopher (1991年にミネソタ大学のMark McCahillによって作成された)の台頭により、2つの新しい検索プログラムであるVeronicaJugheadが生まれました。Archieと同様に、Gopherインデックスシステムに保存されているファイル名とタイトルを検索しました。Veronica(Very E asy R odent - O riented N et-wide I ndex to C omputerized A rchives)は、Gopherリスト全体でほとんどのGopherメニュータイトルのキーワード検索を提供しました。Jughead(J onzy's U niversal G opherH ierarchy E xcavation A nd D isplay)は、特定のGopherサーバーからメニュー情報を取得するためのツールでした。検索エンジン「 ArchieSearchEngine」の名前は、 Archieコミックシリーズを指すものではありませんでしたが、「 Veronica」と「Jughead」はシリーズのキャラクターであり、前作を指しています。

1993年の夏、ウェブ用の検索エンジンは存在しませんでしたが、多数の専門カタログが手作業で管理されていました。ジュネーブ大学のOscarNierstraszは、これらのページを定期的にミラーリングして標準形式に書き直す一連のPerlスクリプトを作成しました。これは、1993年9月2日にリリースされたWeb初のプリミティブ検索エンジンであるW3Catalogの基礎を形成しました。 [15]

1993年6月、当時MITにいたマシューグレイは、おそらく最初のWebロボットであるPerlベースのWorld Wide Web Wandererを作成し、それを使用して「Wandex」と呼ばれるインデックスを生成しました。放浪者の目的は、1995年後半まで行っていたワールドワイドウェブのサイズを測定することでした。ウェブの2番目の検索エンジンAliwebは1993年11月に登場しました。Aliwebはウェブロボットを使用せず、代わりにウェブサイトからの通知に依存していました。特定の形式のインデックスファイルの各サイトに存在する 管理者。

JumpStation(1993年12月[16]Jonathon Fletcherによって作成された)は、Webロボットを使用してWebページを検索し、そのインデックスを作成し、Webフォームをクエリプログラムへのインターフェイスとして使用しました。したがって、これは、以下に説明するように、Web検索エンジンの3つの重要な機能(クロール、インデックス作成、および検索)を組み合わせた最初のWWWリソース検出ツールでした。実行したプラットフォームで利用できるリソースが限られているため、インデックス作成と検索は、クローラーが検出したWebページで見つかったタイトルと見出しに限定されていました。

最初の「全文」クローラーベースの検索エンジンの1つは、1994年にリリースされたWebCrawlerでした。以前の検索エンジンとは異なり、ユーザーは任意のWebページで任意の単語を検索でき、それ以降、すべての主要な検索エンジンの標準になりました。それはまた、一般に広く知られている検索エンジンでもありました。また、1994年には、Lycosカーネギーメロン大学で開始)が立ち上げられ、主要な商業活動になりました。

Webで最初に人気のある検索エンジンはYahoo!でした。検索[17] Yahoo!の最初の製品 1994年1月にJerryYangDavidFiloによって設立された、 Yahoo!というWebディレクトリでした。ディレクトリ1995年に検索機能が追加され、ユーザーはYahoo!を検索できるようになりました。ディレクトリ![18] [19]関心のあるWebページを見つけるための最も一般的な方法の1つになりましたが、検索機能はWebページのフルテキストコピーではなく、Webディレクトリで動作していました。

その後すぐに、多くの検索エンジンが登場し、人気を争いました。これらには、 MagellanExciteInfoseekInktomiNorthern Light、およびAltaVistaが含まれます。情報探索者は、キーワードベースの検索を行う代わりに、ディレクトリを参照することもできます。

1996年、Robin Liは検索エンジンの結果ページランキング用のRankDexサイトスコアリングアルゴリズムを開発し[20] [21] [22]、この技術の米国特許を取得しました。[23]これは、インデックスを作成するWebサイトの品質を測定するためにハイパーリンクを使用した最初の検索エンジンであり[24] 2年後の1998年にGoogleが出願した非常に類似したアルゴリズムの特許よりも前のものでした。 PageRankの彼の米国特許の。[26] Liは後にBaiduに彼のRankdexテクノロジーを使用しました 中国のロビン・リーによって設立され、2000年に発売された検索エンジン。

1996年、Netscapeは、NetscapeのWebブラウザの注目の検索エンジンとして、単一の検索エンジンに独占的な取引を提供することを検討していました。非常に多くの関心があったため、代わりにNetscapeは5つの主要な検索エンジンと取引を行いました。年間500万ドルで、各検索エンジンはNetscape検索エンジンページでローテーションされます。5つのエンジンは、Yahoo!、Magellan、Lycos、Infoseek、およびExciteでした。[27] [28]

Googleは、 goto.comという名前の小さな検索エンジン会社から1998年に検索用語を販売するというアイデアを採用しましたこの動きは、検索エンジン事業に大きな影響を及ぼしました。検索エンジン事業は、苦戦からインターネットで最も収益性の高い事業の1つになりました。[29]

検索エンジンは、1990年代後半に発生したインターネット投資狂乱の中で最も輝かしいスターの一部としても知られていました。[30]いくつかの企業が見事に市場に参入し、新規株式公開中に記録的な利益を上げました。一部の企業は公開検索エンジンを停止し、NorthernLightなどの企業専用エディションを販売しています。多くの検索エンジン企業は、1990年にピークに達し、2000年に終わった投機主導の市場ブームで あるドットコムバブルに巻き込まれました。

2000年代〜現在:ドットコムバブルの投稿

2000年頃、Googleの検索エンジンは目立つようになりました。[31]同社は、後のGoogleの創設者であるSergeyBrinLarryPageが書いた論文Anatomyof a Search Engineで説明されているように、 PageRankと呼ばれるアルゴリズムを使用して多くの検索でより良い結果を達成しました。[4]この反復アルゴリズムは、他のWebサイトとそこにリンクしているページの数とPageRankに基づいて、良いページまたは望ましいページが他のページよりもリンクされていることを前提として、Webページをランク付けします。PageRankに対するLarryPageの特許は、 RobinLiの以前のRankDex特許を影響力として引用しています。[26]Googleはまた、検索エンジンへの最小限のインターフェースを維持しました。対照的に、競合他社の多くはWebポータルに検索エンジンを組み込んでいます。実際、Googleの検索エンジンは非常に人気があり、ミステリーシーカーなどのなりすましエンジンが登場しました

2000年までに、Yahoo!Inktomiの検索エンジンに基づいた検索サービスを提供していました。Yahoo! 2002年にInktomiを買収し、2003年にOverture ( AlltheWebとAltaVistaを所有)を買収しました。Yahoo!グーグルが買収の技術を組み合わせた独自の検索エンジンを立ち上げた2004年まで、グーグルの検索エンジンに切り替えた。

Microsoftは、Inktomiの検索結果を使用して、1998年の秋に最初にMSNSearchを開始しました。1999年の初めに、サイトはInktomiの結果とブレンドされたLooksmartのリストの表示を開始しました。1999年の短期間、MSNSearchは代わりにAltaVistaの結果を使用しました。2004年、Microsoftは、独自のWebクローラーmsnbotと呼ばれる)を搭載した独自の検索テクノロジへの移行を開始しました

Microsoftのリブランドされた検索エンジンであるBingは、2009年6月1日に発売されました。2009年7月29日、Yahoo!マイクロソフトはYahoo! 検索は、MicrosoftBingテクノロジによって強化されます。

2019年現在、アクティブな検索エンジンクローラーには、GooglePetalSogouBaiduBingGigablastMojeekDuckDuckGoYandexが含まれます。

アプローチ

検索エンジンは、ほぼリアルタイムで次のプロセスを維持します。

  1. Webクロール
  2. インデックス作成
  3. 検索[32]

Web検索エンジンは、サイト間をWebクロールすることで情報を取得します。「スパイダー」は、それにアドレス指定された標準ファイル名robots.txtをチェックします。robots.txtファイルには、検索スパイダーのディレクティブが含まれており、クロールするページとクロールしないページを指定します。robots.txtをチェックし、それを見つけたかどうかにかかわらず、スパイダーは、タイトル、ページコンテンツ、 JavaScriptカスケードスタイルシート(CSS)、見出し、またはそのメタデータなどの多くの要因に応じて、インデックスに登録される特定の情報を送り返します。 HTMLメタタグクロールされた特定のページ数、インデックスに登録されたデータの量、またはWebサイトで費やされた時間が経過すると、スパイダーはクロールを停止して先に進みます。「[N] oウェブクローラーは実際に到達可能なウェブ全体をクロールする可能性があります。無限のウェブサイト、スパイダートラップ、スパム、および実際のウェブの他の緊急事態のため、クローラーは代わりにクロールポリシーを適用して、サイトのクロールをいつ考慮すべきかを決定します一部のWebサイトは徹底的にクロールされますが、他のWebサイトは部分的にしかクロールされません。」[33]

インデックス作成とは、Webページで見つかった単語やその他の定義可能なトークンをドメイン名やHTMLベースのフィールドに関連付けることを意味します。関連付けは公開データベースで行われ、Web検索クエリで利用できるようになります。ユーザーからのクエリは、単一の単語、複数の単語、または文にすることができます。インデックスは、クエリに関連する情報をできるだけ早く見つけるのに役立ちます。[32]インデックス作成とキャッシングの手法のいくつかは企業秘密ですが、Webクロールは、体系的にすべてのサイトにアクセスする簡単なプロセスです。

スパイダーによる訪問の間に、検索エンジンの作業メモリーに保存されているページのキャッシュされたバージョン(ページをレンダリングするために必要なコンテンツの一部またはすべて)が、照会者にすばやく送信されます。訪問が遅れている場合、検索エンジンは代わりにWebプロキシとして機能することができます。この場合、ページは索引付けされた検索語と異なる場合があります。[32]キャッシュされたページは、以前に単語が索引付けされたバージョンの外観を保持しているため、キャッシュされたバージョンのページは、実際のページが失われたときにWebサイトに役立つ可能性がありますが、この問題は軽度のリンク切れと見なされます。

標準のWebクローラーの高レベルのアーキテクチャ

通常、ユーザーが検索エンジンにクエリを入力するとき、それはいくつかのキーワードです。[34]インデックスにはすでにキーワードを含むサイトの名前があり、これらはインデックスから即座に取得されます。実際の処理負荷は、検索結果リストであるWebページを生成することです。リスト全体のすべてのページは、インデックス内の情報に従って重み付けする必要があります。[32]次に、最上位の検索結果アイテムには、スニペットの検索、再構築、およびマークアップが必要です。一致したキーワードのコンテキストを表示します。これらは、各検索結果Webページが必要とする処理の一部にすぎず、他のページ(上部の隣)では、この後処理がさらに必要になります。

単純なキーワード検索に加えて、検索エンジンは、検索結果を絞り込むための独自のGUIまたはコマンド駆動型の演算子と検索パラメーターを提供します。これらは、最初の検索結果の最初のページを前提として、検索結果を絞り込みながらフィルタリング重み付けを行うことで、ユーザーが作成するフィードバックループに関与するユーザーに必要なコントロールを提供します。たとえば、2007年以降、Google.comの検索エンジンでは、最初の検索結果ページの左端の列にある[検索ツールを表示]をクリックし、目的の日付範囲を選択することで、日付でフィルタリングできるようになりました。[35]各ページには変更時刻があるため、日付で重み付けすることもできます。ほとんどの検索エンジンは、ブール演算子AND、OR、およびNOTは、エンドユーザーが検索クエリを絞り込むのに役立ちます。ブール演算子は、ユーザーが検索の用語を絞り込んだり拡張したりできるリテラル検索用です。エンジンは、入力されたとおりに単語またはフレーズを検索します。一部の検索エンジンは、ユーザーがキーワード間の距離を定義できる近接検索と呼ばれる高度な機能を提供します。[32]コンセプトベースの検索あり、検索する単語やフレーズを含むページで統計分析を使用して調査を行います。

検索エンジンの有用性は、それが返す結果セットの関連性依存します。特定の単語やフレーズを含む何百万ものWebページが存在する場合がありますが、一部のページは他のページよりも関連性が高く、人気があり、信頼できる場合があります。ほとんどの検索エンジンは、「最良の」結果を最初に提供するために結果をランク付けする方法を採用しています。検索エンジンがどのページが最も一致するかを決定する方法、および結果を表示する順序は、エンジンごとに大きく異なります。[32]インターネットの使用法が変化し、新しい技術が進化するにつれて、方法も時間とともに変化します。進化した検索エンジンには主に2つのタイプがあります。1つは、人間が広範囲にプログラムした、事前定義され階層的に順序付けられたキーワードのシステムです。もう1つは、見つけたテキストを分析して「転置インデックス」を生成するシステムです。この最初の形式は、作業の大部分を実行するためにコンピューター自体に大きく依存しています。

ほとんどのウェブ検索エンジンは広告収入によって支えられている商業ベンチャーであり、したがってそれらのいくつかは広告主が有料で検索結果で彼らのリストをより高くランク付けすることを可能にします。検索結果にお金を受け取らない検索エンジンは、通常の検索エンジンの結果と一緒に検索関連の広告を掲載することでお金を稼ぎます。検索エンジンは、誰かがこれらの広告の1つをクリックするたびにお金を稼ぎます。[36]

ローカル検索

ローカル検索は、ローカルビジネスの取り組みを最適化するプロセスです。彼らはすべての検索が一貫していることを確認するために変更に焦点を当てています。多くの人が検索に基づいてどこに行く予定で何を買うかを決めるので、それは重要です。[37]

市場シェア

2022年1月の時点でGoogleは世界で最も使用されている検索エンジンであり、市場シェアは92.01%であり、世界で最も使用されている検索エンジンはBingYahoo!BaiduYandex、およびDuckDuckGo[38]

ロシアと東アジア

ロシアでは、Yandexの市場シェアは61.9%ですが、Googleの28.3%です。[39]中国では、Baiduが最も人気のある検索エンジンです。[40]韓国の自家製検索ポータルであるNaverは、韓国のオンライン検索の70%に使用されています。[41] Yahoo! 日本Yahoo! 台湾は、それぞれ日本と台湾でインターネット検索の最も人気のある手段です。[42]中国は、Googleが市場シェアのトップ3のウェブ検索エンジンに含まれていない数少ない国の1つです。グーグルは以前は中国でトップの検索エンジンでしたが、検閲とサイバー攻撃に関する政府との意見の不一致の後で撤退しました。[43]

ヨーロッパ

セズナムが強力な競争相手であるチェコ共和国を除いて、欧州連合のほとんどの国の市場はグーグルによって支配されています。[44]

検索エンジンQwantはフランスのパリ拠点を置いており、月間登録ユーザー数5,000万人のほとんどをそこから集めています。

検索エンジンのバイアス

検索エンジンは、人気と関連性の組み合わせに基づいてWebサイトをランク付けするようにプログラムされていますが、経験的研究では、検索エンジンが提供する情報[45] [46]と、テクノロジーに関する基本的な仮定にさまざまな政治的、経済的、社会的バイアスがあることが示されています。[47]これらのバイアスは、経済的および商業的プロセス(たとえば、検索エンジンで広告を出す企業もその有機的な検索結果でより人気になる可能性がある)、および政治的プロセス(たとえば、準拠するための検索結果の削除)の直接的な結果である可能性があります現地の法律で)。[48]たとえば、Googleは、ホロコースト否認が行われているフランスとドイツの特定のネオナチのWebサイトを公開しません。違法です。

検索エンジンのアルゴリズムは、より「人気のある」結果を優先して非規範的な視点を除外するように設計されていることが多いため、バイアスは社会的プロセスの結果である可能性もあります。[49]主要な検索エンジンのインデックス作成アルゴリズムは、米国以外の国のWebサイトではなく、米国を拠点とするサイトのカバレッジに偏っています。[46]

グーグル爆弾は、政治的、社会的、または商業的な理由で検索結果を操作する試みの一例です。

何人かの学者は、検索エンジンによって引き起こされた文化的変化[50]と、アイルランドのテロリズム[51] 気候変動の否定[52]陰謀説などの特定の物議を醸すトピックの表現を研究しました[53]

カスタマイズされた結果とフィルターバブル

GoogleやBingなどの多くの検索エンジンは、ユーザーのアクティビティ履歴に基づいてカスタマイズされた結果を提供します。これは、フィルターバブルと呼ばれる効果につながります。この用語は、Webサイトがアルゴリズムを使用して、ユーザーに関する情報(場所、過去のクリック動作、検索履歴など)に基づいて、ユーザーが見たい情報を選択的に推測する現象を表します。その結果、ウェブサイトはユーザーの過去の視点に一致する情報のみを表示する傾向があります。これにより、ユーザーは反対の情報なしに知的孤立状態になります。代表的な例は、Googleのパーソナライズされた検索結果とFacebookのパーソナライズされたニュースストリームです。イーライパリサーによると、この用語を作り出したユーザーは、矛盾する視点にさらされる機会が少なくなり、独自の情報バブルに知的に孤立します。Pariserは、あるユーザーがGoogleで「BP」を検索してBritish Petroleumに関する投資ニュースを入手し、別の検索者がDeepwater Horizo​​nの油流出に関する情報を入手し、2つの検索結果ページが「著しく異なる」という例を紹介しました。[54] [55] [56]パリサーによれば、バブル効果は市民の言説に否定的な影響を与える可能性がある。[57]この問題が特定されて以来、 DuckDuckGoなどのユーザーを追跡または「バブリング」しないことでこの問題を回避しようとする競合する検索エンジンが出現しました。他の学者はパリサーの見解を共有せず、彼の論文を支持する証拠を説得力のないものとして見つけました。[58]

宗教的な検索エンジン

過去10年間のアラブイスラム世界におけるインターネットと電子メディアの世界的な成長により、中東アジアの亜大陸のイスラム信者は、独自の検索エンジン、ユーザーが安全な検索を実行します通常のセーフサーチフィルターよりも、これらのイスラムのWebポータルは、「イスラム法」の解釈に基づいて、 Webサイトを「ハラール」または「ハラーム」のいずれかに分類しますImHalalは2011年9月にオンラインになりました。Halalgoogling2013年7月にオンラインになりました。これらは、 GoogleBing(およびその他)のコレクションでハラームフィルターを使用しています。[59]

イスラム世界における技術への投資の欠如とペースの遅さは、イスラム検索エンジンの進歩を妨げ、成功を妨げましたが、イスラム教徒のライフスタイルサイトであるMuxlimのようなプロジェクトは、イスラム教徒のライフスタイルサイトであるMuxlimのようなプロジェクトがインターネットベンチャーを儀式し、それも衰退しました。他の宗教指向の検索エンジンは、Googleのユダヤ人バージョンであるJewogle [60]と、キリスト教徒であるSeekFind.orgです。SeekFindは、信仰を攻撃または低下させるサイトをフィルタリングします。[61]

検索エンジンの提出

Web検索エンジンの送信は、WebマスターがWebサイトを検索エンジンに直接送信するプロセスです。検索エンジンの提出は、Webサイトを宣伝する方法として提示されることもありますが、主要な検索エンジンはWebクローラーを使用し、最終的には支援なしでインターネット上のほとんどのWebサイトを見つけるため、通常は必要ありません。一度に1つのWebページを送信することも、サイトマップを使用してサイト全体を送信することもできますが、通常はホームページのみを送信する必要があります。検索エンジンがうまく設計されたウェブサイトをクロールすることができるので、ウェブサイトの。WebサイトまたはWebページを検索エンジンに送信する理由は残り2つです。検索エンジンがそれを検出するのを待たずに、まったく新しいWebサイトを追加することと、大幅な再設計後にWebサイトのレコードを更新することです。

一部の検索エンジン送信ソフトウェアは、複数の検索エンジンにWebサイトを送信するだけでなく、独自のページからWebサイトへのリンクを追加します。外部リンクはWebサイトのランキングを決定する最も重要な要素の1つであるため、これはWebサイトのランキングを上げるのに役立つように思われるかもしれません。ただし、 GoogleのJohn Muellerは、これは「サイトに膨大な数の不自然なリンクをもたらす可能性があり」、サイトのランキングに悪影響を与える可能性があると述べています。[62]

も参照してください

参考文献

  1. ^ 「検索エンジンHistory.com」www.searchenginehistory.com 2020年7月2日取得
  2. ^ 「ペンシルベニア州立大学WebAccessセキュアログイン」webaccess.psu.edu 2020年7月2日取得
  3. ^ マルキオーリ、マッシモ(1997)。「ウェブ上の正しい情報の探求:ハイパー検索エンジン」第6回国際ワールドワイドウェブ会議(WWW6)の議事録2021-01-10を取得
  4. ^ a b ブリン、セルゲイ; ページ、ラリー(1998)。「大規模なハイパーテキストWeb検索エンジンの構造」(PDF)第7回国際ワールドワイドウェブ会議(WWW7)の議事録2021-01-10を取得
  5. ^ 「RFC812-NICNAME / WHOIS」ietf.org
  6. ^ 「Knowbotプログラミング:モバイルエージェントのシステムサポート」cnri.reston.va.us
  7. ^ Deutsch、Peter(1990年9月11日)。「[次へ]インターネットアーカイブサーバーサーバー(以前はLispについてでした)」groups.google.com 2017年12月29日取得
  8. ^ 「ワールドワイドウェブサーバー」W3.org 2012年5月14日取得
  9. ^ 「新機能!1994年2月」Home.mcom.com 2012年5月14日取得
  10. ^ 「インターネットの歴史-検索エンジン」(検索エンジンウォッチから)、Universiteit Leiden、オランダ、2001年9月、Web: LeidenU-Archie
  11. ^ a bpcmag 「アーキー」pcmag.com 2020年9月20日取得
  12. ^ アレクサンドラ・サミュエル。「最初のインターネット検索エンジンであるARCHIEを発明した黒人技術者のAlanEmtageに会いましょう」イサカ2020年9月20日取得
  13. ^ ループニュースバルバドス。「アランエムテージ-あなたが知っておくべきバルバドス」loopnewsbarbados.com 2020年9月21日取得
  14. ^ ディノ・グランドーニ、アラン・エムテージ。「アラン・エムテージ:世界初の検索エンジンを発明した男(しかし、特許を取得しなかった)」huffingtonpost.co.uk _ 2020年9月21日取得
  15. ^ Oscar Nierstrasz(1993年9月2日)。「WWWリソースの検索可能なカタログ(実験的)」
  16. ^ 「NCSAのアーカイブ1993年12月の新機能ページ」2001-06-20。2001年6月20日にオリジナルからアーカイブされまし2012年5月14日取得
  17. ^ 「先発者とは何ですか?」SearchCIOTechTarget2005年9月2019年9月5日取得
  18. ^ オピッツ、マーカス; トムス、ピーター(2017)。クラウドセンチュリーの発明:曇りが私たちの生活、経済、テクノロジーをどのように変え続けるかスプリンガー。p。238. ISBN 9783319611617
  19. ^ 「Yahoo!検索」Yahoo! 1996年11月28日。1996年11月28日のオリジナルからアーカイブ2019年9月5日取得
  20. ^ Greenberg、Andy、「Googleを打ち負かす男」フォーブス誌、2009年10月5日
  21. ^ Yanhong Li、「定性的検索エンジンに向けて」、 IEEE Internet Computing、vol。2、いいえ。4、pp。24–29、7月/ 8月。1998、土井 10.1109 / 4236.707687
  22. ^ 「About:RankDex」 rankdex.com
  23. ^ USPTO、「ハイパーテキスト文書検索システムおよび方法」、米国特許番号:5920859、発明者:Yanhong Li、出願日:1997年2月5日、発行日:1999年7月6日
  24. ^ 「Baidu対Google:検索の双子の比較」FourWeekMBA2018年9月18日2019年6月16日取得
  25. ^ Altucher、James(2011年3月18日)。「Googleについての10の珍しいこと」フォーブス2019年6月16日取得
  26. ^ a b "リンクされたデータベースでのノードのランク付けの方法"Google特許。2015年10月15日にオリジナルからアーカイブされました2015年10月19日取得
  27. ^ 「Yahoo!とNetscapeInk International Distribution Deal」(PDF)2013年11月16日にオリジナル(PDF)からアーカイブされまし2009年8月12日取得
  28. ^ 「ブラウザの取引はNetscapeの在庫を7.8%押し上げる」ロサンゼルスタイムズ1996年4月1日。
  29. ^ パーセル、バート。検索エンジンペンシルベニア州立プレスブック2018年2月20日取得
  30. ^ ガンダル、ニール(2001)。「インターネット検索エンジン市場における競争のダイナミクス」産業組織の国際ジャーナル19(7):1103–1117。土井10.1016 / S0167-7187(01)00065-0
  31. ^ 「私たちの歴史の深さ」W3.org 2012年10月31日取得
  32. ^ a b c d e f Jawadekar、Waman S(2011)、「8。ナレッジマネジメント:ツールとテクノロジー」ナレッジマネジメント:テキストとケース、ニューデリー:Tata McGraw-Hill Education Private Ltd、p。278、ISBN 978-0-07-07-0086-4、 2012年11月23日取得
  33. ^ Dasgupta、Anirban; ゴーシュ、アルピタ; クマール、ラビ; オルストン、クリストファー; Pandey、Sandeep; とトムキンス、アンドリュー。Webの発見可能性http://www.arpitaghosh.com/papers/discoverability.pdf
  34. ^ Jansen、BJ、Spink、A。、およびSaracevic、T.2000。実際の​​生活、実際のユーザー、および実際のニーズ:Webでのユーザークエリの調査と分析。情報処理および管理36(2)、207-227。
  35. ^ Chitu、Alex(2007年8月30日)。「最近のWebページを見つける簡単な方法」Googleオペレーティングシステム2015年2月22日取得
  36. ^ 「検索エンジンはどのように機能しますか?」GFO = 2018年6月26日。
  37. ^ 「ローカルSEOとは何か&ローカル検索が重要である理由」検索エンジンジャーナル2020年4月26日取得
  38. ^ 「世界的な検索エンジンの市場占有率」StatCounterGlobalStats 2022年3月1日取得
  39. ^ 「ライブインターネット-サイト統計」ライブインターネット2014年6月4日取得
  40. ^ アーサー、チャールズ(2014-06-03)。「中国のテクノロジー企業は世界を支配する態勢を整えている」ガーディアン2014年6月4日取得
  41. ^ 「ネイバーが企業の生産性をどのように損なうか」ウォールストリートジャーナル2014-05-21 2014年6月4日取得
  42. ^ 「インターネット帝国の時代」オックスフォードインターネットインスティテュート2019年8月15日取得
  43. ^ Waddell、Kaveh(2016-01-19)。「グーグルが中国をやめた理由とそれが戻ってきた理由」大西洋2020年4月26日取得
  44. ^ Seznamはチェコ共和国でGoogleを引き受けますドズ。
  45. ^ Segev、El(2010)。グーグルとデジタルデバイド:オンライン知識のバイアス、オックスフォード:チャンドスパブリッシング。
  46. ^ a b Vaughan、Liwen; マイク・テルウォール(2004)。「検索エンジンのカバレッジバイアス:証拠と考えられる原因」。情報処理および管理40(4):693–707。CiteSeerX10.1.1.65.5130_ 土井10.1016 / S0306-4573(03)00063-3 
  47. ^ Jansen、BJおよびRieh、S。(2010)情報検索および情報検索の17の理論的構成アメリカ情報科学技術学会誌。61(8)、1517-1534。
  48. ^ Berkman Center for Internet&Society(2002)、「中国におけるGoogleの代替検索システムへの置き換え:ドキュメントとスクリーンショット」、ハーバードロースクール。
  49. ^ イントロン、ルーカス; ヘレン・ニッセンバウム(2000)。「ウェブの形成:検索エンジンの政治が重要である理由」。情報化社会16(3):169–185。CiteSeerX10.1.1.24.8051_ 土井10.1080 / 01972240050133634S2CID2111039_  
  50. ^ ヒリス、ケン; プチ、マイケル; ジャレット、カイリー(2012-10-12)。Googleと検索の文化ラウトレッジ。ISBN 9781136933066
  51. ^ Reilly、P。(2008-01-01)。スピンク、アマンダ博士; ジマー、マイケル(編)。「グーグル」テロリスト:北アイルランドのテロリストはインターネット検索エンジンで目に見えるか?情報科学と知識管理。14.スプリンガーベルリンハイデルベルク。pp。151–175。Bibcode2008wsis.book..151R土井10.1007 / 978-3-540-75829-7_10ISBN 978-3-540-75828-0S2CID84831583 _
  52. ^ 田淵博子、「気候変動に対する懐疑論者がGoogle検索でトップに立つ方法」、ニューヨークタイムズ、2017年12月29日。2018年11月14日取得。
  53. ^ Ballatore、A(2015)。「Googleケムトレイル:検索エンジンのトピック表現を分析する方法論」最初の月曜日20(7)。土井10.5210 /fm.v20i7.5597
  54. ^ パラモア、リン(2010年10月10日)。「フィルターバブル」大西洋2011年4月20日取得2009年12月4日以降、Googleはすべての人のためにパーソナライズされています。そのため、この春Google「BP」に2人の友人がいたとき、そのうちの1人はBPへの投資機会に関する一連のリンクを取得しました。もう1人は、油流出に関する情報を入手しました。
  55. ^ ワイスバーグ、ジェイコブ(2011年6月10日)。「バブルのトラブル:Webのパーソナライズは私たちを独我論的なひねりに変えていますか?」スレート2011年8月15日取得
  56. ^ グロス、ダグ(2011年5月19日)。「インターネットがあなたから隠しているもの」CNN 2011年8月15日取得油流出が起こっていたとき、私は友人のグーグルBPを持っていました。これらは多くの点で非常に似ていた2人の女性です。起こっていることと流出の環境への影響について多くの結果が得られました。もう1つは投資情報を入手しただけで、流出については何も知りませんでした。
  57. ^ 張、元曹; Séaghdha、DiarmuidÓ; ケルシア、ダニエル; ジャンバー、タマス(2012年2月)。「オーラリスト:音楽のレコメンデーションにセレンディピティを紹介する」(PDF)ACMWSDM土井10.1145 /2124295.2124300S2CID2956587_  
  58. ^ O'Hara、K。(2014-07-01)。「エコーの崇拝」。IEEEインターネットコンピューティング18(4):79–83。土井10.1109 /MIC.2014.71ISSN1089-7801_ S2CID37860225_  
  59. ^ 「イスラム教徒のための新しいイスラム教承認の検索エンジン」News.msn.com。2013年7月12日にオリジナルからアーカイブされました2013年7月11日取得
  60. ^ 「Jewogle-FAQ」
  61. ^ 「Halalgoogling:イスラム教徒は彼ら自身の「罪のない」グーグルを手に入れます;クリスチャンはクリスチャングーグルを持つべきですか?-クリスチャンブログ」クリスチャンブログ2013-07-25。
  62. ^ シュワルツ、バリー(2012-10-29)。「グーグル:検索エンジン提出サービスは有害である可能性がある」検索エンジン円卓会議2016年4月4日取得

さらに読む

外部リンク