noindex

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

HTMLロボットのメタタグnoindex値は、自動化されたインターネットボットがWebページのインデックス作成を回避することを要求します。[1] [2]このメタタグを使用する理由には、非常に大規模なデータベースにインデックスを付けないようにロボットにアドバイスする、非常に一時的なWebページ、開発中のWebページ、もう少し保持したいWebページなどがあります。プライベート、またはプリンターとモバイル対応バージョンのページ。ウェブサイトのnoindexタグを尊重する責任は検索ロボットの作成者にあるため、これらのタグが無視されることがあります。また、noindexタグの解釈は、検索エンジン会社ごとにわずかに異なる場合があります。

ページ全体のインデックスを作成しない

< html >
<>
  < meta  name = "robots"  content = "noindex" >
  <タイトル>このページのインデックスを作成しないでください</タイトル>
</ヘッド>

メタタグコンテンツに指定できる値は、「none」、「all」、「index」、「noindex」、「nofollow」、および「follow」です。値の組み合わせも可能です。たとえば 、 [1] :

< meta  name = "robots"  content = "noindex、follow" >

ボット固有のディレクティブ

noindexディレクティブは、メタタグで別の「name」値を指定することにより、特定のボットにのみ制限できます。

たとえば、Googleのボットを具体的にブロックするには、[3]次のように指定 します。

< meta  name = "googlebot"  content = "noindex" >

または、Bingのボットをブロックするには、次のように指定します。

< meta  name = "bingbot"  content = "noindex" >

または、BaidUuのボットをブロックするには、次のように指定します。

< meta  name = "baiduspider"  content = "noindex" >

robots.txtファイル

robots.txtファイルを使用してクロールをブロックできます

ページのインデックス付けされていない部分

ページ全体ではなく、ナビゲーションテキストなどのWebページの一部をインデックスから除外することもできます。これを行うにはさまざまな手法があります。複数を組み合わせて使用​​することが可能です。グーグルの主要なインデックススパイダーであるグーグルボットは、これらの技術のいずれかを認識することは知られていない。

<noindex>タグ

ロシアの検索エンジンYandexは、タグ間のコンテンツのインデックス作成を防ぐ新しい<noindex>タグを導入しました。ソースコードを検証できるようにするには、代わりに<!-noindex->​​を使用できます。[4]

< p >
このテキストにインデックスを付けてください。
< noindex >このテキストにインデックスを付けないでください。</ noindex > 
<!-noindex->このテキストのインデックスを作成しないでください。<!-/ noindex-> 
</ p >

Atomzを含む他のインデックススパイダーも<noindex>タグを認識します。[5]

microformat

同じ機能を備えた2005年のドラフトmicroformats仕様があります。Robot Exclusion Profileは、HTMLタグで属性と値class = "robots-noindex"を検索します: [6]

< p >このテキストにインデックスを付けてください。</ p > 
< div  class = "robots-noindex" >このテキストのインデックスを作成しないでください。</ div > 
< span  class = "robots-noindex" >このテキストのインデックスを作成しないでください。</ span > 
< p  class = "robots-noindex" >このテキストのインデックスを作成しないでください。</ p >

値の組み合わせも可能です[6]。例:

< div  class = "robots-noindexrobots-follow" >テキスト。</ div >

Yahoo!

2007年、Yahoo!マイクロフォーマットと同様の機能をスパイダーに導入しました。ただし、Yahoo!のスパイダーは、値class = "robots-nocontent"を検索し、次の値のみを検索するという点で互換性がありません。 [7]

< p >このテキストにインデックスを付けてください。</ p > 
< div  class = "robots-nocontent" >このテキストのインデックスを作成しないでください。</ div > 
< span  class = "robots-nocontent" >このテキストのインデックスを作成しないでください。</ span > 
< p  class = "robots-nocontent" >このテキストのインデックスを作成しないでください。</ p >

SharePoint

SharePoint 2010のiFilterは、属性と値がclass = "noindex"の<div>タグ内のコンテンツを除外します。内部の<div>は最初は除外されていませんでしたが、変更された可能性があります。<div>以外のタグに属性を適用できるかどうかも不明です。[8]

< p >このテキストにインデックスを付けてください。</ p > 
< div  class = "noindex" >このテキストにインデックスを付けないでください。</ div >

構造化されたコメント

Google検索アプライアンスは構造化されたコメントを使用します:[9]

< p >
このテキストにインデックスを付けてください。
<!-googleoff:すべて->
このテキストにインデックスを付けないでください。
<!-googleon:all-> 
</ p >

他のインデックス作成スパイダーは、独自の構造化されたコメントを使用します。

も参照してください

参考文献

  1. ^ a b ロボットとMETA要素、公式W3仕様
  2. ^ ロボットについて<META>タグ
  3. ^ メタタグを使用してサイトへのアクセスをブロックする、Googleウェブマスターツールヘルプ
  4. ^ 「HTMLタグの使用」ウェブマスター→ヘルプYandexセクション:<noindex>タグ2013年3月25日取得
  5. ^ 「一般的な検索FAQ」ヘルプアトムズ2013.セクション:サイトの一部を検索から除外するにはどうすればよいですか?2013年3月23日取得個々のページの一部が検索されないようにする必要がありますか?ページの一部をインデックスから除外する場合は、テキストを<noindex>タグと</ noindex>タグで囲みます。これは、たとえば、検索からナビゲーションテキストを除外する場合に便利です。登録が必要です
  6. ^ a b Janes、Peter(2005年6月18日)。「ロボット除外プロファイル」Microformats 2013年3月24日取得
  7. ^ Garg、Priyank(2007年5月2日)。「ロボットの紹介-ページセクションのコンテンツなし」Yahoo! ブログを検索します。Yahoo! 2014年8月20日にオリジナルからアーカイブされました2013年3月23日取得
  8. ^ 「インデックスなしのページ内の検索インデックス作成(クロール)の制御」Microsoft開発者Microsoft2010年6月7日。2017年11月4日のオリジナルからアーカイブ2017年11月4日取得
  9. ^ 「クロールの管理:クロールの準備」Google検索アプライアンスGoogleInc2012年8月23日。セクション:インデックスからの不要なテキストの除外。2012年11月23日にオリジナルからアーカイブされました2013年3月23日取得