ウェイバックマシン

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

ウェイバックマシン
Stylized text saying: "INTERNET ARCHIVE WAYBACK MACHINE". The text is in black, except for "WAYBACK", which is in red.
サイトの種類
アーカイブ
提供エリア世界中(中国を除く
オーナーインターネットアーカイブ
URLアーカイブ.org / web / Edit this at Wikidata
登録オプション
発売1996年5月; 25年前(プライベート)2001年10月24日; 19年前(公開) (1996-05)
 (2001-10-24)
現在の状態アクティブ
で書かれているJavaPython

ウェイバックマシンがデジタルでアーカイブワールド・ワイド・ウェブ。それはによって設立されたインターネットアーカイブに基づいて、非営利の図書館、サンフランシスコカリフォルニア州。 1996年に作成され、2001年に一般公開されたこの機能により、ユーザーは「過去にさかのぼって」、過去のWebサイトの外観を確認できます。その創設者であるBrewsterKahleBruceGilliatは、機能しなくなったWebページのアーカイブされたコピーを保存することにより、「すべての知識への普遍的なアクセス」を提供するWaybackMachineを開発しました。

1996年の作成以来、6,030億ページ以上がアーカイブに追加されています。このサービスはまた、所有者の許可なしにアーカイブされたページを作成することが特定の法域で著作権侵害構成するかどうかについての論争を引き起こしました

歴史

Wayback Machineは5年後にサービスを公開することを目的として、1996年5月にキャッシュされたWebページのアーカイブを開始しました[1] [2][3]

インターネットアーカイブの創設者ブリュースター・ケールブルース・ギリアットがでウェイバックマシンを立ち上げ、サンフランシスコカリフォルニア[4] 2001年10月、[5] [6]それが変更されますたびやウェブサイトが遮断されたときに、主に消失ウェブサイトのコンテンツの問題に対処します下。[7]このサービスにより、ユーザーはアーカイブされたバージョンのWebページを時系列で見ることができます。これはアーカイブが「3次元インデックス」と呼んでいます。[8] KahleとGilliatは、インターネット全体をアーカイブし、「すべての知識への普遍的なアクセス」を提供することを期待してマシンを作成しました。[9]「ウェイバックマシン」という名前は、架空のタイムトラベルおよび翻訳デバイスである「ウェイバックマシン」を指しており、アニメの「ロッキーとブルウィンクルと仲間たちの冒険」でミスターピーボディとシャーマンのキャラクターが使用しています。[10] [11]漫画のセグメントの1つである「ピーボディのありえない歴史」では、キャラクターは機械を使用して、歴史上の有名なイベントを目撃し、参加し、しばしば変更しました。

1996年から2001年まで、情報はデジタルテープに保存され、カーレは時折、研究者や科学者が「不格好な」データベースを利用できるようにしました[12]アーカイブが2001年に5周年を迎えたとき、カリフォルニア大学バークレー校での式典で公開され、一般に公開されました[13] Wayback Machineが発売されるまでに、すでに100億を超えるアーカイブページが含まれていました。[14]データは、インターネットアーカイブのLinuxノードの大規模なクラスターに保存されます[9]時々、新しいバージョンのWebサイトを再訪してアーカイブします(以下の技術的な詳細を参照)。[15]WebサイトのURLを検索ボックスに入力して手動でサイトをキャプチャすることもできます。ただし、WebサイトでWayback Machineがサイトを「クロール」し、データを保存できる場合に限ります。[3]

2020年10月30日、WaybackMachineはコンテンツのファクトチェックを開始しました。[16]

技術的な詳細

ソフトウェアは、Web「クロール」し、Webページ、Gopher階層、Netnews(Usenet)掲示板システム、およびダウンロード可能なソフトウェアで公開されているすべての情報とデータファイルをダウンロードするために開発されました。[17]これらの「クローラー」によって収集された情報には、インターネット上で利用可能なすべての情報が含まれているわけではありません。データの多くは発行者によって制限されているか、アクセスできないデータベースに保存されているためです。部分的にキャッシュされたWebサイトの不整合を克服するために、Archive-It.orgは、機関やコンテンツ作成者がデジタルコンテンツのコレクションを自主的に収集して保存し、デジタルアーカイブを作成できるようにする手段として、インターネットアーカイブによって2005年に開発されました。[18]

クロールはさまざまなソースから提供されます。サードパーティからインポートされたものもあれば、アーカイブによって内部的に生成されたものもあります。[15]例えば、クロールがで貢献しているスローン財団アレクサ、代わってIAによって運営クロールNARAインターネットメモリー財団のミラー共通クロール[15]「ワールドワイドウェブクロール」は2010年から実行されており、グローバルWebをキャプチャします。[15] [19]

スナップショットキャプチャの頻度は、Webサイトごとに異なります。[15]「ワールドワイドウェブクロール」のウェブサイトは「クロールリスト」に含まれ、サイトはクロールごとに1回アーカイブされます。[15]クロールは、サイズに応じて、完了するまでに数か月または数年かかる場合があります。[15]たとえば、「ワイドクロール番号13」は2015年1月9日に開始し、2016年7月11日に完了しました。[20]ただし、一度に複数のクロールが進行中であり、サイトがに含まれている可能性があります。複数のクロールリストがあるため、サイトがクロールされる頻度は大きく異なります。[15]

2019年10月の時点で、ユーザーは1分あたり5回のアーカイブリクエストと取得に制限されています。[要出典] [なぜ?]

ストレージ容量と成長

技術が何年にもわたって発展するにつれて、WaybackMachineのストレージ容量は増加しました。2003年、わずか2年間のパブリックアクセスの後、WaybackMachineは12テラバイト/月の速度で成長していました。データは、インターネットアーカイブのスタッフがカスタム設計したPetaBoxラックシステムに保存されます。最初の100TBラックは、2004年6月に完全に機能するようになりましたが、それよりもはるかに多くのストレージが必要であることがすぐに明らかになりました。[21] [22]

インターネットアーカイブへのカスタマイズされたストレージアーキテクチャ移行日オープン・ストレージの2009年に、そして宿主における新しいデータセンターサンモジュラーデータセンター上のSun Microsystemsの「カリフォルニアのキャンパス。[23] 2009年の時点で、Wayback Machineには約3ペタバイトのデータが含まれており、毎月100テラバイトの速度で成長していました[24]

更新されたインターフェースとアーカイブされたコンテンツの新しいインデックスを備えた新しい改良版のWaybackMachineが、2011年に公開テストに利用できるようになりました。[25]その年の3月、WaybackMachineフォーラムで「新しいWaybackMachineのベータ版には、2010年までクロールされたすべての資料のより完全で最新のインデックスがあり、定期的に更新され続けます。従来のWayback Machineを駆動するインデックスには、2008年以降の資料が少ししかありません。今年は段階的に廃止されるため、これ以上のインデックスの更新は予定されていません。」[26]また、2011年に、インターネットアーカイブは6番目のペアのPetaBoxラックを設置し、WaybackMachineのストレージ容量を700テラバイト増加させました。[27]

2013年1月、同社は2,400億のURLという画期的なマイルストーンを発表しました。[28]

2013年10月、同社は「ページの保存」機能[29] [30]導入しましたこれにより、インターネットユーザーはURLのコンテンツをアーカイブでき、以前のライブWeb機能とは異なり永続的なリンクをすばやく生成できます。

2014年12月、Wayback Machineには4,350億のWebページ(約9ペタバイトのデータ)が含まれ、週に約20テラバイトで成長していました。[14] [31] [32]

2015年3月、[日付の確認が必要]セキュリティ研究者は、アーカイブされたサイトからの悪意のあるバイナリのサービスの意図しないホスティングによってもたらされる脅威に気づきました[33] [34]

2016年7月、WaybackMachineには約15ペタバイトのデータが含まれていたと報告されています。[35]

2018年9月、WaybackMachineには25ペタバイトを超えるデータが含まれていました。[36] [37]

2020年12月の時点で、WaybackMachineには70ペタバイトを超えるデータが含まれていました。[38]

ウェイバックマシンの成長[39] [40]
年ごとのウェイバックマシン アーカイブされたページ(10億)
2005年
40
2008年
85
2012年
150
2013年
373
2014年
400
2015年
452
2020
514

2013年10月から2015年3月の間に、ウェブサイトのグローバルAlexaランクは163 [41]から208に変更されました。[42] 2019年3月のランクは244でした。[43]

ウェブサイト除外ポリシー

歴史的に、Wayback Machineは、Webサイトがクロールされるかどうか、またはすでにクロールされている場合はアーカイブが公開されるかどうかを決定する際にロボット除外標準(robots.txt)を尊重してきました。ウェブサイトの所有者は、robots.txtを使用してWaybackMachineをオプトアウトするオプションがありました。 robots.txtルールをさかのぼって適用しました。サイトがインターネットアーカイブをブロックした場合、ドメインから以前にアーカイブされたページもすぐに利用できなくなります。さらに、インターネットアーカイブは、「ウェブサイトの所有者から直接連絡があり、サイトのクロールやアーカイブを停止するように求められることがあります。これらの要求に応じます」と述べています。[44]さらに、ウェブサイトは次のように述べています。「インターネットアーカイブは、コレクションに資料を入れたくない人のウェブサイトやその他のインターネット文書を保存したり、それらへのアクセスを提供したりすることには関心がありません。」[45] [46]

2017年4月17日、robots.txtを使用して検索エンジンから除外されていたサイトが機能しなくなり、パーキングドメインになり、WaybackMachineから誤って除外されたという報告が浮上しました。[47]インターネットアーカイブはポリシーを変更し、ウェイバックマシンから削除するために明示的な除外リクエストを要求するようになりました。[48]

オークランドアーカイブポリシー

Waybackの遡及的除外ポリシーは、2002年にカリフォルニア大学バークレー校の情報管理システム学部によって発行された削除リクエストの管理とアーカイブの整合性の維持に関する推奨事項に一部基づいています。これにより、Webサイトの所有者はサイトのアーカイブへのアクセスをブロックする権利が与えられます。 。[49] Waybackは、費用のかかる訴訟を回避するためにこのポリシーに準拠しています。[50]

Waybackの遡及的除外ポリシーは、Webページのクロールと表示の両方で米国政府と軍のWebサイトでrobots.txtを尊重することをやめたとき、2017年に緩和し始めました。2017年4月の時点で、Waybackは米国政府のWebサイトだけでなく、robots.txtをより広く無視しています。[51] [52] [53] [54]

使用し

2001年の一般公開以来、Wayback Machineは、データの保存と収集の方法と、アーカイブに含まれる実際のページの両方について、学者によって研究されてきました。 2013年の時点で、学者は、主に情報技術、図書館学、社会科学の分野から、WaybackMachineに約350の記事を書いています。社会科学の学者は、Wayback Machineを使用して、1990年代半ばから現在までのWebサイトの開発が会社の成長にどのように影響したかを分析しました。[14]

Wayback Machineがページをアーカイブするとき、通常、ほとんどのハイパーリンクが含まれ、インターネットの不安定さによって簡単に壊れた可能性がある場合でも、それらのリンクをアクティブに保ちます。インドの研究者は、オンラインの学術出版物にハイパーリンクを保存するWayback Machineの機能の有効性を調査し、それらの半分よりわずかに多くを保存したことを発見しました。[55]

「ジャーナリストはWaybackMachineを使用して、死んだWebサイト、日付の付いたニュースレポート、Webサイトのコンテンツの変更を表示します。そのコンテンツは、政治家に説明責任を負わせ、戦場の嘘を暴くために使用されています。」[56] 2014年、ウクライナの分離主義者の反政府勢力のリーダーであるイゴール・ガーキンのアーカイブされたソーシャルメディアページは、飛行機が実際に民間のマレーシア航空ジェット機であることが知られる前に、彼の軍隊が疑わしいウクライナ軍の飛行機を撃墜したことを自慢していることを示した(マレーシア航空17便)、その後、彼はポストを削除し、飛行機を撃墜したことでウクライナの軍隊を非難した。[56] [57] 2017年、科学のため行進はRedditに関する議論から始まりました。これは、誰かがArchive.orgにアクセスし、気候変動へのすべての言及がホワイトハウスのWebサイトから削除されていることを発見したことを示しています。これに対して、ユーザーは「ワシントンに科学者の行進が必要だ」とコメントした。[58] [59] [60]

さらに、このサイトは検証に多用されており、ウィキペディアの編集者による参照やコンテンツ作成へのアクセスを提供します[61]

2020年9月、Cloudflareとのパートナーシップが発表され、「Always Online」サービスを介して提供されるウェブサイトを自動的にアーカイブします。これにより、元のホストに到達できない場合でも、ユーザーをサイトのコピーに誘導できます。[62]

制限事項

2014年には、Webサイトがクロールされてから、WaybackMachineで表示できるようになるまでに6か月の遅延時間がありました。[63]現在、ラグタイムは3〜10時間です。[64] Wayback Machineは、限られた検索機能しか提供していません。その「サイト検索」機能により、ユーザーはWebページ自体にある単語ではなく、サイトを説明する単語に基づいてサイトを見つけることができます。[65]

Wayback Machineには、Webクローラーの制限により、これまでに作成されたすべてのWebページが含まれているわけではありません。 Wayback Machineは、FlashプラットフォームやJavaScriptで記述されたフォーム、プログレッシブWebアプリケーションなどのインタラクティブ機能を含むWebページを完全にアーカイブすることはできません。これらの機能は、ホストWebサイトとの対話を必要とするためです。これは、2013年6月以降、アーカイブチームによると、コメントが「ページ自体に読み込まれなくなった」ため、WaybackMachineがYouTubeページの保存時にYouTubeコメントを表示できなくなったことを意味します。[66]Wayback MachineのWebクローラーは、HTMLまたはそのバリアントのいずれかでコーディングされていないものを抽出するのが困難であり、ハイパーリンクが壊れたり、画像が欠落したりする可能性があります。このため、Webクローラーは、他のページによってリンクされていない「孤立したページ」をアーカイブできません。[65] [67] Wayback Machineのクローラーは、事前設定された深度制限に基づいて事前に定義された数のハイパーリンクのみをたどるので、すべてのページのすべてのハイパーリンクをアーカイブすることはできません。[19]

2018年4月以降、Wayback Machineのアーカイブチームの管理スタッフは、23日または39日(それぞれ月の3/4および5/4)の時間間隔を削除することにより、四半期月のルールを施行しました。キューサイズ。[要出典]

法的証拠

民事訴訟

NetbulaLLCv。ChordiantSoftwareInc.

2009年の訴訟では、Netbula、LLC対Chordiant Software Inc.の被告Chordiantが、Netbulaにウェブサイト上robots.txtファイルを無効にするよう強制する申し立てを提出しました。これにより、WaybackMachineは以前のバージョンのページへのアクセスを遡及的に削除しました。 Netbulaのサイトからアーカイブされた、Chordiantがそのケースをサポートすると信じていたページ。[68]

Netbulaは、被告がNetbulaのウェブサイトを変更するよう求めており、ページのインターネットアーカイブを直接召喚すべきであるという理由でこの申し立てに反対しました。[69] Internet Archiveの従業員は、Chordiantの動議を支持する宣誓供述書を提出したが、「かなりの負担、費用、および業務の中断なしに」他の手段でWebページを作成することはできないと述べた。[68]

サンノゼ管区のカリフォルニア北部地区のハワードロイド判事は、Netbulaの主張を拒否し、Chordiantが探していたアーカイブページを取得できるようにするために、robots.txtのブロックを一時的に無効にするように命じました。[68]

Telewizja Polska USA、Inc.v。EchostarSatellite

2004年10月の事件では、Telewizja Polska USA、 Inc.v。EchostarSatelliteNo。02C 3293、65Fed。 R.エビッド。サーブ。 673(ND Ill。2004年10月15日)、訴訟当事者は、おそらく初めて、許容可能な証拠のソースとしてWaybackMachineアーカイブを使用しようとしました。ポーランド・テレビはのプロバイダーですTVPポロニアEchoStar社が運営ディッシュネットワークを。裁判手続きの前に、EchoStarは、TelewizjaPolskaのWebサイトの過去のコンテンツの証拠としてWaybackMachineスナップショットを提供することを意図していることを示しました。 Telewizja Polskaは、伝聞を理由にスナップショットを抑制するための訴訟提起しましたそして、認証されていないソースが、判事Arlanderキーは伝聞のポーランド・テレビの主張を拒否し、TVPの申立てを却下したlimineがで裁判で証拠を除外します。[70] [71]しかしながら、裁判では、裁判官である地方裁判所のロナルド・グズマン裁判官は、マジストレイト・キーズの調査結果を却下し、インターネット・アーカイブの従業員の宣誓供述書も基礎となるページ(すなわち、テレウィジャ・ポルスカのウェブサイト)も否定した。 )証拠として許容された。Guzman裁判官は、従業員の宣誓供述書には伝聞と決定的な裏付けとなる声明の両方が含まれており、ウェブページと称される印刷物は自己認証ではないと推論しました。[72] [73]

特許法

いくつかの追加要件が満たされている場合(たとえば、アーキビストの権威ある声明を提供する場合)、米国特許庁欧州特許庁は、特定のWebページがいつ一般にアクセス可能であったかの証拠としてインターネットアーカイブからの日付スタンプを受け入れます。これらの日付は、たとえば特許出願の審査において、Webページが先行技術として利用可能かどうかを判断するために使用されます。[74]

ユーティリティの制限

ウェブサイトのアーカイブには技術的な制限があり、その結果、訴訟の相手方はウェブサイトのアーカイブによって提供された結果を悪用する可能性があります。この問題は、基になるリンクが公開されていないためにエラーが含まれている可能性がある場合に、苦情、回答、または専門家証人レポートでWebページのスクリーンショットを送信することによって悪化する可能性があります。たとえば、Wayback Machineなどのアーカイブはフォームに入力しないため、RESTfulではないeコマースデータベースのコンテンツをアーカイブに含めません[75]

法的地位

ヨーロッパでは、WaybackMachineは著作権法に違反していると解釈される可能性がありますコンテンツの作成者のみがコンテンツの公開場所または複製場所を決定できるため、アーカイブは作成者の要求に応じてシステムからページを削除する必要があります。[76] Wayback Machineの除外ポリシーは、サイトのFAQセクションにあります。[77]

アーカイブされたコンテンツの法的問題

特にWaybackMachineアーカイブの取り組みのために、インターネットアーカイブに対していくつかの訴訟が提起されました。

サイエントロジー

2002年後半、インターネットアーカイブは、サイエントロジーに批判的なさまざまなサイトをウェイバックマシンから削除しました。[78]エラーメッセージは、これが「サイト所有者による要求」への応答であると述べました。[79]後に、サイエントロジー教会の弁護士が削除を要求し、サイトの所有者が彼らの資料を削除することを望まなかったことが明らかになりました。[80]

Healthcare Advocates、Inc。

2003年、Harding Earley Follmer&Fraileyは、ArchiveのWayback Machineを使用して、商標紛争からクライアントを守りました。弁護士は、数年前のウェブサイトの内容に基づいて、原告による請求が無効であることを証明することができました。その後、原告であるHealthcare Advocatesは、著作権侵害の組織、DMCAおよびコンピューター犯罪取締法の違反を非難し、インターネットアーカイブを含めるように苦情を修正しました。 Healthcare Advocatesは、robots.txtをインストールしたため、最初の訴訟が提起された後でも、アーカイブは原告のウェブサイトの以前のコピーをすべてWayback Machineから削除する必要がありましたが、一部の資料は引き続きWaybackで公開されていました。[81]ウェイバックが問題を修正した後、訴訟は法廷外で和解した。[82]

スザンヌシェル

活動家のスザンヌシェルは2005年12月に訴訟を起こし、1999年から2004年の間に彼女のウェブサイトprofane-justice.orgをアーカイブするためにインターネットアーカイブに10万米ドルの支払いを要求した。[83] [84]インターネットアーカイブは、米国地方裁判所に宣言的判決訴訟を起こした。 2006年1月20日、カリフォルニア北部地区インターネットアーカイブがシェルの著作権を侵害していないという司法判断を求めた。シェルは対応して持ち込ま反訴彼女に違反している彼女は主張している彼女のサイト、アーカイブするためのインターネット・アーカイブに対しての利用規約を[85] 2007年2月13日、コロラド州連邦地方裁判所は、契約違反を除くすべての反訴を却下しました[84]インターネットアーカイブは、シェルがそのコピー活動から生じたと主張した著作権侵害の主張を却下する動きはなかった[86]

2007年4月25日、インターネットアーカイブとスザンヌシェルは共同で訴訟の和解を発表しました。[83]インターネットアーカイブは、「... Webコンテンツのアーカイブを望まない人のウェイバックマシンに資料を含めることに関心はない。シェル氏は、彼女のWebに有効で強制力のある著作権を持っていることを認識している。彼女のWebサイトがWaybackMachineに含まれているため、この訴訟が発生したことを残念に思います。」シェル氏は、「私はインターネットアーカイブの目標の歴史的価値を尊重している。その目標を妨害したり、害を及ぼしたりするつもりはなかった」と語った。[87]

Daniel Davydiuk

2013年から2016年の間に、Daniel Davydiukというポルノ俳優は、最初に複数のDMCAリクエストをアーカイブに送信し、次にカナダ連邦裁判所に訴えることで、WaybackMachineのアーカイブから自分のアーカイブ画像を削除しようとしました[88] [89] [90]

検閲とその他の脅威

archive.orgは現在中国でブロックされています。[91] [92]イスラム国のテロ組織が禁止された後、インターネットアーカイブは、2015年から16年にかけて、その組織からのアウトリーチビデオのホストとしてロシアで完全にブロックされました[56] [93] [94] [更新が必要] 2016年以降、ウェブサイトは完全に利用可能になりましたが、地元の商業ロビイストは著作権上の理由でインターネットアーカイブを禁止するために地方裁判所で訴えています。[95]

Library FreedomProjectのディレクターであるAlisonMacrinaは、「図書館員は個人のプライバシーを深く評価しますが、検閲にも強く反対します」と述べています。[56]

記事が元のウェブサイトから削除された直後にアーカイブから削除されたケースが少なくとも1つあります。 Aデイリービーストの記者は、彼がデートのアプリのゲイの男を装った偽のプロフィールを作った後、2016年にいくつかのゲイのオリンピック選手をouted記事を書いていました。デイリービーストは、広範囲にわたる怒りに遭遇した後、記事を削除しました。その後間もなく、インターネットアーカイブも同様に機能しましたが、外出したアスリートの安全を保護する以外の理由はないことを強調しました。[56]

その他の脅威には、自然災害、[96]破壊(リモートまたは物理的)、[97]アーカイブのコンテンツの操作(サイバー攻撃バックアップも参照)、問題のある著作権法[98]、サイトのユーザーの監視などがあります。[99]

ロングナウ財団の事務局長であるアレクサンダーローズは、「何もない」という世代が長期にわたって有用な方法で生き残るだろうと考え、「技術文明に継続性があれば、多くの裸のデータは引き続き検索可能で検索可能ですが、「Drupal、Ruby、Djangoなどのコンテンツ管理システムの深いバックエンドを備えた」サイトはアーカイブが難しいため、配信された形式のほとんどが認識できないと思います。[100]

大西洋、人間の知識の保存を反映した記事の中で、長期的に構築されていると説明しているインターネットアーカイブ[101]は、データが長期的に消える前にデータをキャプチャするために猛烈に取り組んでいるとコメントしています。話すインフラストラクチャ。」[102]

も参照してください

参考文献

  1. ^ 「MTVオンライン:メインページ–ウェイバックマシン」ウェイバックマシン5月12日、1996年からのアーカイブの元1996年5月12日に2020年7月17日取得
  2. ^ 「インフォシークガイド–ウェイバックマシン」ウェイバックマシン5月12日、1996年からのアーカイブの元1996年5月12日に2016年12月16日取得
  3. ^ a b 「インターネットアーカイブ:ウェイバックマシン」archive.org2014年1月3日にオリジナルからアーカイブされました2018年10月15日取得
  4. ^ 「ウェイバックマシンの一般情報」archive.org2019年12月5日にオリジナルからアーカイブされまし2021年3月2日取得
  5. ^ 「WayBackMachine.orgWHOIS、DNS、およびドメイン情報–DomainTools」WHOIS2020年5月14日にオリジナルからアーカイブされました2016年3月13日取得
  6. ^ 「InternetArchive.orgWHOIS、DNS、およびドメイン情報–DomainTools」WHOIS2020年5月12日にオリジナルからアーカイブされました2016年3月13日取得
  7. ^ メモ、Greg R.(2002年3月から4月)。「ウェイバックマシン:Webのアーカイブ」。オンライン26:59–61。INIST13517724
  8. ^ 「ウェイバックマシン」はよくある質問アーカイブ2018年9月18日に元からは、取得した9月18日2018年
  9. ^ B 「ミッションに2万ハードドライブ|インターネットアーカイブブログ」blog.archive.org2016年10月25日。2018年10月20日のオリジナルからアーカイブ2018年10月15日取得
  10. ^ グリーン、ヘザー(2002年2月28日)。「世界と同じくらい大きな図書館」BusinessWeek2011年12月20日にオリジナルからアーカイブされまし
  11. ^ Tong、Judy(2002年9月8日)。「責任ある党–ブリュースターケール;ウェブ上の図書館、ウェブ上」ニューヨークタイムズ2011年2月20日にオリジナルからアーカイブされました2011年8月15日取得
  12. ^ クック、ジョン(2001年11月1日)。「ウェブサイトはあなたをインターネットの歴史に戻す」シアトルポストインテリジェンサー2014年8月12日にオリジナルからアーカイブされました2011年8月15日取得
  13. ^ メイフィールド、ケンドラ(2001年10月28日)。「WaybackGoesWay BackonWeb」有線2017年10月16日にオリジナルからアーカイブされました2017年10月16日取得
  14. ^ a b c Arora、Sanjay K。; 李、陰; Youtie、Jan; シャピラ、フィリップ(2015年5月5日)。「ウェイバックマシンを使用して社会科学のWebサイトをマイニングする:方法論的リソース」情報科学技術協会誌67(8):1904–1915。土井10.1002 /asi.23503ISSN 2330年から1635年 
  15. ^ a b c d e f g h Leetaru、Kalev(2016年1月28日)。「インターネットアーカイブは20歳になります:ウェブのアーカイブの舞台裏を見てください」フォーブス2017年10月16日にオリジナルからアーカイブされました2017年10月16日取得
  16. ^ グラハム、マーク(2020年10月30日)。「ウェイバックマシンページのファクトチェックとコンテキスト」インターネットアーカイブブログ2021年1月17日取得
  17. ^ カーレ、ブリュースター。「インターネットのアーカイブ」Scientific American – 1997年3月号。2012年4月3日にオリジナルからアーカイブされました2011年8月19日取得
  18. ^ カプラン、ジェフ(2014年10月27日)。「Archive-It:Webを一緒にクロールする」インターネットアーカイブブログ2017年10月12日にオリジナルからアーカイブされました2017年10月16日取得
  19. ^ B 「ワールドワイド・ウェブクロール」インターネットアーカイブ。2017年10月19日にオリジナルからアーカイブされました2017年10月16日取得
  20. ^ 「ワイドクロール番号13」インターネットアーカイブ。2017年10月19日にオリジナルからアーカイブされました2017年10月16日取得
  21. ^ 「インターネットアーカイブ:Petabox」archive.org 2018年10月25日取得
  22. ^ Kanellos、Michael(2005年7月29日)。「安い上に大きなストレージ」CNETNews.com。2007年4月3日にオリジナルからアーカイブされまし2007年7月29日取得
  23. ^ 「インターネットアーカイブとサンマイクロシステムズはインターネットの生きた歴史を作成します」サンマイクロシステムズ2009年3月25日。2009年3月26日のオリジナルからアーカイブ2009年3月27日取得
  24. ^ Mearian、Lucas(2009年3月19日)。「大規模なWaybackMachineデータセンターを発表するインターネットアーカイブ」Computerworld.com。2009年3月23日にオリジナルからアーカイブされまし2009年3月22日取得
  25. ^ 「ベータテストで更新されたウェイバックマシン」2011年8月23日にオリジナルからアーカイブされまし2011年8月19日取得
  26. ^ 「ベータウェイバックマシン、フォーラム内」2014年4月17日にオリジナルからアーカイブされました2014年4月16日取得
  27. ^ 「インターネットアーカイブフォーラム:ラックの6番目のペアがサービスを開始します:2PBを超えるデータスペースが使用されました」archive.org2016年10月24日にオリジナルからアーカイブされました2018年10月25日取得
  28. ^ 「ウェイバックマシン:240,000,000,000のURLが追加されました|インターネットアーカイブブログ」2013年1月9日。2014年4月14日のオリジナルからアーカイブ2014年4月16日取得
  29. ^ ロッシ、アレクシス(2013年10月25日)。「インターネット上の壊れたリンクの修正」archive.org。米国カリフォルニア州サンフランシスコ:コレクションチーム、インターネットアーカイブ。2014年11月7日にオリジナルからアーカイブされました2015年3月25日取得ページを即座にアーカイブし、WaybackMachineでそのページの永続的なURLを取得する機能を追加しました。このサービスを使用すると、ウィキペディアの編集者、学者、法律専門家、学生、または私のような家庭料理人など、誰でも安定したURLを作成して、今後もアクセスしたい情報を引用、共有、ブックマークすることができます。
  30. ^ 「新しいインターネットアーカイブウェイバックマシンがオンラインになりました」www.digitaljournal.com2013年10月23日。2020年11月19日のオリジナルからアーカイブ2020年11月19日取得 Citeは一般的なタイトルを使用しています(ヘルプ
  31. ^ 「インターネットアーカイブのよくある質問」2009年10月21日にオリジナルからアーカイブされました2015年1月17日取得
  32. ^ 「インターネットアーカイブのよくある質問」12月18日、2014年からのアーカイブの元2014年12月18日に2018年12月13日取得
  33. ^ VirusTotalチーム(2015年3月25日)。「207.241.226.190IPアドレス情報」virustotal.com。ダブリン2、アイルランド:VirusTotal2014年7月14日にオリジナルからアーカイブされました2015年3月25日取得2015-03-25:このIPアドレスでホストされている最新のURLが、少なくとも1つのURLスキャナーまたは悪意のあるURLデータセットによって検出されました。 ... 2/62 2015-03-25 16:14:12 [完全なURL編集済み] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [完全なURL編集済み] /CBLightSetup.exeCS1 maint: location (link)
  34. ^ Googleが提供するアドバイザリ(2015年3月25日)。「archive.orgの安全な閲覧診断ページ」google.com/safebrowsing。マウンテンビュー、カリフォルニア、米国。2015年4月6日にオリジナルからアーカイブされました2015年3月25日取得2015-03-25:このサイトの一部は、過去90日間で138回の疑わしいアクティビティとしてリストされました。... Googleがこのサイトにアクセスしたとき、どうなりましたか?...過去90日間にサイトでテストした42410ページのうち、450ページの結果、ユーザーの同意なしに悪意のあるソフトウェアがダウンロードおよびインストールされました。Googleがこのサイトに最後にアクセスしたのは2015-03-25で、このサイトで疑わしいコンテンツが最後に見つかったのは2015-03-25でした。...悪意のあるソフトウェアには、169のトロイの木馬、126のウイルス、43のバックドアが含まれます。
  35. ^ 「ビッグデータの操作は世界の考え方を変えることができますか?」国民2017年1月12日にオリジナルからアーカイブされました2017年5月14日取得
  36. ^ クロケット、ザカリー(2018年9月28日)。「InsideWaybackMachine、インターネットのタイムカプセル」ハッスル2018年10月2日にオリジナルからアーカイブされました2018年10月26日取得
  37. ^ ヴァージニア・ヘファーナン(2018年9月18日)。「インターネット上で物事が壊れて崩壊する—それは良いことだ」有線2018年9月25日にオリジナルからアーカイブされました2018年10月26日取得
  38. ^ 「インターネットアーカイブに寄付する:無料で借りられる本、映画、音楽、ウェイバックマシンのデジタルライブラリ」adafruit。2020年12月2日にオリジナルからアーカイブされました2020年12月2日取得
  39. ^ ミシェル(2014年5月9日)。「ウェイバックマシンが400,000,000,000に達する!」インターネットアーカイブ。2014年8月26日にオリジナルからアーカイブされました2015年3月25日取得
  40. ^ 「インターネットアーカイブ」インターネットアーカイブ。2020年12月31日にオリジナルからアーカイブされまし2021年3月8日取得
  41. ^ 「Archive.orgサイト情報」アレクサインターネット2013年10月28日にオリジナルからアーカイブされまし2013年10月29日取得
  42. ^ 「Archive.orgサイトの概要」アレクサインターネット。2015年4月9日にオリジナルからアーカイブされまし2015年4月9日取得
  43. ^ 「Archive.orgのトラフィック、人口統計および競合他社-Alexa」3月23日、2019年からのアーカイブの元2019年3月23日に2019年4月5日取得
  44. ^ 「Robots.txtまたはその他の除外のために一部のサイトは利用できません」2011年4月15日にオリジナルからアーカイブされまし
  45. ^ 「インターネットアーカイブのよくある質問」2014年4月17日にオリジナルからアーカイブされまし
  46. ^ コックス、ジョセフ(2018年5月22日)。「ウェイバックマシンはストーカーに販売されたマルウェアの証拠を削除しています2018年5月23日にオリジナルからアーカイブされました2018年5月23日取得
  47. ^ 「検索エンジン向けのRobots.txtは、Webアーカイブではうまく機能しません」インターネットアーカイブ2017年4月17日2019年6月29日取得
  48. ^ 「ウェイバックマシンの使用」インターネットアーカイブヘルプセンター
  49. ^ 「削除要求を管理し、アーカイブの整合性を維持するための推奨事項」カリフォルニア大学2002年12月14日。2017年9月18日のオリジナルからアーカイブ2017年9月14日取得
  50. ^ 「過去のクロールの遡及robots.txt削除別名オークランドアーカイブポリシー」インターネットアーカイブ。2014年7月7日。2017年10月10日のオリジナルからアーカイブ2017年9月14日取得
  51. ^ グラハム、マーク(2017年4月17日)。「検索エンジン向けのRobots.txtは、ウェブアーカイブではうまく機能しません」インターネットアーカイブブログ2017年4月17日にオリジナルからアーカイブされました2017年4月16日取得
  52. ^ 「ArchivierungdesInternets:InternetArchiveignoriertkünftigrobots.txt」(ドイツ語)。オンラインでハイゼ。2017年4月27日にオリジナルからアーカイブされました2017年5月14日取得
  53. ^ 「Suchmaschinen:インターネットアーカイブはRobots.txt-Einträgeignorieren– Golem.deをkünftigします」(ドイツ語)。2017年6月19日にオリジナルからアーカイブされました2017年5月14日取得
  54. ^ 「インターネットアーカイブは過去の記録を正確に保つためにrobots.txtファイルを無視します」デジタルトレンド。2017年4月24日。2017年5月16日のオリジナルからアーカイブ2017年5月14日取得
  55. ^ Sampath Kumar、BT; プリトヴィラージ、KR(2014年10月21日)。「命を吹き込む:消えたURLの取得におけるWaybackMachineの役割」。情報科学ジャーナル41(1):71–81。土井10.1177 / 0165551514552752ISSN 0165から5515までS2CID 28320982  
  56. ^ a b c d e 「ウェイバックマシンは味のアーカイブを検閲しません、ディレクターはオリンピックの記事がスクラブされた後に言います」2017年1月6日にオリジナルからアーカイブされました2017年5月14日取得
  57. ^ Lepore、Jill(2015年1月26日)。「ウェブが昨日言ったこと」ニューヨーカー2015年1月25日にオリジナルからアーカイブされました2017年5月14日取得
  58. ^ 「科学のための行進はRedditのこの人の「使い捨てライン」から始まりました」ワシントンポスト2017年4月23日にオリジナルからアーカイブされました2017年4月23日取得
  59. ^ 「科学者はワシントンで行進するつもりですか?」ワシントンポスト2017年1月31日にオリジナルからアーカイブされました2017年1月31日取得
  60. ^ フォーリー、キャサリンエレン。「世界的な科学のための行進は、単一のRedditスレッドから始まりました」クォーツ2017年4月24日にオリジナルからアーカイブされました2017年4月23日取得
  61. ^ グラハム、マーク(2018年10月1日)。「ウィキペディアの900万以上の壊れたリンクが救出されました」
  62. ^ グラハム、マーク(2020年9月17日)。「CloudflareとWaybackMachine、より信頼性の高いWebのために力を合わせます」インターネットアーカイブブログ2020年9月17日取得
  63. ^ 「インターネットアーカイブのよくある質問」インターネットアーカイブ4月2日から2014年アーカイブオリジナルの2014年4月2日に2018年11月23日取得
  64. ^ 「インターネットアーカイブのよくある質問」archive.org 2018年11月23日取得
  65. ^ a b ベイツ、メアリーエレン(2002)。「ウェイバックマシン」。オンライン26:80。
  66. ^ 「YouTube-Archiveteam」archiveteam.org2020年8月5日にオリジナルからアーカイブされました2020年8月6日取得
  67. ^ 「インターネットアーカイブのよくある質問」archive.org2013年4月20日にオリジナルからアーカイブされました2018年10月18日取得
  68. ^ a b c ロイド、ハワード(2009年10月)。「Robots.txtを無効にする注文」(PDF)2019年8月8日にオリジナル(PDF)からアーカイブされまし2009年10月15日取得
  69. ^ コルテス、アントニオ(2009年10月)。「Robots.txtの削除に反対する動き」2010年10月27日にオリジナルからアーカイブされまし2009年10月15日取得
  70. ^ ゲルマン、ローレン(2004年11月17日)。「証拠として許容されるとされたインターネットアーカイブのウェブページスナップショット」パケット2(3)。2011年4月30日にオリジナルからアーカイブされまし2007年1月4日取得
  71. ^ ハウエル、ベリルA.(2006年2月)。「Web履歴の証明:インターネットアーカイブの使用方法」(PDF)Journal of Internet Law:3–9。2010年7月5日にオリジナル(PDF)からアーカイブされまし2008年8月6日取得
  72. ^ 「仮想の場所で証拠を探すインターネット証拠の許容性」2019年7月1日にオリジナルからアーカイブされました2020年6月14日取得
  73. ^ Levitt、Carole A。; Rosch、Mark E.(2010)。プロのように情報を見つける:調査研究のためにインターネットで公開されているリソースをマイニングする、トム1アメリカ法曹協会。pp。194–196。ISBN 978-1-60442-890-22020年12月18日にオリジナルからアーカイブされました2020年6月14日取得
  74. ^ Coggins、Wynn W.(2002年秋)。「ビジネス方法特許の分野における先行技術–電子文書はいつ先行技術の目的で印刷された出版物になるのか?」USPTO2012年9月21日にオリジナルからアーカイブされまし2012年8月15日取得
  75. ^ 「ウェイバックマシンを暴く」2010年6月29日にオリジナルからアーカイブされまし
  76. ^ Bahr、Martin(2002)。「ウェイバックマシンとGoogleキャッシュ-eineVerletzung deutschen Urheberrechts?」JurPC(ドイツ語):9。DOI10.7328 / jurpcb / 200217192009年8月23日にオリジナルからアーカイブされました。
  77. ^ 「インターネットアーカイブFAQ」2014年4月17日にオリジナルからアーカイブされました2014年4月16日取得
  78. ^ Bowman、Lisa M(2002年9月24日)。「ネットアーカイブはサイエントロジー評論家を沈黙させる」CNETNews.com。2012年5月15日にオリジナルからアーカイブされまし2007年1月4日取得
  79. ^ ジェフ(2002年9月23日)。「ウェイバックマシンからの除外」(ブログ)ウェイバックマシンフォーラムインターネットアーカイブ。2007年2月11日にオリジナルからアーカイブされました2007年1月4日取得 作成者と日付は、フォーラムスレッドの開始を示します
  80. ^ ミラー、アーネスト。「シャーマン、サイエントロジーのためのウェイバックマシンを設定する」LawMemeイェールロースクール。2012年11月16日にオリジナル(ブログ)からアーカイブされまし2007年1月4日取得
  81. ^ 染料、ジェシカ(2005)。「インターネットの過去への物議を醸す旅行のために訴えられたウェブサイト」。EContent28. 11:8–9。
  82. ^ Bangeman、Eric(2006年8月31日)。「インターネットアーカイブはウェイバックマシンをめぐって訴訟を解決する」ArsTechnica2007年11月5日にオリジナルからアーカイブされました2007年11月29日取得
  83. ^ a b Internet Archivev。Shell505 F.Supp.2d 755 at justia.com、1:2006cv01726(Colorado District Court August 31、2006 )( "'2007年4月25日和解合意が発表されました。'ファイリング65、2007- 04-30: '...したがって、この問題は不利益を被って却下されるように命じられました...' ")。
  84. ^ a b バブコック、ルイスT.、チーフジャッジ(2007年2月13日)。インターネットアーカイブv。シェル民事訴訟番号06cv01726LTBCBS」(PDF)2014年1月25日のオリジナルからアーカイブ(PDF)2015年3月25日取得1)変換および民事盗難に関するシェルの反訴(第2の訴因)を却下するインターネットアーカイブの申し立ては認められます。2)契約違反(第3の訴訟原因)に対するシェルの反訴を却下するインターネットアーカイブの申し立ては拒否されます。 3)RICOおよびCOCCA(第4の訴因)に基づくラケットのシェルの反訴を却下するというインターネットアーカイブの申し立ては認められています。
  85. ^ Claburn、Thomas(2007年3月16日)。「コロラドの女性がWebクローラーを契約に拘束することを訴える」。米国ニューヨーク州ニューヨーク:InformationWeek、UBM Tech、UBMLLC。2014年9月4日にオリジナルからアーカイブされました2015年3月25日取得コンピュータは人々に代わって契約を結ぶことができます。統一電子取引法(UETA)は、「契約は、たとえ個人が電子エージェントの行動または結果として生じる条件や合意を認識またはレビューしていなくても、当事者の電子エージェントの相互作用によって形成される可能性がある」と述べています。
  86. ^ Samson、Martin H.、Phillips Nizer LLP(2007)。「インターネットアーカイブv。スザンヌシェル」internetlibrary.com。法と裁判所の決定のインターネットライブラリ。2014年8月3日にオリジナルからアーカイブされました2015年3月25日取得さらに重要なことに、法廷で開かれたインターネットアーカイブのシェルのサイトの単なるコピーとそのデータベースへの表示は、被告の財産に対する支配と支配の必要な行使を構成するものではありませんでした。重要なことに、裁判所は、被告は常に自分のサイトを所有および運営していると述べた。裁判所は次のように述べています。シェルは、ドキュメントのコピーだけでは変換をサポートするのに十分な使用権の剥奪であるという概念をサポートする権限を識別しません。逆に、多くの回路はそうではないと判断しました。
  87. ^ brewster(2007年4月25日)。「インターネットアーカイブとスザンヌシェル和解訴訟」archive.org。米国コロラド州デンバー:インターネットアーカイブ。2010年12月5日にオリジナルからアーカイブされました2015年3月25日取得両当事者は、訴訟が相手方に引き起こした可能性のある混乱を心から後悔しています。 InternetArchiveもMs.Shellも、この訴訟への世間の注目から生じたいずれかの当事者に危害を加えた可能性のある行為を容認しません。両当事者はそのような行為に関与しておらず、この訴訟の友好的な解決に対する一般市民の対応が、いずれの当事者にもさらなる危害や混乱を引き起こさないという彼らの希望と一致することを要求しています。
  88. ^ Stobbe, Richard (December 5, 2014). "Copyright Implications Of A "Right To Be Forgotten"? Or How To Take-Down The Internet Archive". Mondaq. Archived from the original on November 18, 2018. Retrieved March 8, 2019.
  89. ^ McVeigh, Glennys (October 16, 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Kettles, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Federation of Law Societies of Canada. Archived from the original on December 18, 2020. Retrieved March 8, 2019.
  90. ^ Southcott, Richard F. (November 30, 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontario: Federation of Law Societies of Canada. Archived from the original on June 29, 2019. Retrieved March 8, 2019.
  91. ^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. Archived from the original on December 27, 2016. Retrieved May 14, 2017.
  92. ^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. Archived from the original on March 28, 2017. Retrieved May 14, 2017.
  93. ^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". Archived from the original on October 7, 2016. Retrieved May 14, 2017.
  94. ^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. June 26, 2015. Archived from the original on April 17, 2016. Retrieved May 14, 2017.
  95. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (in Russian). Archived from the original on April 5, 2019. Retrieved October 18, 2020.
  96. ^ "Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs". November 29, 2016. Archived from the original on May 21, 2017. Retrieved May 14, 2017.
  97. ^ "Archived copy". Archived from the original on November 9, 2020. Retrieved September 28, 2020.CS1 maint: archived copy as title (link)
  98. ^ "Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"". Consumerist. June 7, 2016. Archived from the original on November 11, 2016. Retrieved May 14, 2017.
  99. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (in German). heise online. Archived from the original on December 7, 2016. Retrieved May 14, 2017.
  100. ^ LaFrance, Adrienne (October 14, 2015). "The Internet's Dark Ages". The Atlantic. Archived from the original on May 7, 2017. Retrieved May 14, 2017.
  101. ^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump". Motherboard. November 29, 2016. Archived from the original on May 16, 2017. Retrieved May 14, 2017.
  102. ^ LaFrance, Adrienne (June 3, 2016). "The Human Fear of Total Knowledge". The Atlantic. Archived from the original on December 2, 2016. Retrieved May 14, 2017.

External links