Wikipedia: Lista de arquivos da web na Wikipedia
Ir para navegação
Pular para pesquisar
Lista de serviços de arquivo da web conhecidos em uso na Wikipedia em inglês. Classificados aproximadamente pelo número de usos, do mais ao menos. A Wayback Machine representa cerca de 80% do total. Dados inicialmente compilados pelo usuário: GreenC em março de 2017, atualizações e correções bem-vindas.
Serviços de arquivo
- Domínio: archive.org, waybackmachine.org
- Nome do host: <nenhum>, web, wayback, liveweb, www, www.web, classic-web, web-beta, replay, replay.web, web.wayback
- Caminho: <nenhum>, web
- Carimbo de data / hora: número de 4 a 14 dígitos. Ou "*". Ou "?". Ou combinação. Também pode conter caracteres finais como "re_". Se o carimbo de data / hora ausente, retorna a melhor página disponível.
- Exemplos:
- Domínio:. Hoje, .is, .fo, .li, .vn, .md, .ph
- Nome do host: <nenhum>, www
- Caminho: <nenhum>
- Timestamp: 4-14 dígitos; ou dígitos + caracteres (ver exemplo)
- Exemplos:
- http://archive.is/20130101/http ..
- http://archive.is/2013.04.17-12:08:20/http ..
- http://archive.is/http .. (página de índice)
- Domínio: webcitation.org
- Obsoleto - não aceita mais solicitações de novos arquivos, arquivos antigos ainda disponíveis
- Nome do host: <nenhum>, www
- Caminho: base62ID, consulta, cache, getfile.php, <number>
- Carimbo de data / hora: nenhum. Usa & date = 01-06-2012 + 21: 40: 03 na consulta? Url; o ID curto é base62 que se converte em tempo unix
- Exemplos:
- http://www.webcitation.org/gT64fd
- http://www.webcitation.org/66lmEkpE8?url=http://www.ariacharts.com.au/pages/charts_display_album.asp?chart%3D1G50
- http://www.webcitation.org/query?id=1138911916587475
- http://www.webcitation.org/query?url=http..&date=2012-06-01+21:40:03
- http://www.webcitation.org/1138911916587475
- http://www.webcitation.org/cache/73e53dd1f16cf8c5da298418d2a6e452870cf50e
- http://www.webcitation.org/getfile.php?fileid=1c46e791d68e89e12d0c2532cc3cf629b8bc8c8e
- Arquivos Nacionais do Reino Unido
- Domínio: nationalarchives.gov.uk
- Nome do host: webarchive, yourarchives
- Caminho: <nenhum>
- Timestamp: 4 a 14 dígitos
- Exemplos:
- NLA Australia
- Domínio: nla.gov.au
- Nome do host: pandora, trove, webarchive, content.webarchive
- Caminho: veja exemplos. O / pan / regex deve ser
/pan/[0-9]{4,7}/
- Timestamp: três tipos (20120727-0512, S2000-Dec-5, 20120326012340)
- Exemplos:
- http://pandora.nla.gov.au/pan/14231/20120727-0512/www.howlspace.com.au/en2/inxs/inxs.htm
- http://pandora.nla.gov.au/pan/128344/20110810-1451/www.theaureview.com/guide/festivals/bam-festival-2010-ivorys-rock-qld.html
- http://pandora.nla.gov.au/nph-wb/20010328130000/http://www.howlspace.com.au/en2/arenatina/arenatina.htm
- http://pandora.nla.gov.au/nph-arch/2000/S2000-Dec-5/http://www.paralympic.org.au/athletes/athleteprofile60da.html
- http://webarchive.nla.gov.au/gov/20120326012340/http://news.defence.gov.au/2011/09/09/army-airborne-insertion-capability/
- http://content.webarchive.nla.gov.au/gov/wayback/20120326012340/http://news.defence.gov.au/2011/09/09/army-airborne-insertion-capability
- Observação: não deve ser confundido com URLs não arquivados na web que parecem semelhantes:
- Nota: Sem acesso de memento
- Freezepage.com
- Domínio: freezepage.com
- Nome do host: <nenhum>, www
- Caminho: <nenhum>
- Timestamp: <nenhum> (disponível apenas via web scrape)
- Exemplos:
- Nota: Se o ID da conta que criou o instantâneo expirar por falta de atividade (sem login no freezepage), o instantâneo será excluído de freezepage.com
- Nota: Sem acesso de memento
- Biblioteca do Congresso
- Domínio: loc.gov
- Nome do host: webarchive
- Caminho: all, lcwa ####
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivo.pt (Portugal)
- Domínio: arquivo.pt
- Nome do host: <nenhum>
- Caminho: wayback, wayback / wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Stanford Edu
- Domínio: stanford.edu
- Nome do host: swap, sul-swap-prod
- Caminho: <nenhum>
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Archive-It
- Domínio: archive-it.org
- Nome do host: wayback
- Caminho: tudo, um número de 4 dígitos
- Timestamp: 4 a 14 dígitos
- Exemplos:
- BibAlex
- Domínio: bibalex.org:80
- Nome do host: web.archive, web.petabox
- Caminho: web
- Timestamp: 4 a 14 dígitos
- Exemplos:
- WikiWix
- Domínio: wikiwix.com
- Nome do host: arquivo
- Caminho: cache
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Nota: Não suporta https. Não suporta Memento
- Observação: acesso à API adicionado em março de 2018. Anexando & apiresponse = 1 ao final do URL. ( http://archive.wikiwix.com/cache/?url=http://www.linterweb.fr&apiresponse=1 ). Isso pode exigir a codificação de qualquer outro & na seção url =
- Nota: Suporta & argumento de título no final do URL, não faz parte do URL de origem (semelhante a & apiresponse). Fornece o nome do artigo da Wikipedia no qual o link está sendo usado (opcional).
- Arquivos Nacionais dos EUA
- Domínio: webharvest.gov
- Nome do host: <nenhum>
- Caminho: <variable>
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivos Nacionais da Islândia
- Domínio: vefsafn.is
- Nome do host: wayback
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
Arquivos Europa (Irlanda)- Falecido . Em maio de 2018, todos os arquivos foram movidos para Collections.internetmemory.org e, a partir de setembro de 2018, todos os arquivos foram movidos novamente para Archive-It [1]
- Domínio: europarchive.org
- Nome do host: coleção
- Caminho: nli
- Timestamp: 4 a 14 dígitos
- Exemplo de movimento:
- Perma CC
- Domínio: perma-archives.org, perma.cc
- Nome do host: <nenhum>
- Caminho: <nenhum>, warc
- Timestamp: 4 a 14 dígitos para perma-archives.org ou ID do instantâneo
- Exemplos:
Arquivos da Web Proni- Falecido . Em outubro de 2018, todos os arquivos foram movidos para Archive-It [2]
- Domínio: proni.gov.uk
- Nome do host: webarchive
- Caminho: <nenhum>
- Timestamp: 4 a 14 dígitos
- Exemplos:
http://webarchive.proni.gov.uk/20111213123846/http
- Exemplo de movimento:
- Original:
http://webarchive.proni.gov.uk/20100218151844/http://www.berr.gov.uk/
- Novo: http://wayback.archive-it.org/11112/20100218151844/http://www.berr.gov.uk/
- Original:
- Parlamento do Reino Unido
- Domínio: parlamento.uk
- Nome do host: webarchive
- Caminho: <nenhum>
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivo da Web do Reino Unido (Biblioteca Britânica)
- Domínio: webarchive.org.uk
- Nome do host: www
- Caminho: wayback / archive
- Timestamp: 4-14 dígitos com possibilidade de "mp_" no final
- Exemplos:
Canadá- Falecido . Em maio de 2018, todos os arquivos foram movidos para webarchive.bac-lac.gc.ca [3]
- Domínio: coleçõescanada.gc.ca
- Nome do host: www
- Caminho: archivesweb, webarchives
- Timestamp: 4 a 14 dígitos
- Exemplos:
http://www.collectionscanada.gc.ca/webarchives/20061104084225/http://broadband.gc.ca/maps/province.html?prov=48
http://www.collectionscanada.gc.ca/archivesweb/20060209004933/http
- Observação: não deve ser confundido com outras variantes de URL próximos. Capture apenas "/ webarchives /" ou "/ archivesweb /"
- Exemplo de movimento:
- Original:
http://www.collectionscanada.gc.ca/webarchives/20061104084225/http://broadband.gc.ca/maps/province.html?prov=48
- Novo: http://webarchive.bac-lac.gc.ca:8080/wayback/20061104084225/http://broadband.gc.ca/maps/province.html?prov=48
- Original:
- Canadá
- Domínio: bac-lac.gc.ca:8080
- Nome do host: webarchive
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Nota: Anteriormente, Collectionscanada.gc.ca veja acima
- Arquivo da Catalunha
- Domínio: padi.cat (: 8080)?
- Nome do host: www, (nenhum)
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivos da web de Cingapura
- Domínio: nlb.gov.sg
- Nome do host: eresources
- Caminho: webarchives / wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- https://eresources.nlb.gov.sg/webarchives/2016-04-25%2019:07:06.000/wp/details/http://www.lta.gov.sg/apps/news/page.aspx? c = 2 & id = 2dzk9l67sx9j40a1rhgdw3hvhrnxgq3zh34l77r37dj4w72jf1
- https://eresources.nlb.gov.sg/webarchives/wayback/20160425174854/https://www.lta.gov.sg/apps/news/page.aspx?c=2&id=2dzk9l67sx9j40a1rhgdw3hvhrnxgjq3zh34l77r37dj4w7272dj
- Observação: não deve ser confundido com outras variantes de URL próximos. Capture apenas "/ webarchives / wayback /"
- Arquivos da Eslovênia (Spletni)
- Domínio: nuk.uni-lj.si:8080
- Nome do host: nukrobi2 (pode mudar)
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivos da Estônia
- Domínio: digar.ee
- Nome do host: veebiarhiiv
- Caminho: a
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Arquivos da Baviera
- Domínio: bib-bvb.de
- Nome do host: langzeitarchivierung
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Biblioteca Digital da York University
- Domínio: yorku.ca
- Nome do host: digital.library
- Caminho: wayback
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Ghostarchive
- Domínio: ghostarchive.org
- Nome do host: [nenhum]
- Caminho: arquivo, varchive / <site>
- Timestamp: 4 a 14 dígitos
- Exemplos:
- Nota: para converter o formato curto em longo:
- Para páginas da web normais:
- Para páginas de vídeo, por exemplo, YouTube:
- Para encontrar o arquivo mais antigo e mais recente disponível, use o carimbo de data / hora "1990" ou "3000", por exemplo.
- https://ghostarchive.org/archive/1990/https://rms-support-letter.github.io/ encontrará a cópia arquivada mais antiga dessa página da web, enquanto
- https://ghostarchive.org/archive/3000/https://rms-support-letter.github.io/ encontrará as últimas.
De outros
- Lembrança
- Nota: Redireciona para um serviço de arquivamento externo baseado em dados em cache no banco de dados Memento que podem flutuar e / ou ser imprecisos devido ao cache sair de sincronia com o serviço do cliente.
- Nota: Links expiram rapidamente.
- Nota: Não pode ser acessado com Memento.