Wikipedia: Link rot
Como a maioria dos grandes sites , a Wikipedia sofre do fenômeno conhecido como podridão de links , em que links externos morrem , à medida que as páginas vinculadas ou sites inteiros desaparecem, mudam seu conteúdo ou se movem sem redirecionamento de HTML. Isso representa uma ameaça significativa para a política de confiabilidade da Wikipedia e sua diretriz de citação de fonte .
Em geral, não exclua as informações citadas apenas porque o URL para a fonte não funciona mais. Ferramentas, procedimentos e processos estão disponíveis conforme descrito neste documento.
Prevenindo o apodrecimento do link
Arquivamento automático
Os links adicionados por editores ao espaço principal da Wikipedia em inglês são salvos automaticamente na Wayback Machine em cerca de 24 horas (nb. Na prática, nem todos os links são salvos por vários motivos). Isso é feito com um programa chamado "NoMore404" que o Internet Archive executa e mantém; outros sites wiki de idioma estão incluídos. Ele monitora a API EventStreams , extrai novos URLs externos e adiciona um instantâneo ao Wayback. Este sistema tornou-se ativo em algum momento após 2015, embora esforços anteriores também tenham sido feitos. Além disso, em algum momento após 2012, archive.today(também conhecido como archive.is) tentou arquivar todos os links externos então existentes na Wikipedia naquele momento. Estava incompleto, mas um número significativo de links foi adicionado ao arquivo. Hoje durante esse período, tornando-o uma importante fonte de arquivo, preenchendo lacunas de cobertura. O Archive.today ainda está fazendo alguns arquivos automatizados em 2020, embora a extensão da cobertura e a frequência sejam desconhecidas.
Em 2015, havia um bot da Wikipedia e uma ferramenta chamada WP: IABOT que automatiza a correção de podridão de links. Ele é executado continuamente, verificando todos os artigos da Wikipedia se um link está morto, adicionando arquivos ao Wayback Machine (se ainda não estiver lá) e substituindo links mortos no wikitexto por uma versão arquivada. Este bot é executado automaticamente, mas também pode ser direcionado por usuários finais por meio de sua interface da web. Está disponível ao visualizar o histórico de qualquer página, localizado próximo ao topo da página na linha de "Ferramentas Externas", com a opção "Corrigir links mortos".
A partir de 2015, o bot periódico WP: WAYBACKMEDIC verifica se há podridão de link nos próprios links de arquivo. Os bancos de dados de arquivos são dinâmicos: arquivos se movem ou desaparecem, novos são adicionados, etc. Este bot mantém links de arquivos existentes na Wikipedia em inglês. Ele também arquiva recursos mediante solicitação em WP: URLREQ . É uma ferramenta flexível que pode realizar muitos trabalhos personalizados, como migração / movimentação de URL, domínios usurpados, descoberta e reparo soft-404.
Arquivo manual
Sugestões de maneiras de melhorar o arquivamento manualmente:
- Evite URLs simples . Use modelos de citação, como para citações e para seções de links externos.
{{cite web}}
{{webarchive}}
- Use um serviço de arquivamento da web , como Internet Archive ou Archive.today . Uma lista completa está disponível em WP: Lista de arquivos da web na Wikipedia . Dentro dos modelos de citação, coloque o URL do arquivo
|archive-url=
e adicione um|archive-date=
. Se o link ainda for válido, inclua|url-status=live
, caso contrário, defina|url-status=dead
. - Para adicionar mais de um URL de arquivamento, como seguro extra contra interrupção do provedor, aceita até 10 URLs de provedor de arquivamento. A opção produz uma saída apropriada para seguir um modelo CS1 | 2. por exemplo. irá mostrar 4 URLs de arquivo (um da cite web e três do webarchive).
{{webarchive}}
|format=addlarchives
{{cite web|archive-url=..}}{{webarchive|format=addlarchive|url1=..|url2=..|url3..}}
- Se o link ainda estiver ativo, mas ainda não tiver sido arquivado, visite o site do serviço de arquivamento de sua escolha e solicite que a página seja arquivada.
- Execute WP: IABOT nas páginas por meio de sua interface de usuário.
Métodos alternativos
A maioria dos modelos de citação tem um |quote=
parâmetro que pode ser usado para armazenar citações de texto do material de origem. Isso pode ser usado para armazenar uma quantidade limitada de texto da fonte no modelo de citação. Isso é especialmente útil para fontes que não podem ser arquivadas com serviços de arquivamento da web. Ele também pode fornecer seguro contra falha do serviço de arquivamento da web escolhido. Armazenar todo o texto da fonte não é apropriado sob as políticas de uso justo , então escolha apenas as partes mais importantes do texto que mais apóiam as afirmações no artigo da Wikipedia. Onde aplicável, materiais de domínio público podem ser copiados para o Wikisource .
Reparando um link morto
Existem várias maneiras de tentar reparar um link inativo, detalhadas a seguir:
Procurando
Se o link morto incluir informações suficientes (título do artigo, nomes, etc.), muitas vezes é possível usá-lo para encontrar a página da Web em um local diferente, no mesmo site ou em outro lugar.
Freqüentemente, as páginas da web simplesmente mudam para o mesmo site. Um índice de site ou recurso de pesquisa específico do site é um local útil para localizar a página movida. Se essas ferramentas não estiverem disponíveis, muitos mecanismos de pesquisa da Internet permitem uma pesquisa em um site específico.
Caso contrário, pesquisar a página na Internet pode encontrar alternativas.
Se você encontrar um novo URL adequado, poderá editar os parâmetros da citação. Se a citação usa um dos modelos comuns (por exemplo, {{ cite web }}, {{ cite news }}, {{ Citation }}), então você pode editar da seguinte forma:
- Altere o
|url=
para apontar para o novo URL; - Altere ou adicione
|access-date=
para se referir à data atual.
Arquivos da Internet
Verifique as versões arquivadas em um dos muitos serviços de arquivamento da web. Os serviços de arquivo "Big 3" são web.archive.org , webcitation.org e archive.is . Eles representam mais de 90% de todos os arquivos da Wikipedia, com web.archive.org sendo mais de 80% de todos os links de arquivos. Outros serviços de arquivo estão listados em WP: WEBARCHIVES .
A interface do Mementos permite pesquisar vários serviços de arquivamento com uma única pesquisa. O banco de dados Memento é armazenado em cache, o que significa que os resultados são retornados rapidamente, mas o cache também fica desatualizado. Portanto, não deve ser considerada a palavra final - muitas vezes, pode relatar que nenhum arquivo está disponível, quando na verdade está. Você ainda pode precisar fazer o trabalho de verificação de sites de arquivamento individuais, mas Mementos pode ser uma verificação inicial rápida.
Site de arquivo | Bookmarklet |
---|---|
Archive.org | javascript : void ( window . open ( 'https://web.archive.org/web/*/' + location . href ))
|
UKGWA | javascript : void ( window . open ( 'http://webarchive.nationalarchives.gov.uk/*/' + location . href ))
|
Se várias datas de arquivamento estiverem disponíveis, use aquela que provavelmente seja o conteúdo da página vista pelo editor que inseriu a referência no |access-date=
. Se esse parâmetro não for especificado, uma pesquisa no histórico de revisão do artigo pode ser realizada para determinar quando o link foi adicionado ao artigo.
Visualize o arquivo para verificar se ele contém informações válidas da página. Normalmente, as datas mais próximas ao momento em que o link foi colocado na página da Wikipedia, ou antes, têm mais probabilidade de mostrar informações válidas.
Se você encontrar um URL de arquivo adequado, poderá adicioná-lo à citação. Se a citação usa um dos modelos comuns (por exemplo, {{ cite web }}, {{ cite news }}, {{ Citation }}), então você pode editar da seguinte forma:
- Deixe o
|url=
inalterado, apontando para o URL de origem. - Adicione
|archive-url=
, apontando para o URL do arquivo. - Adicionar
|archive-date=
, especificando a data em que a cópia arquivada foi salva. O formato AAAA-MM-DD é geralmente o mais fácil, mas qualquer formato pode ser usado. - Adicione ou altere
|url-status=
. Use|url-status=dead
se o URL antigo não funcionar. Use|url-status=unfit
ou|url-status=usurped
se o URL antigo tiver sido usurpado para fins de spam, publicidade ou não for adequado. Use|url-status=live
se|url=
ainda funcionar e fornecer as informações corretas, mas você deseja adicionar um|archive-url=
. - Deixe o
|access-date=
inalterado, referindo-se à data em que um editor anterior acessou o|url=
. Alguns editores acreditam que|access-date=
devem ser removidos assim que um trabalho|archive-url=
for estabelecido, uma vez que o|url=
não está mais disponível, mantendo uma|access-date=
desordem redundante.
Mitigando um link morto
Às vezes, todas as tentativas de reparar o link serão malsucedidas. Nesse caso, considere encontrar uma fonte alternativa para que a perda do original não prejudique a verificabilidade do artigo. Fontes alternativas sobre tópicos abrangentes geralmente são facilmente localizadas. Uma simples consulta de mecanismo de busca pode localizar uma alternativa apropriada, mas seja extremamente cuidadoso para evitar citar espelhos e bifurcações da própria Wikipedia , o que violaria Wikipedia: Verificabilidade .
Às vezes, encontrar uma fonte apropriada não é possível ou exigiria técnicas de pesquisa mais extensas, como uma visita a uma biblioteca ou o uso de um banco de dados baseado em assinatura. Se for esse o caso, considere consultar os editores da Wikipedia em Wikipedia: WikiProject Resource Exchange , Wikipedia: Village pump ou Wikipedia: Help desk . Além disso, considere entrar em contato com especialistas ou outros editores interessados em um WikiProject relevante .
Às vezes, um link está morto porque o site mudou o URL (por exemplo, http://example.com mudou para http://example.co.uk ). Se você descobrir uma alteração de URL como esta, envie uma solicitação em WP: BOTREQ para uma mudança de url. Um bot fará a mudança.
Manter links mortos
Um URL de origem desarquivado e morto ainda pode ser útil. Esse link indica que as informações eram (provavelmente) verificáveis no passado, e o link pode fornecer a outro usuário mais recursos ou experiência com informações suficientes para encontrar a referência. Ele também pode retornar dos mortos. Com um link morto, é possível determinar se ele foi citado em outro lugar ou entrar em contato com o responsável original pela fonte. Por exemplo, pode-se entrar em contato com o departamento de Ciência da Computação de Yale se http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf [ link morto ] estiver morto.
Coloque {{ dead link | date = September 2021}} após a citação morta, imediatamente antes da </ref>
tag se aplicável, deixando o link original intacto. Marcar links mortos sinaliza para editores e para bots de links que este link precisa ser substituído por um link de arquivo. Colocar {{ link morto }} também categoriza automaticamente o artigo em Artigos com categoria de projeto de links externos mortos e em categoria de intervalo de data mensal específica com base no |date=
parâmetro. Não exclua uma citação só porque ela foi marcada com {{ link morto }} por um longo tempo.
Rotação de links em sites não pertencentes à Wikimedia
Sites não pertencentes à Wikimedia também são suscetíveis ao apodrecimento de links. Após uma mudança de página ou exclusão de página , os links para páginas da Wikipedia de outros sites podem quebrar. Na maioria das movimentações de página, um redirecionamento permanecerá na página antiga - isso não causará problemas. Mas se uma página for completamente excluída ou usurpada (ou seja, substituída por outro conteúdo), a podridão do link terá sido causada em qualquer site externo com link para ela.
A substituição do conteúdo da página por uma página de desambiguação ainda pode causar o apodrecimento do link, mas é menos prejudicial porque uma página de desambiguação é essencialmente um tipo de redirecionamento suave que levará o leitor ao conteúdo necessário. Se uma página for usurpada com conteúdo para outro assunto que compartilha seu nome, uma nota de chapéu pode ser colocada no topo que direciona os leitores para o conteúdo original em sua nova página - isso novamente é um tipo de redirecionamento suave, mas menos óbvio. Nesses casos, os leitores que chegam de um link externo podre devem ser capazes de encontrar o que procuram, mas é melhor evitar a situação, pois eles teriam que chegar lá por meio de uma página adicional, potencialmente dando uma impressão ruim da Wikipedia e o site de link.
Como o software da Wikipedia não armazena Referer
informações , será impossível dizer quantas páginas externas da web serão afetadas por uma mudança ou exclusão, mas o risco de apodrecimento do link será provavelmente maior em páginas mais antigas e de perfil mais alto. Na verdade, não há muito que possa ser feito; a manutenção de sites não pertencentes à Wikimedia não está dentro do escopo de ser um Wikimediano, nem na maioria dos casos dentro de nossa capacidade (embora se eles puderem ser consertados, seria útil fazê-lo). No entanto, pode ser uma boa prática pensar sobre o impacto potencial em outros sites ao excluir ou mover páginas da Wikipedia, especialmente se nenhum redirecionamento ou nota permanecerá. Se for esperado que uma movimentação ou exclusão cause danos significativos, então este pode ser um fator a considerar em WP: RM ,WP: AFD e WP: Discussões RFD , embora outros fatores possam ter mais peso.
Veja também
Ensaios
Ferramentas e guias de procedimentos
- Wikipedia: solicitações de alteração de link / URL - solicite ajuda para alterar muitas URLs ou marque-as como mortas
- Ajuda: Usando a Wayback Machine - guia prático
- Wikipedia: Usando o WebCite - guia prático (observação: a partir de junho de 2019, o WebCite não aceita mais novas solicitações de arquivamento)
- Wikipedia: Usando Archive.is - guia prático
- Especial: LinkSearch - para encontrar todas as páginas que contêm um URL específico
- Wikipedia: Citando fontes / Outras considerações # Arquivamento preventivo - breve guia sobre como usar vários serviços de arquivamento
- Wikipedia: Citando fontes # Prevenindo e reparando links inativos
- Wikipedia: Links externos # Longevidade dos links - prescreve a remoção de URLs inativos da seção "Links externos"
- Categoria: artigos com URLs simples para citações - o acúmulo de artigos contendo URLs simples com risco de podridão do link, subdivididos por mês
- Categoria: Artigos com links externos inativos - o backlog de artigos contendo links inativos, sub-categorizados por mês
Bots
- InternetArchiveBot (IABot) - corrige automaticamente links inativos sempre que possível e os marca quando não estão
- WaybackMedic - corrige automaticamente links inativos que são difíceis de determinar, outras correções gerais
- Usuário: Legobot - pode massificar links com tags . As solicitações podem ser feitas em User talk: Legoktm .
{{dead link}}
links externos
- Complemento oficial do Wayback para Firefox e Chrome [nota 1]
- Resurrect Pages , uma ferramenta complementar de terceiros fornece links para sete sites de cache / arquivo ao se deparar com um link morto. (Raposa de fogo)
- Webcache , add-on para Opera. (descontinuado; complementos semelhantes mais recentes disponíveis)
- weblinkchecker.py - script da coleção Python Wikipedia Bot que encontra links externos corrompidos.
Notas
- ^ "Salvar páginas na máquina de retorno" . Centro de Ajuda do Internet Archive . 24/08/2018.