Wikipédia : pourriture des liens
Comme la plupart des grands sites Web , Wikipedia souffre du phénomène connu sous le nom de pourriture des liens , où les liens externes deviennent morts , car les pages Web liées ou les sites Web complets disparaissent, modifient leur contenu ou se déplacent sans redirection HTML. Cela représente une menace importante pour la politique de fiabilité de Wikipédia et sa directive de citation de source .
En général, ne supprimez pas les informations citées uniquement parce que l'URL de la source ne fonctionne plus. Des outils, des procédures et des processus sont disponibles, comme indiqué dans ce document.
Prévenir la pourriture des liens
Archivage automatique
Les liens ajoutés par les éditeurs à l'espace principal de Wikipédia en anglais sont automatiquement enregistrés sur Wayback Machine dans un délai d'environ 24 heures (nb. En pratique, tous les liens ne sont pas enregistrés pour diverses raisons). Ceci est fait avec un programme appelé "NoMore404" qu'Internet Archive exécute et maintient ; des sites wiki d'autres langues sont inclus. Il surveille l' API EventStreams , extrait de nouvelles URL externes et ajoute un instantané au Wayback. Ce système est devenu actif quelque temps après 2015, bien que des efforts antérieurs aient également été déployés. Aussi, quelque temps après 2012, archive.today(aka archive.is) a tenté d'archiver tous les liens externes existant alors sur Wikipedia à ce moment-là. Ceci était incomplet, mais un nombre important de liens ont été ajoutés à archive.today au cours de cette période, ce qui en fait une source d'archives majeure comblant les lacunes de la couverture. Archive.today crée toujours des archives automatisées à partir de 2020, bien que l'étendue de la couverture et la fréquence soient inconnues.
Depuis 2015, il existe un bot et un outil Wikipédia appelé WP:IABOT qui automatise la correction de la pourriture des liens. Il vérifie en permanence tous les articles de Wikipédia si un lien est mort, ajoute des archives à Wayback Machine (si ce n'est pas encore le cas) et remplace les liens morts dans le wikitexte par une version archivée. Ce bot s'exécute automatiquement mais il peut également être dirigé par les utilisateurs finaux via son interface web. Il est disponible lors de la visualisation de l'historique de n'importe quelle page, situé près du haut de la page sur la ligne "Outils externes", avec l'option "Réparer les liens morts".
À partir de 2015, le bot périodique WP:WAYBACKMEDIC vérifie la pourriture des liens dans les liens d'archive eux-mêmes. Les bases de données d'archives sont dynamiques et changeantes, les archives disparaissent, se déplacent, de nouvelles sont ajoutées, etc. Ce bot maintient les liens d'archives existants sur Wikipedia anglais. Il fait également l'archivage sur demande chez WP:URLREQ , c'est un outil flexible qui peut faire de nombreux travaux personnalisés.
Archivage manuel
Suggestions pour améliorer manuellement l'archivage :
- Évitez les URL nues . Utilisez des modèles de citations tels que les citations et les sections de liens externes.
{{cite web}}
{{webarchive}}
- Utilisez un service d' archivage Web tel qu'Internet Archive ou Archive.today . Une liste complète est disponible sur WP:List of web archives on Wikipedia . Dans les modèles de citation, placez l'URL de l'archive
|archive-url=
et ajoutez un fichier|archive-date=
. Si le lien est toujours valide, incluez|url-status=live
, sinon définissez|url-status=dead
. - Si le lien est toujours actif mais pas encore archivé, visitez le site Web du service d'archives de votre choix et demandez que la page soit archivée.
- Exécutez WP:IABOT sur les pages via son interface utilisateur.
Méthodes alternatives
La plupart des modèles de citation ont un |quote=
paramètre qui peut être utilisé pour stocker des citations textuelles du matériel source. Cela peut être utilisé pour stocker une quantité limitée de texte de la source dans le modèle de citation. Ceci est particulièrement utile pour les sources qui ne peuvent pas être archivées avec des services d'archivage Web. Il peut également fournir une assurance contre la défaillance du service d'archivage Web choisi. Le stockage de l'intégralité du texte de la source n'est pas approprié dans le cadre des politiques d'utilisation équitable , alors choisissez uniquement les parties les plus importantes du texte qui soutiennent le mieux les affirmations de l'article de Wikipédia. Le cas échéant, les documents du domaine public peuvent être copiés sur Wikisource .
Réparer un lien mort
Il existe plusieurs façons d'essayer de réparer un lien mort, détaillées ci-dessous :
Recherche
Si le lien mort comprend suffisamment d'informations (titre de l'article, noms, etc.), il est souvent possible de l'utiliser pour trouver la page Web à un endroit différent, soit sur le même site, soit ailleurs.
Souvent, les pages Web sont simplement déplacées au sein du même site. Un index de site ou une fonction de recherche spécifique au site est un endroit utile pour localiser la page déplacée. Si ces outils ne sont pas disponibles, de nombreux moteurs de recherche Internet permettent une recherche sur un site spécifié.
A défaut, la recherche de la page sur Internet peut trouver des alternatives.
Si vous trouvez une nouvelle URL appropriée, vous pouvez modifier les paramètres dans la citation. Si la citation utilise l'un des modèles courants (par exemple {{ cite web }}, {{ cite news }}, {{ Citation }}), vous pouvez modifier comme suit :
- Modifiez le
|url=
pour pointer vers la nouvelle URL ; - Modifiez ou ajoutez
|access-date=
pour faire référence à la date actuelle.
Archives Internet
Recherchez les versions archivées sur l'un des nombreux services d'archivage Web. Les services d'archives "Big 3" sont web.archive.org , webcitation.org et archive.is . Ceux-ci représentent plus de 90% de toutes les archives sur Wikipedia, avec web.archive.org représentant plus de 80% de tous les liens d'archives. D'autres services d'archives sont répertoriés sur WP:WEBARCHIVES .
L' interface Mementos permet de rechercher plusieurs services d'archivage avec une seule recherche. La base de données Memento est mise en cache, ce qui signifie que les résultats sont renvoyés rapidement, mais le cache devient également obsolète. Par conséquent, il ne doit pas être considéré comme le dernier mot – très souvent, il peut signaler qu'aucune archive n'est disponible, alors qu'elles le sont réellement. Vous devrez peut-être encore effectuer le travail de vérification des sites d'archives individuels, mais Mementos peut être une première vérification rapide.
Site d'archives | Marque-page |
---|---|
Archives.org | javascript : void ( window . open ( 'https://web.archive.org/web/*/' + location . href ))
|
UKGWA | javascript : void ( window . open ( 'http://webarchive.nationalarchives.gov.uk/*/' + location . href ))
|
Si plusieurs dates d'archivage sont disponibles, utilisez celle qui est le plus susceptible d'être le contenu de la page vue par l'éditeur qui a entré la référence sur le |access-date=
. Si ce paramètre n'est pas spécifié, une recherche dans l'historique des révisions de l'article peut être effectuée pour déterminer quand le lien a été ajouté à l'article.
Affichez l'archive pour vérifier qu'elle contient des informations de page valides. Habituellement, les dates plus proches du moment où le lien a été placé sur la page Wikipédia, ou plus tôt, sont plus susceptibles d'afficher des informations valides.
Si vous trouvez une URL d'archive appropriée, vous pouvez l'ajouter à la citation. Si la citation utilise l'un des modèles courants (par exemple {{ cite web }}, {{ cite news }}, {{ Citation }}), vous pouvez modifier comme suit :
- Laissez
|url=
inchangé, en pointant vers l'URL source. - Ajouter
|archive-url=
, pointant vers l'URL de l'archive. - Ajouter
|archive-date=
, en spécifiant la date à laquelle la copie archivée a été enregistrée. Le format AAAA-MM-JJ est généralement le plus simple, mais n'importe quel format peut être utilisé. - Ajouter ou modifier
|url-status=
. À utiliser|url-status=dead
si l'ancienne URL ne fonctionne pas. Utilisez|url-status=unfit
ou|url-status=usurped
si l'ancienne URL a été usurpée à des fins de spam, de publicité ou est autrement inappropriée. Utilisez|url-status=live
si|url=
fonctionne toujours et donne toujours les informations correctes, mais vous souhaitez ajouter de manière préventive un fichier|archive-url=
. - Laissez
|access-date=
inchangé, en vous référant à la date à laquelle un éditeur précédent a accédé pour la dernière fois au fichier|url=
. Certains éditeurs pensent qu'il|access-date=
devrait être supprimé une fois qu'un travail|archive-url=
est établi, car il|url=
n'est plus disponible, ce qui maintient un|access-date=
encombrement redondant.
Atténuer un lien mort
Parfois, toutes les tentatives pour réparer le lien seront infructueuses. Dans ce cas, envisagez de trouver une autre source afin que la perte de l'original ne nuise pas à la vérifiabilité de l'article. Les sources alternatives sur des sujets généraux sont généralement faciles à trouver. Une simple requête de moteur de recherche peut localiser une alternative appropriée, mais soyez extrêmement prudent pour éviter de citer des miroirs et des fourches de Wikipedia lui-même, ce qui violerait Wikipedia:Verifiability .
Parfois, il n'est pas possible de trouver une source appropriée ou nécessiterait des techniques de recherche plus poussées, comme une visite dans une bibliothèque ou l'utilisation d'une base de données par abonnement. Si tel est le cas, envisagez de consulter les éditeurs de Wikipedia sur Wikipedia:WikiProject Resource Exchange , Wikipedia:Village pump ou Wikipedia:Help desk . Envisagez également de contacter des experts ou d'autres éditeurs intéressés d'un WikiProject pertinent .
Parfois, un lien est mort parce que le site Web a déplacé l'URL (par exemple, http://example.com a été déplacé vers http://example.co.uk ). Si vous découvrez un changement d'URL comme celui-ci, veuillez soumettre une demande à WP:BOTREQ pour un déplacement d'URL. Un bot fera le changement.
Garder les liens morts
Une URL source morte et non archivée peut toujours être utile. Un tel lien indique que l'information était (probablement) vérifiable dans le passé, et le lien pourrait fournir à un autre utilisateur des ressources ou une expertise plus importantes avec suffisamment d'informations pour trouver la référence. Il pourrait aussi revenir d'entre les morts. Avec un lien mort, il est possible de déterminer s'il a été cité ailleurs, ou de contacter la personne à l'origine responsable de la source. Par exemple, on pourrait contacter le département informatique de Yale si http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf [ lien mort ] était mort.
Placez {{ lien mort |date=août 2021}} après la citation morte, immédiatement avant la </ref>
balise le cas échéant, en laissant le lien d'origine intact. Le fait de marquer des liens morts signale aux éditeurs et aux robots de liaison que ce lien doit être remplacé par un lien d'archive. Placer {{ lien mort }} classe également automatiquement l'article dans la catégorie de projet Articles avec des liens externes morts et dans une catégorie de plage de dates mensuelle spécifique en fonction du |date=
paramètre. Ne supprimez pas une citation simplement parce qu'elle a été taguée avec {{ lien mort }} pendant longtemps.
Lien pourrir sur des sites non-Wikimedia
Les sites non-Wikimedia sont également sensibles à la pourriture des liens. À la suite d'un déplacement de page ou d' une suppression de page , les liens vers les pages Wikipédia d'autres sites Web peuvent se rompre. Dans la plupart des déplacements de page, une redirection restera sur l'ancienne page, cela ne posera pas de problème. Mais si une page est complètement supprimée ou usurpée (c'est-à-dire remplacée par un autre contenu), alors la pourriture des liens aura été causée sur tous les sites Web externes qui y renvoient.
Le remplacement du contenu de la page par une page de désambiguïsation peut toujours provoquer la pourriture des liens, mais est moins nocif car une page de désambiguïsation est essentiellement un type de redirection logicielle qui mènera le lecteur vers le contenu requis. Si une page est usurpée avec du contenu pour un autre sujet qui partage son nom, une note de chapeau peut être placée en haut pour diriger les lecteurs vers le contenu original de sa nouvelle page. Il s'agit encore une fois d'un type de redirection douce, mais moins évidente. Dans ces cas, les lecteurs arrivant d'un lien externe pourri devraient pouvoir trouver ce qu'ils recherchent, mais il vaut mieux éviter la situation car ils devraient y accéder via une page supplémentaire, ce qui pourrait donner une mauvaise impression à la fois de Wikipédia et le site Web de liaison.
Étant donné que le logiciel Wikipedia ne stocke pas d' Referer
informations , il sera impossible de dire combien de pages Web externes seront affectées par un déplacement ou une suppression, mais le risque de pourriture des liens sera probablement plus grand sur les pages plus anciennes et plus médiatisées. En vérité, il n'y a pas grand-chose à faire ; la maintenance de sites Web non-Wikimedia n'est pas dans le cadre d'être un Wikimédien, ni dans la plupart des cas dans notre capacité (bien que s'ils peuvent être corrigés, il serait utile de le faire). Cependant, il peut être judicieux de réfléchir à l'impact potentiel sur d'autres sites lors de la suppression ou du déplacement de pages Wikipédia, en particulier s'il ne reste aucune redirection ou note de chapeau. Si un déplacement ou une suppression est susceptible de causer des dommages importants, cela peut être un facteur à prendre en compte dans WP:RM ,Discussions WP:AFD et WP:RFD , bien que d'autres facteurs puissent avoir plus de poids.
Voir également
Essais
Outils et guides pratiques
- Wikipédia : demandes de changement d'URL/pourriture de lien – demandez de l'aide pour modifier de nombreuses URL ou les marquer comme mortes
- Aide : Utilisation de la Wayback Machine – guide pratique
- Wikipedia : Utilisation de WebCite – guide pratique (remarque : à partir de juin 2019, WebCite n'accepte plus les nouvelles demandes d'archives)
- Wikipédia : Utilisation d'Archive.is – guide pratique
- Special:LinkSearch – pour trouver toutes les pages qui contiennent une URL particulière
- Wikipédia: Citant des sources / D' autres considérations # archivage préemptive - bref guide sur la façon d'utiliser divers services d'archivage
- Wikipedia:Citation de sources#Prévenir et réparer les liens morts
- Wikipédia : Liens externes#Longévité des liens – prescrit la suppression des URL mortes de la section « Liens externes »
- Catégorie : articles avec des URL nues pour les citations – l'arriéré d'articles contenant des URL nues présentant un risque de pourriture des liens, sous-catégorie par mois
- Catégorie : Articles avec des liens externes morts - le backlog des articles contenant des liens morts, sous-catégorie par mois
Bots
- InternetArchiveBot (IABot) - corrige automatiquement les liens morts dans la mesure du possible et les marque quand ce n'est pas le cas
- WaybackMedic - corrige automatiquement les liens morts difficiles à déterminer, d'autres correctifs généraux
- Utilisateur : Legobot – peut étiqueter en masse les liens avec . Les demandes peuvent être faites à User talk:Legoktm .
{{dead link}}
Liens externes
- Module complémentaire Wayback officiel pour Firefox et Chrome [note 1]
- Resurrect Pages , un outil complémentaire tiers fournit des liens vers sept sites Web de cache/archives en cas de rencontre avec un lien mort. (Firefox)
- Webcache , module complémentaire pour Opera. (abandonné ; nouveaux modules complémentaires similaires disponibles)
- weblinkchecker.py —script de la collection Python Wikipedia Bot qui trouve les liens externes rompus.
Remarques
- ^ "Sauvegarder les pages dans la Wayback Machine" . Centre d'aide des archives Internet . 2018-08-24.