Peu de travaux d’écriture, ces dernières semaines. Mes activités récentes ont été techniques: j’ai transféré vers un hébergement WordPress le contenu d’un site produit avec un gestionnaire de contenu obsolète. Ce travail a pris plusieurs jours. Pas d’automatisation possible: c’est manuellement que j’ai déplacé quelque 400 articles publiés depuis 2002 sur ce site-là ainsi que les photographies ou les documents PDF qui y étaient associés. Sans parler de la création de redirections, pour m’assurer que l’ancienne adresse de chaque article redirige vers la nouvelle, afin d’assurer la permanence de l’accès au contenu — impossible, en effet, de conserver la même architecture de site dans le nouvel environnement.
Cela a été l’occasion de me rendre compte que mon souci de pérennité (naturel pour l’historien que je suis) est loin de se trouver partagé. En transférant article après article, j’ai décidé de contrôler si les liens qu’ils contenaient fonctionnaient toujours. J’en ai ainsi vérifié plusieurs centaines. Et, bien sûr, j’ai découvert que beaucoup d’hyperliens ne conduisaient que vers le cybervide ou des pages d’«erreur 404». Certains sites de référence se signalent par une belle constance: les informations publiées par la BBC ou par RFI en 2002 répondent toujours présentes. Mais, au vu de mes expériences des derniers jours, ce n’est probablement le cas que d’un grand média sur deux, au mieux.
J’avais aussi une page de liens soigneusement sélectionnés par rapport au sujet traité sur le site. Bien plus de la moitié n’étaient plus valables. Et pas seulement des liens de petits sites: même de grosses structures changent d’adresse Internet sans même penser à rediriger au moins les pages de l’ancien site vers la page d’accueil du nouveau, à défaut de cibler la destination page par page.
J’ai été sidéré de constater combien de projets ambitieux, académiques ou autres, semblent oubliés pour passer ensuite à autre chose: plusieurs noms de domaine destinés à des projets précis n’ont même pas été renouvelés par leurs propriétaires et, une fois tombés en déshérence, ont été rachetés par d’autres personnes qui tentent d’utiliser le trafic encore existant pour des contenus publicitaires ou autres. Nous ne parlons que de sites qui étaient tous actifs il y a dix ans encore…
Parfois, il n’y a pas trop à le regretter: certains contenus ne méritent que la disparition plutôt que d’encombrer la mémoire de disques durs. C’est pourtant loin d’être le cas de tous. Et j’éprouve un vertige en pensant à ce que cela signifie à long terme.
Il convient d’autant plus de dire notre reconnaissance au groupe qui a lancé, dès 1996, Internet Archive et son extraordinaire Wayback Machine: plus d’une fois, cela m’a permis de retrouver un contenu disparu partout ailleurs, mais encore archivé, et de pouvoir ainsi créer un lien vers la page d’Internet Archive. Avec près de 500 milliards de pages archivées (à condition que les propriétaires des sites ne s’y opposent pas), Internet Archive apporte une valeureuse contribution à la lutte contre l’Alzheimer du Web.