L’archive comme horizon : le web face à la conquête de notre passé numérique
Résumé
La volonté de conserver et de documenter les sites et contenus accessibles sur le Web pour en rendre possible l’histoire a démarré peu de temps après la diffusion du Web. Si l’objectif général de l’archivage du Web avec toutes les difficultés qui lui sont inhérentes est clair, comment définir ce que l’on cherche à conserver ? Dans le cadre législatif français, cet objectif s’inscrit dans l’obligation de dépôt légal et spécifiquement du dépôt légal des documents numériques. Aux États-Unis, Internet Archive se présente comme une bibliothèque numérique de sites Internet et autres artefacts culturels qui ont un format numérique. On voit là la diversité des approches qui, dans tous les cas, proposent des dispositifs dédiés aux publications et non aux archives. Les matériaux collectés dans les divers projets d’archivage du Web ne rentrent dans aucune définition du concept d’archive. Par ailleurs, l’informatique multiplie le recours à ce concept. Cet article est une enquête sur le sens du concept d’archive appliqué aux matériaux numériques depuis l’émergence du Web. De la traçabilité numérique à l’archivage informatique en passant par « les archives ouvertes » nées avec le Web, le champ sémantique de l’archive ne cesse de s’élargir avec le développement de l’informatique. Cet élargissement est en même temps celui des outils, des objets, des acteurs qui forment des infrastructures du savoir par lesquelles se construit la connaissance de notre passé numérique. La valeur archivistique des matériaux numériques intégrés dans ces infrastructures reste un horizon déjà préfiguré et qui reste à conquérir.