Article précédent sommaire next


Nouvelles de la Bibliothèque nationale
Octobre 1997
Vol. 29, no 10



L'archivage des publications électroniques : le rôle de la Bibliothèque nationale du Canada

par Nancy Brodie,
Gestion des ressources en information

Le mandat de la Bibliothèque nationale du Canada consiste à rassembler, à conserver et à rendre accessibles les publications qui font partie du patrimoine canadien, qui comprend désormais les publications électroniques. Traditionnellement, la Bibliothèque a laissé « l'archivage » à son institution soeur, les Archives nationales du Canada.

La Bibliothèque rassemble de l'information publiée, tandis que les Archives se concentrent sur de l'information non publiée. Mais les développements technologiques signifient que certains aspects de l'archivage peuvent s'appliquer également à de l'information publiée et non publiée.

Les stratégies en matière de collection élaborées par divers projets de bibliothèque numérique démontrent l'évolution de cette utilisation. Le Berkeley Digital Library SunSITE a créé une Politique de collection et de conservation pour la bibliothèque numérique1 qui comprend quatre niveaux de collection, notamment l'archivage, décrit comme suit : « Les documents sont conservés à l'institution. L'institution compte conserver le contenu intellectuel des documents disponibles de façon permanente. » La Bibliothèque nationale de l'Australie définit le terme « archiver » comme « le téléchargement d'Internet et le stockage sur le serveur de la Bibliothèque ou une forme quelconque de stockage hors ligne. Le terme ‘conserver' sert à désigner l'adoption de certaines étapes, notamment l'archivage, l'organisation, la description, la mise à jour et la migration de titres, afin de s'assurer que la Bibliothèque peut continuer de rendre accessibles à long terme les publications. » 2 Le présent article entend par « archivage » la collecte, la conservation et la mise à disposition à long terme des publications.

Le défi que pose l'archivage des publications électroniques représente une question clé dans le programme des bibliothèques numériques. Des bibliothèques canadiennes ont exprimé leur inquiétude, en particulier concernant l'archivage de l'information gouvernementale électronique, dans des résolutions lors de la Conférence de juin 1996 de la Canadian Library Association et auprès du Comité consultatif de la Bibliothèque sur le Programme des services de dépôt. L'enquête entreprise par la Bibliothèque nationale dans le cadre de la Consultation nationale sur les collections numériques sondait les intentions des bibliothèques quant à l'archivage. 3

Les buts de l'archivage

L'archivage doit conserver l'intégrité d'une publication électronique et en garantir l'authenticité. Le rapport du Task Force on Archiving Digital Information décrit la conservation de l'intégrité de l'information comme étant « définir et conserver les caractéristiques d'un objet d'information qui le distinguent à titre d'oeuvre singulière et complète », et énumère les caractéristiques de l'intégrité comme étant « le contenu, la fixité, la référence, la provenance et le contexte ». 4 Les publications doivent être complètes et un document d'archives devrait être exhaustif selon la définition de sa portée de collection. Il devrait y avoir l'assurance d'un accès fiable et continu aux publications archivées.

Responsabilité de l'archivage

On ne saurait trop insister pour que les bibliothèques nationales assument la responsabilité importante d'archiver des publications électroniques. Au Canada, ce rôle s'ajoute au rôle traditionnel de la Bibliothèque nationale.

On invoque que les documents d'archives de publications électroniques sont un bien public, mais ils sont utilisés peu souvent et pour les entreprises commerciales, ils ne constitueraient pas une activité rentable. Quant à elles, les bibliothèques nationales sont en mesure de soutenir un bien public; les collections en dépôt légal constituent des sources qui font autorité en ce qui concerne les publications d'un pays; les bibliothèques nationales adoptent une visée à long terme, et il est improbable qu'elles « cessent leurs activités ». En vertu des principes du Programme fondamental d'accessibilité universelle des publications (AUP) de la Fédération internationale des associations de bibliothécaires et des bibliothèques, il incombe à chaque pays de rendre accessible ses publications. Les bibliothèques nationales s'attaquent à la question de l'archivage électronique dans le cadre de leur rôle en matière d'accessibilité universelle des publications. Au Canada, il est logique que la Bibliothèque nationale s'occupe du développement et du financement de l'infrastructure afin de soutenir l'archivage des publications électroniques à la Bibliothèque nationale.

Activités de la Bibliothèque nationale

La Bibliothèque nationale archive des publications électroniques canadiennes en réseau depuis 1994, au départ dans le cadre de son Projet pilote sur les publications électroniques (PPPE) et par la suite, à titre de collection électronique permanente (voir « Bâtir une collection électronique », Nouvelles de la Bibliothèque nationale, vol. 29, nos 3-4, mars-avril 1997, p. 9). Les publications électroniques sont rassemblées suivant les politiques de collection de l'institution et des critères de sélection spécialisés. Les publications électroniques sont reçues par courrier électronique, ou copiées, téléchargées, ou reproduites à partir d'un site miroir d'Internet, stockées sur un serveur et rendues accessibles par le W3. La Bibliothèque élabore des directives, crée une infrastructure de bibliothèque numérique, forme du personnel, met à l'essai des stratégies d'accès et surveille les faits nouveaux en matière de conservation afin de contribuer à l'avancement des activités d'archivage.

La Bibliothèque nationale entend par « publication électronique » tout travail codé et rendu accessible au public par son créateur au moyen d'un ordinateur. Une « publication électronique à accès éloigné » est celle qui est rendue accessible par un réseau de communication. Une « publication électronique tangible » est celle qui est publiée sur un support physique, tel une disquette ou un cédérom. La Bibliothèque a défini une « publication électronique à accès éloigné canadienne » comme toute oeuvre encodée rendue accessible pour le public par l'utilisation d'un ordinateur par son auteur, qui a son origine au Canada, ou qui provient d'ailleurs si l'auteur est canadien ou que l'oeuvre porte sur un sujet canadien. Les critères de sélection donnent aux membres du personnel des priorités dans les limites de cette vaste définition, et certaines catégories de ressources d'information ont été exclues.

De quelle façon les politiques et les pratiques de la Bibliothèque influent-elles sur les objectifs d'archivage décrits ci-dessus ? Quels sont les défis importants?

Intégrité

Les publications électroniques actuelles inexistantes sur support autre qu'électronique constituent une priorité pour l'acquisition. La Bibliothèque privilégie les publications électroniques publiées par l'auteur, plutôt qu'acquises d'une source secondaire. L'acquisition hâtive auprès de l'éditeur offre la meilleure chance de conserver l'intégrité d'une publication.

La Bibliothèque acquiert et stocke également des versions d'une publication qui a été modifiée, et élabore une terminologie standard pour décrire les versions. À l'heure actuelle, ces étiquettes de description ne sont pas évidentes pour ceux qui accèdent à la publication au moyen d'un moteur de recherche, autrement dit l'usager ne peut immédiatement discerner quelle version repérée est la plus à jour. La Bibliothèque aborde ce problème.

La préservation des liens constitue un autre défi. On considère que le HTML est un bon format pour archiver car il s'agit d'une norme publique accessible par beaucoup de navigateurs. Le PPPE recommandait que la Bibliothèque interprète la frontière d'une publication électronique comme étant normalement les objets liés dans un domaine d'Internet. Mais l'acquisition, le stockage et la fourniture de l'accès même à cet ensemble de liens se sont avérés un défi de taille. Ce qu'il faut, c'est que les éditeurs produisent des publications « transportables », et que les bibliothèques se dotent de meilleures normes et de meilleurs outils pour gérer les documents hypertextes.

La Bibliothèque n'a pas encore adopté le marquage de l'heure et les signatures numériques, mais les tient pour essentiels pour conserver l'intégrité.

Authenticité

Les notices bibliographiques standard de la Bibliothèque sont considérées comme des sources d'autorité, et la Bibliothèque entend bien que ces notices pour sa collection électronique le soient également. Les oeuvres de la collection électronique sont cataloguées pour Canadiana, la bibliographie nationale.

État complet

La Bibliothèque ne rassemble que des publications électroniques complètes, et n'acquiert pas d'abrégés, de résumés, de tables des matières ou de sites promotionnels. Si des versions multiples d'une publication électronique existent en différents formats, la Bibliothèque acquiert les formats standard, publics, à moins que les versions en formats privés soient plus complètes. Par exemple, si une publication est disponible en ASCII et PDF (format de document transférable), mais que certains tableaux ne sont disponibles ou lisibles qu'en version PDF, la Bibliothèque acquerra la version PDF. Des procédures standard de vérification de publications en série s'appliquent aux publications en série électroniques. Le soutien automatisé en vue d'acquérir des revues électroniques est encore sous étude, et des robots du W3 pourraient aider dans ce domaine.

Assurance de l'accès

Un document d'archives doit être accessible avec la technologie actuelle, de préférence au moyen d'une technologie du domaine public largement accessible. Les documents d'archives de la Bibliothèque nationale sont accessibles par le W3, mais les documents dans les archives se présentent sous divers formats. Certains ne sont pas accessibles à des navigateurs W3 en mode texte, et certains exigent des logiciels privés pour visualiser ou imprimer. La Bibliothèque peaufine ses critères de sélection concernant les formats pour équilibrer la nécessité de l'état complet, la facilité d'acquisition et l'assurance de l'accès.

Pérennité

Les supports électroniques sont fragiles quand on les compare à l'imprimé ou à la microforme, et on ne peut les utiliser qu'avec des matériels et des logiciels donnés dont la durée de vie peut être encore plus courte que celle des supports électroniques eux-mêmes. La Bibliothèque crée des copies de sauvegarde chaque jour de sa collection électronique, rafraîchissant ainsi l'information numérique. Toutefois, 20 ans d'expérience à conserver des notices de catalogage lisibles par machine ont créé la nécessité de faire migrer l'information numérique d'une configuration de matériel-logiciel à une autre. Il peut être impossible de conserver une réplique du document électronique originel durant le processus, de sorte que l'objectif consistera à conserver l'intégrité du document.

Conclusion

Beaucoup de défis se posent lorsque vient le temps de créer et de mettre à jour un service d'archives de publications électroniques. Ni la Bibliothèque nationale, ni les milieux bibliothéconomiques n'ont de solutions à tous ces défis. L'approche de la Bibliothèque consiste à démontrer son engagement envers la conservation du patrimoine canadien d'édition électronique en procédant à des activités d'archivage, et en apprenant par la pratique, méthode facilitée par des activités de coopération comme l'Initiative canadienne sur les bibliothèques numériques et le Groupe de travail fédéral sur la numérisation. Ce n'est que par la collaboration et le partage de l'information et de l'expérience que nous pourrons relever ces défis.

Pour plus de renseignements, communiquer avec :
Nancy Brodie
Gestion des ressources en information
Bibliothèque nationale du Canada
395, rue Wellington
Ottawa (Ontario)
K1A 0N4
Téléphone : (613) 947-5887
Télé copieur : (613) 996-3573
ATME : (613) 992-6969
Internet : nancy.brodie@nlc-bnc.ca

Notes:

1 Digital Library SunSITE Collection and Preservation Policy. Berkeley Digital Library SunSITE. 1996 (URL: http://sunsite.berkeley.edu/Admin/)

2 National Library of Australia. Selection Committee on Online Australian Publications (SCOAP). Guidelines for the Selection of Online Australian Publications Intended for Preservation by the National Library. 1996 (URL: http://www.nla.gov.au/1/scoap/scoapgui.html).

3 Susan Haigh. Les ressources numériques dans les bibliothèques canadiennes : analyse d'une enquête de la Bibliothèque nationale. Bibliothèque nationale du Canada. 1997.

4 Preserving Digital Information: Report of the Task Force on Archiving Digital Information. Commission on Preservation and Access and the Research Libraries Group. 1996. P.12.


Canada
Droit d'auteur. La Bibliothèque nationale du Canada. (Révisé : 1998-02-06)