PAGE D'ACCUEILRECHERCHEINDEX DU SITEREMARQUESENGLISH
Publications*

Encoded Archival Description (EAD) et la création d'instruments de recherche électronique

par Sheila Comeau, consultante
Flash Réseau no 58
ISSN 1200-5304
Services de technologie de l'information
Bibliothèque nationale du Canada

Le 7 décembre 1998


Qu'est-ce qu'EAD?

EAD est un langage standard généralisé de balisage (SGML) conçu dans le but particulier de baliser les renseignements contenus dans des instruments de recherche archivistique. Les instruments de recherche sont des documents décrivant le contenu de collections de source primaire (p. ex., des fonds archivistiques, des bibliothèques d'imprimés et de photographies, des collections de manuscrits) disponibles dans les archives, les bibliothèques et les musées. Les instruments de recherche de type intellectuel décrivent les liens entre un groupe de notices et les entités administratives qui les ont créés; les instruments de recherche de type physique sont des outils administratifs utilisés par les archivistes pour trouver les documents dans la collection. On a traditionnellement créé et conservé des instruments de recherche dans divers formats imprimés et électroniques.

Naissance de la norme pour les instruments de recherche électronique

En 1993, une équipe de chercheurs en bibliothéconomie de la University of California à Berkeley a amorcé un projet visant à mettre au point une norme non propriétaire à plate-forme neutre pour la création d'instruments de recherche lisibles par machine que les divers réseaux pourraient partager. La norme devait être dotée de suffisamment de flexibilité pour faire fonctionner les liens intégrés de l'instrument de recherche aux documents numériques, tels des textes et des images balayés par scanner, des fichiers son, ou des renseignements descriptifs additionnels ou de fond, comme des bibliographies. Étant donné ces exigences, le groupe a considéré SGML.

Le SGML est une norme de l'ISO qui est actuellement employée dans divers secteurs, notamment au sein d'entreprises militaires, aéronautiques ainsi que dans les domaines de la haute technologie et des renseignements commerciaux. Le SGML fournit un cadre qui sert à définir la structure logique et les éléments des divers types de documents. La définition de document type en SGML est essentiellement un modèle ou un plan directeur qui précise les procédures SGML permises pour un ensemble donné de documents possédant une structure semblable.

La définition de document type définit officiellement les liens entre les divers éléments d'un document. Les instruments de recherche archivistique constituent des candidats appropriés pour la définition de document type parce qu'ils partagent des éléments communs sur le plan de l'information et de la structure. Les instruments de recherche comportent souvent diverses hiérarchies de description, qui s'échelonnent de renseignements concernant l'ensemble d'une collection archivistique à des notes portant sur des fichiers particuliers au sein d'une sous-collection d'une série au sein d'une collection.

La définition de document type d'EAD a été mise au point en réalisant une analyse importante des instruments de recherche actuels provenant d'un échantillonnage des archives et des bibliothèques. EAD, qui se fonde sur des normes archivistiques actuelles, tel ISAD(G) : general international standard archival description (norme générale internationale de description archivistique) et Rules for archival description (règles pour la description des documents d'archives), définit les éléments obligatoires et facultatifs qui composent les documents, à savoir en-tête, description et information complémentaire de l'instrument de recherche.

L'en-tête EAD renferme des renseignements portant sur le fichier électronique même et comprend un titre, une mention d'édition et l'auteur de l'instrument de recherche. La description EAD peut comprendre une description de collection (titre, créateur, étendue et un dépôt d'archives), des termes de recherche contrôlés (noms personnels et collectifs, des vedettes-matières), de l'information administrative (des détails sur l'acquisition, les restrictions d'utilisation et le traitement de la collection), une biographie historique ou organisationnelle du créateur, des notes sur la portée et le contenu de la collection et la description de la disposition physique et intellectuelle, de l'organisation et du contenu des séries au sein de la collection. L'information complémentaire comporte des renseignements supplémentaires portant sur la collection, comme une bibliographie ou un index.

L'accès aux instruments de recherche EAD

Pour visionner un instrument de recherche EAD dans son format de base SGML, un visualiseur SGML, tel Panorama, est requis. Le visualiseur SGML lit le document de l'instrument de recherche (le contenu), le fichier de définition de document type EAD (la structure) et un fichier de feuille de style qui donne les instructions au visualiseur concernant l'affichage des divers éléments. Un fichier de navigation est également requis pour définir les liens de « saut » au sein du document. Il peut s'avérer nécessaire de se procurer des fichiers de soutien additionnels pour procéder à un affichage adéquat du fichier.

En raison des frais généraux qu'il faut débourser pour visionner les fichiers SGML dans leur format de base, conjointement au fait qu'un module d'extension interne de visualisation ou de navigation SGML gratuit n'est pas disponible en ce moment, de nombreux sites EAD ont choisi d'offrir des conversions HTML de leurs instruments de recherche SGML. Bien qu'il puisse se produire une certaine perte de détails soulignés et d'information de navigation au cours du processus de conversion, le contenu de l'instrument de recherche peut être offert à quiconque possède un logiciel de navigation du Web. Les sites EAD ont adopté diverses approches par rapport au processus de conversion.

En conservant un « fichier maître » SGML de l'instrument de recherche à l'arrière-plan, les sites sont en mesure de procéder à un indexage et à un repérage spécifiques de certains éléments dans leurs collections d'instruments de recherche ou d'offrir leurs instruments de recherche au travail collectif EAD. L'adhésion à une norme internationale comme EAD assure les promoteurs que le contenu électronique qui a été stocké ne sera pas rendu désuet ou inaccessible par des modifications apportées à des logiciels particuliers. De plus, la définition de document type EAD joue le rôle d'un composant de base des collections intégrées et permet l'accès aux documents de source primaire dans de nombreux dépôts d'archives. Un avantage, dont on ne peut profiter immédiatement, pourrait également se concrétiser pour les adhérents à EAD au fur et à mesure que les systèmes progressent dans le développement du XML (langage de balisage de texte extensible). La Version 1.0 de définition de document type EAD, qui a été mise en marché récemment, est dotée d'« interrupteurs » intégrés qui lui permettent de fonctionner comme une définition de document type SGML et XML.

La création d'instruments de recherche de définition de document type EAD

Lorsqu'il crée un instrument de recherche en suivant la norme EAD, l'auteur inclut les éléments d'information de l'instrument de recherche dans les indicateurs définis par le logiciel de définition de document type. Le document est un simple fichier texte et il est semblable à un fichier source HTML :

<ADMININFO>

<HEAD>Administrative Information</HEAD>

<ACQINFO><P>The papers of <PERSNAME>John Smith</PERSNAME> (1880-1939), poet, were given to the <CORPNAME> Springfield Library </CORPNAME> in 1967 by Smith's wife, <PERSNAME>Leslie Smith </PERSNAME>.</ACQINFO>

<USERESTRICT><P>Copyright in the unpublished writings John Smith in these papers and in other collections of papers in the custody of the Springfield Library has been dedicated to the public.</P></USERESTRICT>

<PROCESSINFO><P> Selected artifacts have been transferred to the <CORPNAME>Smithsonian Institution</CORPNAME>.</P>

<P>The original register prepared by <PERSNAME>Bill Jones</PERSNAME> in 1969.</P></PROCESSINFO>

</ADMININFO>

<BIOGHIST>

<HEAD>Biographical Note</HEAD>

<CHRONLIST><CHRONITEM><DATE TYPE="long1">1880, June 20.</DATE><EVENT>Born, <GEOGNAME>Dayton, Ohio.</GEOGNAME></EVENT></CHRONITEM>CHRONLIST>

</BIOGHIST>

Cet extrait illustre les indicateurs des renseignements administratifs ainsi que des éléments et des sous-éléments biographiques.

Bien que des documents SGML puissent être créés en utilisant un simple programme d'édition, il existe divers outils logiciels SGML commerciaux, et offerts au grand public, qui aident à créer des documents encodés en SGML. Internet Archivist est un logiciel qui offre une interface fondée sur le format pour la création d'instruments de recherche compatibles avec EAD qui peuvent être sauvegardés comme des fichiers SGML ou HTML.

La University of California à Berkeley a mis à contribution la compétence interne pour mettre au point un générateur de modèle EAD fondé sur le Web pour les participants au projet d'Online Archive of California. Le modèle produit un instrument de recherche de base compatible avec EAD en fusionnant des renseignements tirés du profil des participants avec les données entrées dans le modèle. Le fichier produit est sauvegardé localement et les renseignements portant sur la liste précise du contenu sont ajoutés.

Bien que les outils logiciels facilitent le travail d'écriture en SGML, il est nécessaire de posséder une compréhension approfondie de la façon dont le logiciel représente et manipule les divers éléments du logiciel de définition de document type pour produire des instruments de recherche uniforme et de grande qualité. Parce que le SGML ne tolère pas les déviations de la définition de document type établie, la validation et la détection d'erreurs peut nécessiter un plus grand investissement qu'il ne l'était initialement prévu pour terminer l'instrument de recherche compatible avec EAD. Toutefois, l'avantage d'une telle rigueur est une uniformité accrue parmi les instruments de recherche.

Intégration et accès

Les sites EAD ont adopté diverses approches pour l'intégration des instruments de recherche aux outils de découverte des ressources. Certains sites, tels que la Library of Congress et la University of San Diego, créent des notices MARC pour chaque collection décrite par un instrument de recherche. Les notices MARC offrent un lien à l'outil de recherche complet à partir de la zone 856.

La plupart des sites participant aux projets d'instruments de recherche EAD consacrent une portion de leur site Web à la collection d'instruments de recherche. Le site EAD fournit habituellement de l'information de base et des directives sur l'utilisation des instruments de recherche, et comprend une interface de recherche consacrée à la collection. Souvent, un logiciel d'indexage spécialisé fonctionne à même la collection de l'instrument de recherche pour exploiter les indicateurs spécifiques des éléments des fichiers source SGML.

Conclusion

Comme dans le cas de tout projet SGML, un investissement initial considérable est requis pour l'adoption de la norme EAD, à la fois en matière de formation et de l'achat du matériel informatique spécialisé requis pour soutenir la collection de documents SGML.

Les enjeux concernant l'affichage et les options de sorties doivent être examinés. Le fait d'offrir seulement des versions SGML d'un instrument de recherche privera les utilisateurs qui ne possèdent pas le logiciel de visualisation SGML. Ceux qui possèdent le logiciel pourront considérer que le téléchargement du document SGML et de tous ses fichiers de soutien est long et frustrant. Les sites offrant une sortie HTML pourront choisir des trames d'image HTML, tandis que d'autres pourront convertir la source SGML à un seul fichier HTML. Chaque approche doit être évaluée selon l'accès, la navigation, l'impression et la sauvegarde de l'instrument de recherche.

Afin d'exploiter les métadonnées intégrées dans un instrument de recherche EAD, on doit consulter les systèmes des bibliothèques et les services techniques concernant les procédures de catalogage et les enjeux d'intégration EAD. Il pourra être nécessaire de revoir les procédures concernant l'utilisation des vedettes-matières et des fichiers d'autorité contrôlés pour les instruments de recherche. De plus, de nouveaux enjeux en ce qui a trait aux politiques pourront être soulevés dans le domaine des services de référence et de livraison des documents au fur et à mesure que l'on a accès, par l'intermédiaire des instruments de recherche électronique, à des renseignements accrus concernant les collections de source primaire au niveau local.

Les arguments les plus convaincants pour l'adoption de la norme EAD traitent surtout de la conservation, de la migration, de la gestion, de l'uniformité, de l'évolutivité des données ainsi que des enjeux d'interfonctionnement. La conservation d'une collection d'instruments de recherche utilisant la norme crée un dépôt d'archives riche en données brutes qui peuvent être manipulées et modifiées pour répondre aux besoins changeants des systèmes de recherche et de repérage, d'indexage, d'affichage et de mise en commun des fichiers. Afin de permettre la croissance et le changement, la vedette EAD fait le suivi de l'évolution d'un instrument de recherche au fur et à mesure qu'il passe d'un niveau de description préliminaire de collection à une analyse poussée de document ou que les corrections sont apportées à l'analyse originale. Pour les sites qui s'intéressent au développement conjoint des collections et à la mise en commun des ressources, la norme EAD fournit une pierre angulaire pour la création des catalogues collectifs ou des collections intégrées.

Pour obtenir de plus amples renseignements :

  • Site Web officiel d'EAD

lcweb.loc.gov/ead/

Préserve la norme de définition de document type EAD en partenariat avec la Society of American Archivists; comprend une liste des organismes qui la mettent actuellement en oeuvre.

  • Pages d'aide EAD – EAD Roundtable of the Society of American Archivists

jefferson.village.virginia.edu/ead/

Fournit des liens aux fichiers sources EAD, lectures sur SGML/XML, sites EAD selon l'endroit (avec annotations), les outils et les fichiers d'aide.

  • IFLA Digital Libraries : Metadata Resources-EAD

www.ifla.org/II/metadata.htm#ead

Liens aux documents de base, pages d'aide et les listes des sites EAD.


Droit d'auteur. La Bibliothèque nationale du Canada. (Révisé : 1997-12-09).