PAGE D'ACCUEILRECHERCHEINDEX DU SITEREMARQUESENGLISH
Publications*

Identification fédérale pour la Bibliothèque nationale du Canada


Les enregistrements audionumériques à la Bibliothèque nationale du Canada

par Gilles St-Laurent
Flash Réseau no49
ISSN 1200-5304
Division de la musique
Bibliothèque nationale du Canada

Le 8 août 1997


1. Introduction

Mary had a little lamb, voilà les premiers mots enregistrés par Thomas Edison, en 1877, au moyen de sa plus récente invention, le phonographe. Bien que la technologie ait été rudimentaire, ses concepts d'enregistrement et de lecture sous-jacents resteraient inchangés jusqu'à l'avènement de la technologie numérique plus d'un siècle plus tard. La technologie audionumérique a profondément transformé les communications et a révolutionné l'art et la science de l'enregistrement et de la manipulation du son.

La Bibliothèque nationale a la chance de disposer d'équipement numérique de pointe de traitement des audiofréquences, une technologie qui a influencé, dans une large mesure, les activités quotidiennes de conservation et de livraison de documents.

2. Numérisation de l'enregistrement sonore

Le son est créé par une surface qui vibre (cordes, anche, peau de tambour, etc.) qui produit des ondes sonores composées d'air comprimé et décomprimé. Pour faire un enregistrement analogique d'ondes sonores, un microphone est utilisé pour transférer le changement continu de pression d'air en un changement continu de tension, c'est-à-dire une image de la tension analogique de la vibration originale. Pour le stockage analogique, un transducteur 1 permet de passer du changement continu de tension au changement physique continu de la paroi du sillon d'un disque de longue durée ou au changement continu d'alignement de particules d'une bande magnétique en cassette. À la lecture, les transducteurs du tourne-disque ou du magnétophone transfèrent de nouveau à une image continue de tension ces changements continus dans la paroi du sillon ou les alignements de particules. C'est cette image de tension qui est numérisée, lorsqu'elle est présentée à l'entrée d'un convertisseur analogique-numérique.

    2.1 Fréquence d'échantillonnage

    La précision (résolution) de la reproduction du son de l'enregistrement audionumérique est déterminée par deux facteurs : la fréquence d'échantillonnage et la longueur du mot numérique.

    Plutôt que d'être une image physique continue de changements dans la tension électrique, l'enregistrement numérique est fondé sur une série de mesures discrètes de la tension électrique. Par exemple, sur un disque compact, l'image de la tension électrique est mesurée 44 100 fois par seconde; voilà la «fréquence d'échantillonnage». À un moment particulier, la tension, (à titre d'exemple) pourrait être de 0,5 volts d'un maximum de 1 volt. Au 1/44100e de seconde plus tard, la tension pourrait être de 0,505 volts, le 1/44100e de seconde suivant, de 0,509 volts et ainsi de suite.

    2.2 Longueur du mot numérique

    Dans un système numérique, chaque lecture de tension est exprimée comme chiffre que l'ordinateur peut interpréter. Tout comme 2 h de l'après-midi est décrit par 14 h, n'importe quelle valeur peut être exprimée en chiffres binaires, à l'aide de 1 et 0. Ainsi, 1/3 peut être exprimé comme 0,3, ou plus précisément 0,33, ou mieux encore 0,333 et ainsi de suite : plus on compte de décimales, plus précise est l'expression de la traduction. Par conséquent, plus grand est le nombre de bits numériques utilisés pour exprimer une lecture de tension, plus précise est la traduction (non plus sonore). Le disque compact utilise 16 bits numériques pour traduire ou «numériser» une lecture de tension, ce qui donne 65 536 valeurs possibles de la tension.

    Mesure de l'onde sonore comme tension électrique,
    c.-à-d. numérisation

    Les mesures de la tension dans ce diagramme sont exprimées en chiffres arabes arrondis à la troisième décimale. Dans un système audionumérique, ces mesures seraient exprimées en chiffres (mots) composés d'une série de bits. Dans un système numérique, la première lecture, 0,483, qui utilise des mots arrondis à 16 bits, serait 0111101110100101; la deuxième, 0,815, serait 1101000010100011; le troisième, 0,888, serait 1110001101010011, et ainsi de suite.

    2.3 Convertisseurs analogiques-numériques

    Le studio des enregistrements sonores à la Bibliothèque nationale du Canada dispose de l'équipement nécessaire pour numériser les signaux analogiques à l'aide de convertisseurs analogiques-numériques de 20 bits (1 048 576 valeurs possibles). L'avantage que présente la conversion de 20 bits par rapport à celle de 16 bits est immédiatement audible dans les signaux de faible niveau (réverbération de la pièce, passages doux, etc.) et dans «l'aspect naturel» général du son.

    Lors de la numérisation de l'enregistrement sonore, il est important de prendre en considération que le convertisseur ne peut «mesurer» qu'une certaine tension maximum, peu importe le nombre de bits utilisés. Toute tension qui dépasse cette limite ne peut être représentée. Ainsi, le convertisseur fera un écrêtage numérique de l'enregistrement sonore. Par conséquent, un sonomètre numérique de qualité supérieure qui mesure à la fois les niveaux moyens et de crête sert à surveiller de près les niveaux d'enregistrement.

    2.4 Acheminement du signal

    Une fois que le signal sonore est numérisé, il doit être acheminé à une autre pièce de l'équipement, comme un enregistreur ou un réducteur de bruit. On compte plusieurs normes de communication audionumériques. La norme professionnelle la plus populaire, et celle qu'utilise la Bibliothèque nationale, est celle d'AES (Audio Engineering Society). AES peut acheminer deux canaux sonores maximums de 24 bits, dans un seul câble, et est configuré dans le but de réduire au minimum l'inductance de l'interférence de l'extérieur dans l'encablure plus longue qui se trouve dans les studios. Le studio de la Bibliothèque nationale est aussi pourvu d'une boîte de jonction numérique standard d'AES, dans laquelle sont connectées toutes les entrées et les sorties numériques de l'équipement, de sorte que la sortie d'une pièce de l'équipement peut être acheminée de façon opportune à une autre partie de l'équipement.

3. Station audio numérique

La Bibliothèque nationale a récemment fait l'acquisition d'une station audio numérique sur PC, appelée Pyramix de la société Merging Technologies, qui allie l'enregistrement sur disque dur en temps réel, le mélange audio, le montage, le traitement des effets sonores et le matriçage CD-R. Le système utilise une carte, contenant quatre microprocesseurs DSP 3210 d'AT&T, de 32 bits à virgule flottante, qui offrent une puissance de crête totale de 133 Mflops (millions d'opérations en virgule flottante par seconde). Toutes les opérations sont exécutées en 32 bits (4 294 967 296 valeurs possibles). La fonction d'enregistrement enregistre de 16 à 32 bits. Le système sera en mesure de prendre en charge la norme proposée de vidéodisque numérique de fréquence d'échantillonnage de 96 kHz avec 24 bits.

    3.1 Enregistrement et montage numériques

    L'un des avantages de l'enregistrement direct sur disque dur est qu'il ne faut faire jouer qu'une seule fois des morceaux fragiles ou abîmés, réduisant ainsi l'usure de l'artefact, si d'autres travaux sont nécessaires. Un autre avantage est qu'il permet l'accès sélectif : il est possible de passer instantanément du début à la fin (ou à n'importe quel endroit dans le fichier) de morceaux d'une durée d'une heure. Plus besoin d'attendre pendant que 2 500 pieds de bande magnétique se rembobine!

    Une fois sur le disque dur, on peut donner à la station audio numérique l'instruction de dessiner la forme de l'onde de sorte à voir et manipuler visuellement les ondes sonores. Le plus grand avantage de la station audio numérique est sans doute que le montage est non destructif. La mise au point de bobines exige qu'on coupe physiquement le support avec une lame de rasoir, puis rattache les sections (collage). Ce processus rend très difficile, sinon impossible, la correction des erreurs de mise au point. Le montage numérique consiste à placer des marqueurs au début et à la fin des sections à mettre au point. Les points de montage peuvent être bougés, supprimés ou modifiés à n'importe quel moment. Pendant qu'ils sont en place, ils ordonnent à la station audio numérique la prochaine mesure à prendre, sans aucunement modifier le fichier original.

    Le montage au moyen d'une station audio numérique est beaucoup plus sophistiqué que sur bande magnétique. Comme mentionné, la mise au point d'une bande exige qu'on la coupe; dans le montage numérique, bien que l'équivalent de la coupure de la bande est possible, une fonction appelée fondu enchaîné existe aussi. Celle-ci permet simultanément de fondre au noir un signal tandis qu'un autre fond au blanc au point du montage. Cette opération peut se produire en millisecondes (ou selon la durée de chaque séquence) et produire un montage coulant et uni. Les fondus au blanc et au noir peuvent aussi être programmés à l'aide de diverses courbes et être bougés ou changés à n'importe quel moment.

    3.2 Traitement numérique

    La station audio numérique offre aussi le traitement numérique comme la correction d'un système d'enregistrement ou de lecture et le traitement dynamique. La correction d'un système d'enregistrement ou de lecture est l'amplification et la suppression de certaines fréquences. Dans une station audio numérique, cette fonction est automatisée, de sorte par exemple, que les courbes de correction de la lecture les plus utilisées pour les disques 78 tours peuvent être programmées et rappelées à n'importe quel moment. Étant donné que la station audio numérique utilise 32 bits et que la correction numérique d'un système d'enregistrement ou de lecture est un processus mathématique, le déphasage, l'oscillation transitoire et la distorsion sonore, qui peuvent causer des problèmes dans le traitement analogique, sont absents.

    Le traitement dynamique est une fonction qui modifie automatiquement le volume du signal (les paramètres sont établis par l'utilisateur). Dans la fonction de compression, les passages de faibles niveaux sont rendus plus sonores de sorte que la différence entre les passages bruyants et doux est moindre. Cette fonction est très utile lorsqu'un support compte des mots de longueur limitée, comme RealAudio qui, afin de réduire au minimum la largeur de bande, se sert seulement de 8 bits (28 = valeurs de 256) pour encoder le son. Afin de maximiser l'utilisation de ces 8 bits, les niveaux doivent être aussi élevés et égaux que possible.

    3.3 Matriçage CD-R

    La station audio numérique peut aussi servir à créer des matrices CD-R conformes au Red Book (la norme CD Audio) ou les matrices CD-R. L'intervalle entre chaque morceau choisi, les marques de démarrage, d'index et d'arrêt du disque compact, est stocké dans un fichier spécial. Le programme peut ensuite utiliser cette image pour graver un CD-R deux fois plus rapidement, à l'arrière-plan (pendant que l'ordinateur est utilisé à d'autres fins) à l'aide des ports SCSI de l'ordinateur et de l'enregistreur de disques compacts.

4. Réduction du bruit numérique

La réduction ou la suppression de bruits est une fonction qui ne peut exister avec fidélité dans le domaine analogique. Elle est des plus utiles pour les supports plus âgés et bruyants comme les disques 78 tours, bien que les résultats n'en sont pas moins considérables avec les supports dont le son est plus doux. Trois catégories de bruit se trouvent sur les enregistrements sonores : les bruits transitoires comme le claquement, le grésillement et le souffle.

Le studio des enregistrements sonores de la Bibliothèque nationale est pourvu d'un système CEDAR (restauration audionumérique améliorée par ordinateur) qui peut supprimer ou réduire ces imperfections : le DC-1 De-Clicker, le CR-1 De-Crackler et le DH-2 De-Hisser. Ces dispositifs utilisent deux processeurs de 40 bits à pointe flottante (1 099 511 627 776 valeurs possibles!) qui traitent le son en temps réel (aucune période d'attente pendant que les dispositifs calculent les résultats). Le système CEDAR, élaboré conjointement par le British Library National Sound Archive et le département d'ingénierie de l'université Cambridge, est la nouveauté la plus importante du domaine de la conservation et de la restauration sonores.

    4.1 Suppression du claquement

    Le résultat de la suppression de bruits transitoires de haute fréquence et haute énergie, comme les claquements, est immédiatement évident. Le DC-1 enlève les claquements et toute musique sous- jacente. Il recrée ensuite l'onde sonore manquante par l'analyse des échantillons antérieurs et postérieurs au claquement et interpole les résultats à l'aide d'algorithmes de poids fort. Le nombre d'échantillons qu'examine le DC-1 dépend de la longueur du claquement. Un court claquement exige peu d'échantillons (10) qu'un claquement plus long (de 60 à 200) afin de reconstruire l'onde sonore. Le dispositif De-Clicker peut supprimer jusqu'à 2 500 claquements par seconde par canal en temps réel.

    4.2 Suppression du grésillement

    Le grésillement est une succession de petits bruits secs, ajoutés au son original en raison d'une mauvaise qualité de la surface du disque, d'une friture causée par de l'équipement mal relié ou mal pris à terre ou de distorsion provenant de la surcharge des sorties d'un mélangeur d'amplificateur ou d'écrêtage numérique. Tous ces éléments rendent le son discordant. Le grésillement est une forme de bruit plus subtile et difficile à supprimer qu'un claquement. Le dispositif De-Crackler traite de ce problème en divisant le signal d'entrée en signal «original» et signal de «grésillement et distorsion», (la proportion est déterminée par l'opérateur) et en s'occupant uniquement du signal avec le grésillement. Tout d'abord, l'opérateur doit régler le mode de grésillement au premier niveau (net et bien défini) ou au deuxième niveau («flou » et moins bien défini). Puis, l'opérateur précise la quantité de grésillement que doit enlever le CR-1. Enfin, le signal est combiné de nouveau. Le CR-1 peut nuire au son s'il est mal réglé.

    4.3 Suppression du souffle

    Le souffle est très évident pour une personne qui l'entend mais beaucoup plus difficile à discerner pour une machine. Par conséquent, il est moins facile à enlever qu'un claquement net ou un grésillement. Le dispositif DH-2 enlève le souffle en analysant le contenu tonal, transitoire et d'ambiance du signal à des centaines de bandes de fréquence et en supprimant celles qui ne détectent aucun signal musical. L'opérateur doit tout d'abord régler le paramètre de niveau du bruit, afin de donner au DH-2 une idée quelconque de la quantité de bruit présente dans tout signal donné. Ensuite, l'opérateur doit régler l'atténuation, qui établit une limite maximum de la quantité de bruit que le DH-2 enlèvera à n'importe quelle fréquence donnée. Enfin, l'opérateur doit régler l'algorithme d'intensité pour conserver la quantité appropriée de présence en déterminant la vitesse à laquelle le DH-2 enlèvera le bruit. Le DH-2 est le dispositif du CEDAR le plus difficile à bien régler et il peut avoir un effet très nuisible sur la qualité sonore s'il est mal réglé.

    L'effet auditif net de la suppression de bruits des enregistrements sonores peut être spectaculaire. La réduction du bruit numérique peut efficacement libérer la musique des défauts de son support d'enregistrement, découvrant des détails qui étaient auparavant masqués par le bruit.

5. Stockage

À l'heure actuelle, le disque compact est de loin le support de stockage numérique le plus populaire avec une durée de vie prévue de 40 à 100 ans. En raison de l'absence de contact physique lorsqu'on fait jouer le disque (contrairement à la bande audionumérique qui doit se dérouler autour d'un tambour de lecture rotatif), il est pratiquement impossible d'endommager le disque pendant la lecture. Bien que l'obsolescence de l'équipement est un problème sérieux pour les archives informatiques, le vidéodisque numérique, la forme audionumérique la plus récente, est de compatibilité descendante avec le disque compact, ce qui devrait assurer que le matériel de lecture est disponible pendant très longtemps.

L'inconvénient du disque compact est qu'il s'agit d'un support à 16 bits seulement. Par conséquent, tout ce qui est plus long que 16 bits doit être supprimé. Une troncation directe introduit des éléments indésirables comme la distorsion et la modulation de bruit. Ironiquement, des algorithmes spéciaux de processeur de champ sonore numérique sont utilisés pour ajouter un bruit numérique extrêmement faible appelé signal de superposition (créé par un générateur de nombres aléatoires) au signal numérique de sorte que les quelques derniers bits sont mis à 1 bit et à 0 bit au hasard, ce qui adoucit le son. Malheureusement, le bruit de large bande est introduit dans le système et décroît effectivement sa performance.

Au cours des quelques dernières années, le signal de superposition de «mise en forme» du bruit a été établi comme processus acoustique supérieur pour le raccourcissement de la longueur de mots. La mise en forme du bruit réside dans le fait que l'oreille est plus sensible aux fréquences moyennes (d'environ 4 kHz) qu'elle ne l'est aux fréquences basses ou élevées. La Bibliothèque nationale du Canada se sert de Apogee AD-1000 avec le système UV22 Super CD-Encoding qui, à partir d'un signal de 20 bits, supprime les quatre derniers bits, les renvoie dans le signal d'entrée au moyen d'un filtre qui ajoute un «éclat» d'énergie d'environ 22 kHz, produit par algorithme (au-delà du seuil théorique de l'ouïe et à la limite de fréquence supérieure du disque compact). Le résultat net est un plancher de bruit inférieur et un disque compact dont le son est plus naturel et capture la résolution et le détail de signaux de 20 bits sur une longueur de mot de 16 bits.

6. Conclusion

Le studio des enregistrements sonores de la Bibliothèque nationale est une installation de classe internationale. Il groupe toute la gamme des styles de musique, des supports d'enregistrement et des technologies de l'histoire entière du son enregistré. Par exemple, le studio a récemment été utilisé pour plusieurs projets dont les suivants :

  • la restauration des trois premiers enregistrements du groupe de musique populaire, les Guess Who. La seule bande maîtresse qui avait survécu a été trouvée dans le fonds Randy Bachman. Les deux autres disques ont dû être tirés de disques de longue durée parfaits de la collection de la Bibliothèque nationale, pour lesquels on a supprimé le claquement et qui ont été envoyés à un studio de Vancouver pour en poursuivre le traitement;

  • la restauration de plusieurs enregistrements des années 1950 provenant du fonds Glenn Gould pour sortie sur étiquette de disque CBC;

  • la restauration et le matriçage d'un disque compact pour l'étiquette MusicWorks de morceaux du pionnier en musique électroacoustique, de l'inventeur d'instruments et du compositeur, Hugh Le Caine. Tirés du fonds Le Caine, les bandes magnétiques remontaient aux années 1950 et 1960, et après la restauration ont présenté une qualité sonore acoustique supérieure à celle qu'aurait entendu M. Le Caine;

  • les plus anciens enregistrements de la collection des enregistrements sonores, onze disques 78 tours de cinq pouces, datant des années 1880 ont été traités, mis au point pour supprimer les sauts et mis sur disque compact pour la collection de consultation de la Bibliothèque nationale.

Les enregistrements audionumériques favorisent la conservation et la promotion d'enregistrements sonores canadiens par la revitalisation de vieux morceaux au moyen de nouvelles techniques et technologies. Le studio constitue une convergence fructueuse de l'ancien et du nouveau.

______
1 Transducteur : dispositif qui convertit d'un système à un autre l'énergie que produit l'un d'eux.


Canada Droit d'auteur. La Bibliothèque nationale du Canada. (Révisé : 1997-07-29).