Logo des Nouvelles


Précédent Sommaire Suivant


Nouvelles de la Bibliothèque nationale
Octobre 1999
Vol. 31, no 10



Apprivoiser le dragon à l'aide d'un programme de reconnaissance de la voix

Alan Gillmor,
professeur au Département de musique de l'Université Carleton

Voilà quelques années, j'ai évalué, à titre d'expert externe, les documents qui forment désormais le Fonds Istvan-Anhalt de la Division de la musique de la Bibliothèque nationale. En examinant cette montagne de documents, je suis tombé sur la volumineuse correspondance entre le professeur Anhalt et le compositeur américain George Rochberg, soit une correspondance composée de centaines de lettres manuscrites écrites pendant une période de près de 40 ans, et qui se poursuit toujours.

Quiconque connaît les livres et essais publiés par les deux hommes, sans compter leur musique - des symphonies, des opéras, de la musique de chambre - se rend à l'évidence qu'il s'agit de deux esprits extraordinaires dont la curiosité intellectuelle s'étend à de nombreux sujets tant anciens que contemporains : la musique et la littérature, la religion et la philosophie, la politique et la société. Leurs lettres constituent une magnifique chronique de notre époque complexe, et une source d'information principale d'une valeur inestimable pour les futurs interprètes des réalisations de ces deux compositeurs exceptionnels. Avec l'autorisation des deux hommes, j'ai décidé que le rayonnement de cette vaste correspondance, qui mériterait d'être publiée, ne devait pas se limiter aux étagères de la Bibliothèque nationale.

Plus que n'importe quoi d'autre, la technologie de l'informatique a influencé le mode de vie de la fin du XXe siècle et, comme nous le savons tous pour l'avoir expérimenté, elle est l'un des partenaires de la plus fascinante relation d'amour-haine de tous les temps, un sujet apparemment sans fin qui occupe chacun de nos instants, comme en font foi les anecdotes innombrables à propos des joies et des frustrations de la circulation sur l'inforoute. J'avoue tout de suite que sans le programme de reconnaissance de la voix Dragon Naturally Speaking mis à ma disposition par la Bibliothèque nationale, je n'aurais jamais envisagé d'entreprendre le projet de transcription de cette montagne de documents sous forme électronique. Durant plusieurs mois l'hiver dernier, j'ai occupé une petite pièce à la Bibliothèque nationale pour parler à mon dragon ou, comme certains passants ont pu le penser, pour me parler à moi-même.

Après une brève période de « formation » pendant laquelle le programme a « appris » à reconnaître les idiosyncrasies de mon expression orale, nous étions prêts à commencer. Même si cette technologie est relativement nouvelle, c'est un produit véritablement remarquable qui s'améliorera sans doute beaucoup au fur et à mesure que ses versions futures parviendront sur le marché. Bien que le programme transforme la voix en un texte à raison d'un débit normal de 150 mots la minute, c'est-à-dire au moins deux fois la vitesse d'exécution d'une excellente copiste, l'appellation du produit, « Naturally Speaking », n'est pas si représentative que ça étant donné que j'ai constaté que j'obtenais de meilleurs résultats en accentuant la prononciation dans une certaine mesure.

Après plusieurs heures d'affilée, cela peut devenir plutôt fatigant. Par contre, le programme améliore sans cesse son rendement en mettant à jour ses fichiers d'après une expérience étendue de la voix de l'interlocuteur. De plus, on peut lui enseigner à corriger ses fautes répétitives, de sorte qu'à la fin du projet, ayant connu des semaines où la frustration était à son comble, nous nous reparlions de nouveau (à un moment donné, je lui ai dit ma façon de penser à l'aide de certains qualificatifs peu orthodoxes, pour me rendre compte que le microphone était toujours en marche et que le programme, sans aucun discernement moral, transcrivait ce que je disais). Voici certaines de ses caractéristiques les plus attrayantes : première lettre majuscule automatique au premier mot qui suit un point; commande vocale pour la ponctuation, la formation de paragraphe, l'espacement, le gras, l'italique, le soulignement, les corrections, la révision, etc.; il choisira avec assez de précision entre, par exemple, « to », « too » et « two » le terme correct selon sa façon « d'interpréter » le contexte; on peut également lui « enseigner » certaines choses comme les noms propres, ou n'importe quel terme technique qui ne fait pas partie de son vocabulaire de base.

Peut-être que les prochaines générations de Dragon Naturally Speaking seront disponibles en versions conçues pour des disciplines en particulier et dont le vocabulaire technique sera plus étoffé. Dans sa version actuelle, on ne peut que constater la pauvreté relative du dictionnaire du programme qui ne va pas au-delà d'un certain vocabulaire de base, comme le démontrent les perles suivantes. Comme tout ce qui se produit dans cette immense société de consommation de masse, le programme n'est pas conçu pour le chercheur, mais pour le légendaire consommateur « moyen ». On ne peut sans doute pas en vouloir aux concepteurs de ne pas avoir inclus certaines expressions plutôt rares telles que « Pythagorean », que le programme rend comme « Tiger Reagan »; toutefois, l'éminent poète irlandais Yeats mérite mieux que « Gates », et Socrate (Socrates) n'aurait sûrement pas compris que son nom devienne « soccer keys ». Le « rejoice » se métamorphose (pouvez-vous imaginer ce que le programme ferait de ce mot) en « read Joyce » - on s'aperçoit donc que le programme connaît quelques écrivains irlandais. Mais comment expliquer certaines tendances à la dyslexie (je n'invente rien) telles que « gods » qui devient « dogs » ? Enfin, et cela était prévisible, l'univers de Microsoft est toujours présent; en voici deux exemples : « rampaging »/« RAM paging », « pantomime »/« Pentium time ». Mais cela ne fait rien, après tout, l'erreur n'est pas l'apanage de l'être humain.

Je tiens à remercier sincèrement M. Timothy Maloney et le personnel de la Bibliothèque nationale d'avoir mis à ma disposition cette technologie merveilleuse de sorte que je puisse me consacrer à un projet, qui à mon avis fera œuvre de pionnier. Il se peut que l'époque de la correspondance manuscrite soit chose du passé (je vois déjà « le recueil de courriels de... »), mais tant et aussi longtemps que les chercheurs devront étudier l'importante partie de notre patrimoine qui repose sur le papier jauni d'anciennes lettres et d'autres documents semblables de l'ère de la calligraphie, la technologie, comme le programme Dragon Naturally Speaking, permettra à plus d'un chercheur d'échapper à la folie ou, à tout le moins, de ne pas sombrer dans l'alcool.

Le Fonds Istvan-Anhalt de la Division de la musique de la Bibliothèque nationale du Canada renferme des dossiers portant sur la vie et les activités musicales de Istvan Anhalt, professeur, chef d’orchestre, pianiste, et l’un des premiers compositeurs canadiens de musique électroacoustique. Le fonds comprend entre autres des dossiers scolaires, des manuscrits signés d’œuvres musicales, des coupures de presse, des photographies et les « centaines de lettres manuscrites » dont parle Alan Gillmor dans son article « Apprivoiser le dragon ».


Droit d'auteur. La Bibliothèque nationale du Canada. (Révisé : 1999-10-13).