PAGE D'ACCUEILRECHERCHEINDEX DU SITEREMARQUESENGLISH
Publications*

Identification fédérale pour la Bibliothèque nationale du Canada


Comprendre les fonctions de balayage de World Wide Web

par Chris Savage

Flash réseau #10
ISSN 1200-5304
Services de technologie de l'information
Bibliothèque nationale du Canada

juillet 1995


Introduction

Ce Flash Réseau offre une introduction générale au but et à l'exploitation des fonctions de balayage de World Wide Web (WWW) comme Mosaic et Netscape. Alors que Flash Réseau no 7 : Introduction au World Wide Web, par Gary Cleveland, donne une vue plus complète du W3 et de ses divers composants, cet article met en position la fonction de balayage dans l'architecture client-serveur de W3 et en décrit brièvement les deux extrémités. Il décrit également le langage de balisage hypertexte (HTML), en ce qu'il a rapport avec l'exploitation du balayage et le contrôle de l'apparence des documents en HTML. Finalement, il donne un bref examen historique de l'apparition des fonctions de balayage et prévoit leurs développements futurs.

Les deux extrémités du World Wide Web

Les clients du Web -- appelés aussi balayeurs -- forment seulement une partie d'un système complexe d'échange d'informations par l'intermédiaire d'Internet. L'architecture du Web contient deux catégories d'ordinateurs : les serveurs, qui emmagasinent les informations, et les clients, qui y ont accès. Ensemble, ils constituent les deux extrémités du Web, chacune ayant son propre logiciel de prise en charge. Le logiciel du serveur s'exécute exclusivement sur des machines serveurs, en traitant le stockage et la transmission de documents. Par contraste, le logiciel client s'exécute sur les ordinateurs de l'utilisateur final, en accédant, traduisant et affichant les documents. Les deux extrémités communiquent par Internet en utilisant un protocole connu comme le protocole de transfert hypertexte (HTTP).

Les documents du WWW transmis entre le client et le serveur sont codés en langage de formatage de texte appelé langage de balisage hypertexte (HTML), qui décrit les données de formatage de la structure et des caractères des documents. La clé en est que le HTML est un langage et non une application ou un progiciel. C'est simplement un jeu de données de texte et des instructions qui demandent l'utilisation d'un logiciel client supplémentaire.

Le but de HTML est de véhiculer le contenu d'un document et de définir la structure du document, la mise en page, la présentation physique et les liens avec d'autres documents ou des objets multimédias situés dans le système WWW. HTML atteint cela en utilisant exclusivement la table des caractères ASCII. Ce fait est significatif pour deux raisons : 1) les documents balisés en ASCII sont plus petits qu'ils ne le seraient dans d'autres présentations, comme le traitement de texte ou les feuilles de calcul. La taille plus petite des fichiers se traduit par une transmission plus rapide sur Internet et il y a moins de chance que les transferts de fichiers soient interrompus; 2) la table des caractères ASCII reste une norme informatique internationale créée pour les échanges d'informations à base de texte entre diverses plates-formes et divers systèmes d'exploitation. Une telle «ouverture» signifie que les documents balisés en HTML peuvent être vus par différents types d'ordinateurs connectés à Internet, pourvu qu'ils disposent du logiciel client adéquat.

À l'intérieur de la fonction de balayage

Une fonction de balayage du Web est l'application d'un logiciel d'accès au World Wide Web et de visualisation des documents. Alors que le HTML est indépendant d'une plate-forme, les fonctions de balayage doivent être codées spécifiquement pour le système d'exploitation. Les fonctions de balayage d'interface utilisateur graphique (GUI) peuvent visualiser des images et des polices à l'échelle, conçues pour Windows, MacIntosh, X-Window System (par exemple, Mosaic de NCSA, Netscape, WinWeb et Cello). Les fonctions de balayage à base de texte, codées pour les plates- formes Unix et DOS, ne peuvent visualiser que les polices Courier standard (par exemple, Lynx et DosLynx). Bien que le contenu du document en HTML soit identique pour chaque fonction de balayage, la forme de son affichage varie selon les paramètres d'affichage de la fonction de balayage et les capacités techniques du système d'exploitation et du matériel.

Le vocabulaire des protocoles de la fonction de balayage

En plus de leurs propres serveurs, les fonctions de balayage du Web peuvent avoir accès aux serveurs de Gopher, de FTP et de WAIS. Pour ce faire, en conjonction avec le HTTP, les fonctions de balayage peuvent comprendre chaque protocole associé à ces outils. Les fonctions de balayage fournissent donc une interface commune de navigation entre tous ces systèmes, en exécutant sans faille le protocole adéquat d'arrière-scène.

Les deux tâches fondamentales de la fonction de balayage

La fonction de balayage exécute deux tâches : elle identifie les éléments HTML puis elle met à exécution les éléments identifiés. Par exemple, elle peut identifier l'élément du HTML en gras et afficher ensuite un bloc de texte en le présentant en caractères gras. D'autres exécutions peuvent être l'affichage d'une image, l'ajout d'une ligne blanche entre le texte ou le lien avec un autre document. Plusieurs de ces mises à exécution peuvent être traitées par la fonction de balayage elle- même; par exemple, dans sa zone de visualisation, elle peut afficher le texte et certains types d'images (si elle utilise une interface utilisateur graphique comme celle de Windows).

Programmes d'aide

D'autres actions ne peuvent être traitées par la fonction de balayage. Des programmes de logiciel supplémentaires sont requis pour les exécuter. Ces programmes permettent de faire jouer un fichier sonore ou un vidéo animé, ou d'afficher un type obscur de présentation d'image. Appelé fort justement programmes d'aide, ils relèvent de deux catégories.

  • Les programmes d'aide internes : Les programmes d'aide internes sont intégrés dans la fonction de balayage elle-même, de la même manière que certains traitements de texte comportent des programmes internes de vérification de l'orthographe. En pratique, la fonction de balayage identifie un élément, puis fait appel au programme d'aide interne pour sa mise à exécution. Par exemple, lorsque la fonction de balayage identifie un fichier stocké en format JPEG (un type d'image comprimée), elle fait appel au programme interne qui peut traduire les fichiers JPEG. Le programme interne traite ensuite et affiche l'image à l'intérieur de la zone de visualisation de la fonction de balayage. Netscape possède un programme d'aide interne qui peut traiter les fichiers JPEG de cette manière. Les fonctions de balayage qui n'ont pas la même capacité doivent se servir de programmes d'aide externes pour lire les images.

  • Programmes d'aide externes : Les programmes d'aide externes traitent du problème posé par l'existence de trop nombreux formats de fichiers pour qu'une seule fonction de balayage puisse s'en occuper. À la place d'un programme omnilingue massif, qui peut lire tous les types de fichiers que le W3 véhicule, les fonctions de balayage incorporent des programmes d'aide externes plus petits pour obtenir le même résultat. Ces programmes spécialisés sont distincts de la fonction de balayage et effectuent des fonctions identiques aux programmes d'aide internes, sauf que les mises à exécution sont effectuées en dehors de la fonction de balayage. Par exemple, lorsqu'une fonction de balayage identifie un fichier sonore stocké en format .WAV, elle fait appel à un programme externe qui peut traduire les fichiers .WAV. La fonction de balayage transmet le fichier .WAV au programme d'aide externe qui peut alors le traiter et l'exécuter.

Il y a deux grandes différences entre les programmes d'aide interne et externe. La première est que les programmes d'aide externes s'exécutent indépendamment de la fonction de balayage. Cela veut dire qu'une fois que les fichiers sont transmis de la fonction de balayage au programme d'aide externe, la fonction de balayage est libre pour poursuivre la navigation dans le WWW. Par contraste, les programmes d'aide internes sont liés à la fonction de balayage jusqu'à ce que le programme interne ait terminé son action et soit fermé. La deuxième différence concerne les méthodes d'acquisition des deux types de programmes d'aide. Les programmes d'aide internes sont inclus dans la fonction de balayage elle-même. Mais l'utilisateur final doit acquérir les programmes d'aide externes de manière indépendante et configurer la fonction de balayage pour qu'elle désigne le programme externe, lui disant quand l'utiliser (par exemple, pour visualiser un format de fichier particulier) et où il se trouve dans le stockage de l'ordinateur. Le plus souvent, ceci se fait par le «paramétrage» de la zone Préférences des Options de la fonction de balayage.

Qui contrôle l'apparence d'un document en HTML?

Curieusement, l'auteur et l'utilisateur final peuvent contrôler l'apparence d'un document HTML. D'un côté, l'auteur définit les éléments du document en HTML -- titres, en-têtes, paragraphes, formats des caractères, images imbriquées -- et précise où ils doivent apparaître dans le document. D'un autre côté, une fonction de balayage particulière peut influencer la façon dont ces éléments apparaissent à l'écran. Les fonctions de balayage peuvent être idiosyncratiques, utilisant différents arrière-plans en couleur, des liens, des polices et des tailles de polices pour le même élément. Un seul document en HTML peut donc avoir des apparences différentes selon la fonction de balayage utilisée. En outre, l'utilisateur final peut aussi adapter sa fonction de balayage pour l'utilisation de couleurs et de tailles de polices spécifiques. Le résultat en est qu'un document donné en HTML peut paraître de manière différente, même en utilisant la même fonction de balayage, si l'utilisateur final a changé les paramètres implicites.

Pour montrer davantage cette relation, prenons cet exemple. Un auteur indique en HTML qu'un mot doit être en italique. La fonction de balayage cherchera dans le document en HTML, analysera son code et identifiera l'élément en italique. Normalement, l'action implicite de la fonction de balayage consiste à rendre en italique le mot marqué. Toutefois, l'utilisateur final peut «paramétrer» la fonction de balayage pour rendre cet élément en le soulignant. On peut déduire de cela que, bien que les auteurs puissent coder leurs intentions dans des documents HTML et contrôler l'apparence du document d'une manière imprécise, l'utilisateur final peut modifier l'apparence finale d'un document.

Adaptation des visualisations de la fonction de balayage

L'exemple précédent montre des dispositifs contraires du WWW :

  1. Le pouvoir de l'utilisateur final d'influer sur l'apparence des documents en HTML.

  2. L'incapacité ultime des auteurs à contrôler l'apparence de leurs documents en HTML.

L'aspect positif de cette divergence tient à ce que l'utilisateur final peut adapter l'affichage des éléments HTML pour répondre précisément à ses préférences visuelles; par exemple, il est commun d'agrandir la taille de la police de base des documents en HTML pour compenser la piètre qualité d'un moniteur. Cependant, la modification des paramètres implicites normalisés de la fonction de balayage altère l'apparence de la présentation optimale du document en HTML, établie par l'auteur. Cet exemple traite de la relation intégrale entre la forme et le contenu -- la manière dont une histoire est racontée affecte sa signification. Plusieurs auteurs utilisent les données de présentation pour donner du poids et de la signification aux parties de leurs documents. En modifiant les effets visuels des documents en HTML avec la fonction de balayage, le plein effet et/ou la lisibilité de l'original peuvent être perdus.

Utilisation des paramètres de visualisation implicites de la fonction de balayage

Avec la prolifération des fonctions de balayage du WWW et le manque implicite de contrôle sur l'apparence finale d'un document, les auteurs ont appris à cibler la visualisation optimale de leurs documents sur les paramètres implicites des fonctions de balayage les plus populaires. Pour l'utilisateur final, l'avantage de l'utilisation des paramètres de visualisation implicites de la fonction de balayage est que les documents en HTML s'affichent plus ou moins de la façon voulue par l'auteur. Il peut aussi signifier que, à moins que les paramètres de visualisation implicites soient utilisés, il sera difficile de lire certains documents ou ils seront d'aspect peu agréable. Pour ces raisons, il est habituellement judicieux de laisser les paramètres de visualisation de la fonction de balayage à leurs valeurs implicites.

Les fonctions de balayage jusqu'à présent

Entre avril 1993 et novembre 1994, le volume du trafic des fonctions de balayage s'est accru d'environ 40 000 % (d'après The Internet Society). On peut en attribuer une bonne partie au développement de la Mosaic de NCSA. Publiée à l'origine pour le système X- Windows, en avril 1993, les versions bêta pour les cadres d'utilisation Windows et Mac sont apparues à l'automne de la même année. Sa popularité et sa domination sur les fonctions de balayage du W3 concurrentes étaient si grandes que, pour beaucoup de gens, Mosaic est devenu synonyme de WWW, confondant du même coup l'outil d'accès et de visualisation avec le système réel d'information. Mais, presque aussi vite qu'elle s'est développée, la popularité de Mosaic a décliné. À sa place, on trouve plusieurs autres fonctions de balayage du Web, avec en tête le Netscape Navigator de la Netscape Communications Corp. Des enquêtes non officielles d'Internet indiquent que jusqu'à 70 % des utilisateurs du WWW ayant des fonctions de balayage GUI utilisent Netscape. Ces données ne sont pas quantifiables scientifiquement, mais il existe assez de preuves pour indiquer que Netscape est le champion actuel des fonctions de balayage du WWW. Un indicateur : la plupart des auteurs du WWW ciblent maintenant leurs documents en vue des paramètres implicites de Netscape et utilisent le jeu d'étiquettes étendu de HTML de Netscape. (Veuillez consulter Flash Réseau no 7 pour plus de renseignements.)

Envisager les futures fonctions de balayage

La tendance actuelle du développement des fonctions de balayage du Web est de créer des fonctions de balayage plus vastes et plus puissantes, ayant davantage de programmes d'aide internes. Les fonctions de balayage du Web continuent d'être le point de convergence de plusieurs technologies d'Internet. Par exemple, les fonctions de balayage futures comporteront des fonctionnalités de courrier électronique plus perfectionnées et des lecteurs d'Usenet News. Il y a également beaucoup de discussions parmi les réalisateurs du WWW au sujet de l'inclusion de formats de documents plus riches dans le code HTML, qui fournirait des renseignements améliorés de présentation des caractères.

Les fonctions de balayage futures pourront aussi fort probablement traduire de plus en plus de types divers de protocoles. Bien que les fonctions de balayage actuelles ne les prennent pas couramment en charge, il est raisonnable de prévoir que le lexique des protocoles informatiques fonctionnels des fonctions de balayage inclueront un jour ou l'autre : des protocoles SGML étendus, des protocoles de base de données comme SQL, Oracle et Z39.50 et des normes de programmation naissantes, comme OLE 2.0 de Microsoft.

Une autre modification anticipée des futures fonctions de balayage traitera éventuellement de l'obstacle le plus significatif à la croissance des services d'entreprise du Web actuel -- l'état vulnérable de la sécurité des données. Les futures fonctions de balayage doivent comporter des capacités de «chiffrement» améliorées pour réduire la fraude en direct et, par conséquent, créer un contexte plus sûr pour la transmission «digicash».

Finalement, et c'est peut-être là le plus grand effet sur l'avenir des fonctions de balayage du World Wide Web, ce sera l'affinage de HTML. En mars 1995, l'ébauche Internet de la version 3.0 de HTML a été rendue publique. Bien que l'intention soit celle d'une compatibilité d'amont avec les versions précédentes, plusieurs fonctions de balayage actuelles ne prennent pas pleinement en charge les plus anciennes spécifications de HTML, 2.0, 1.0 et 0.9. Une partie du problème tient à ce que HTML n'est pas encore officiellement une norme de l'Organisation internationale de normalisation (ISO). Cela veut dire qu'il existe plusieurs formes différentes de HTML, que les fonctions de balayage peuvent ou non reconnaître. Si l'on y ajoute l'initiative unilatérale de réalisateurs des fonctions de balayage, comme Netscape Corp., pour créer des jeux uniques d'extension d'étiquettes de HTML que seules leurs fonctions de balayage peuvent comprendre, le contexte de production d'une norme devient encore moins stable. Il existe une spéculation croissante voulant que la motivation pour normaliser le HTML soit faible, du fait qu'à mesure que le Web se répand rapidement, les intérêts des auteurs, des réalisateurs de logiciels et des utilisateurs deviennent trop diversifiés et mutuellement exclusifs. Les utilisateurs craignent que l'écart grandissant entre ces intérêts rivaux puisse être trop grand pour jeter le pont d'une norme de HTML négociée et approuvée par l'ISO. Seul le temps nous le dira.


Canada Droit d'auteur. La Bibliothèque nationale du Canada. (Révisé : 1997-07-29).