![]() ![]() ![]() ![]() ![]() ![]() ![]() Introduction au World Wide Webpar Gary Cleveland
Flash Réseau Numéro 7 mars 1995
1. Qu'est-ce que le World Wide Web?Aussi connu sous le nom de WWW, W3, ou simplement le Web, le World Wide Web est un des divers outils de navigation conçus pour permettre aux utilisateurs d'accéder aux informations d'Internet et de les structurer, et de publier des informations dans le réseau. Développé en 1989 dans un laboratoire de physique corpusculaire de la Suisse, le CERN, le WEB est depuis devenu l'outil de navigation le plus puissant et le plus populaire d'Internet. En bref, il s'agit d'un système de traitement de l'information hypertexte, multimédia et distribué, qui crée des liens avec des documents hypertextes et assure la liaison avec de nombreux autres outils et bases de données d'Internet. Le présent article est une introduction au World Wide Web; on en décrit les principales caractéristiques et le fonctionnement, et l'on explique pourquoi le Web peut jouer un rôle important dans une bibliothèque.2. Quelles sont les principales caractéristiques du Web?Le Web comporte un certain nombre de caractéristiques qui y sont exclusives et en font le système d'information le plus perfectionné qui ait fait partie d'Internet à ce jour. Ces caractéristiques sont décrites ci-dessous.Le Web est un système hypertexte. Le Web diffère du système à base de menus hiérarchisés du serveur Gopher d'Internet en ce qu'il s'agit d'un système hypertexte dans lequel les utilisateurs passent d'un document à un autre document traitant du même sujet par l'entremise de liens(un mot ou une locution peut constituer un lien, par exemple). Lorsque l'utilisateur choisit un lien, il accède à un autre document qui traite du sujet qui l'intéresse. Au lieu d'aller de menu en menu, comme il le ferait dans Gopher, l'utilisateur du Web passe directement d'un document à un autre en cliquant sur un lien hypertexte. Le Web est un système multimédia. Avant la venue des explorateurs graphiques (comme Mosaic et Netscape, dont il sera question plus loin), la plus grande partie des informations accessibles sur Internet était présentée sous forme de texte ASCII; il s'agissait donc de texte simple dépourvu de tous les éléments qu'on retrouve généralement dans une page imprimée (titres en gros caractères, italiques, images ou autre contenu graphique). Grâce aux explorateurs graphiques, le Web est devenu un système multimédia, c'est-à-dire un système qui permet de regrouper plusieurs médias dans un seul document. Ainsi, un document Web peut contenir les éléments suivants :
D'autres outils d'Internet sont intégrés au Web. Le Web peut assurer la liaison avec d'autres outils d'Internet comme WAIS, Gopher, FTP et TELNET. Ainsi, une page Web portant sur un sujet particulier peut renvoyer à une autre ressource d'Internet, peu importe si celle-ci est accessible par l'entremise de Gopher, de TELNET ou d'un FTP. Le Web et ses explorateurs constituent donc une méthode d'accès direct aux informations qui sont mises à la disposition des utilisateurs. Le Web assure l'interface avec d'autres systèmes de bases de données. Une des fonctions les plus puissantes des explorateurs du Web, c'est leur capacité d'agir comme interface avec des systèmes de bases de données reliés à Internet (WAIS, Z39.50 et les bases de données de bibliothèques, par exemple). Il faut trois éléments pour créer cette interface : d'abord, un explorateur Web qui fait appel à la fonction de traitement des formulaires pour recueillir les informations des utilisateurs (des boîtes interactives sont affichées dans les pages Web et l'utilisateur y entre des informations ou choisit des options); ensuite, un système de base de données (un catalogue de bibliothèque, par exemple); pour terminer, une interface CGI (common gateway interface) qui relie l'explorateur du Web et la base de données. Lorsqu'un demande a été traitée, l'interface CGI renvoit les résultats obtenus à l'explorateur dans un format qu'il peut afficher. 3. Comment fonctionne le Web?Pour bien comprendre les mécanismes qui sont à la base du Web, il faut assimiler un certain nombre de concepts dont les plus importants sont les suivants : l'architecture client/serveur, le protocole HTTP (protocole de transfert hypertexte), le langage HTML (langage de balisage hypertexte) et les URL (localisateurs de ressources uniformes). Ils sont décrits dans les pages qui suivent.
Architecture client/serveur Les utilisateurs peuvent faire appel à plusieurs interfaces clients ou explorateurs pour parcourir le réseau Internet; le plus important d'entre eux est Mosaic, un système qui a été développé par le National Center for Supercomputing Applications (NCSA). Si pour la plupart des gens les noms de systèmes Mosaic et World Wide Web sont devenus presque interchangeables, c'est qu'en réalité, c'est le développement de Mosaic, le premier explorateur graphique de Web, qui a fait de WWW le système qu'il est aujourd'hui. Bien que connexes, le Mosaic et le Web sont cependant deux systèmes différents. Le Web regroupe tous les serveurs Web du réseau Internet, tandis que Mosaic est un seul exemple de client Web. Voici une liste des clients Web pour Windows les plus connus :
Protocole HTTP (Protocole de transfert hypertexte)
Langage HTML (langage de balisage hypertexte) Comme le SGML, le HTML sert à décrire la structure d'un document. Un certain nombre de codes HTML intégrés au texte du document fournissent au Web des informations explicites qui lui indiquent comment il doit interpréter le document. Par exemple, si une partie du texte est précédée et suivie d'un code d'en-tête (<h1>Ceci est un titre</h1>, par exemple), le client sait qu'il doit afficher ce groupe de mots sur une ligne séparée, en gros caractères et en gras. Parmi les autres informations que les codes HTML fournissent au client Web, notons les suivantes :
URL (localisateurs de ressources uniformes) et liens hypertextes
4. Comment faut-il procéder pour trouver des informations dans le Web?Il faut des outils de recherche efficaces pour exploiter le vaste espace d'informations que le Web est rapidement en train de devenir. De la même façon que le programme Veronica est né d'un besoin d'effectuer des recherches dans un système toujours croissant de Gophers, un certain nombre d'outils conçus pour faciliter les recherches dans le Web ont fait leur apparition. Ceux auxquels on fait appel le plus souvent sont connus sous le nom de "robot", "wanderer" et "spider". Ces systèmes se déplacent dans le réseau et recherchent automatiquement des éléments divers dans les documents HTML (des titres, par exemple), ils tentent de repérer des mots-clés et établissent des index. L'utilisateur interagit avec eux par l'entremise d'un explorateur du Web. La fonction de traitement des formulaires lui permet d'entrer les mots qui doivent faire l'objet d'une recherche, de limiter le nombre d'occurrences et d'entrer d'autres informations que le "robot" utilise pour faire la recherche. Lorsqu'il est lancé, le "robot" effectue d'abord une recherche dans ses index (ou, dans certains cas, dans les pages HTML (en temps réel)), puis il crée de façon dynamique une page HTML où figurent les liens qui renvoient à des pages d'informations. Le World Wide Web Worm, le WebCrawler Index, Lycos, le Jumpstation Robot et Aspider sont tous des exemples de "robots" Web.Les "robots" sont cependant très gourmands en temps unité centrale et en largeur de bande de réseau, ce qui présente un problème. Ils parcourent constamment le réseau, ils établissent des connexions avec les serveurs Web, ils créent des index et ils effectuent des recherches en temps réel. Il existe cependant un outil de recherche plus "convivial" pour le réseau; il s'agit de Harvest, un programme qui repose sur un principe de base différent permettant de réduire les tensions sur le réseau. Il rassemble des informations d'indexation de façon efficace et les distribue par paquet dans le réseau Internet. Pour obtenir des renseignements plus détaillés sur ce sujet, voir http://harvest.cs.colorado.edu/harvest/technical.html. 5. Importance du WebLe World Wide Web constitue une méthode extrêmement efficace de structuration et d'accès aux informations, ce qui en fait un outil important pour les bibliothèques. Il assure la liaison avec une grande variété de systèmes et de sources d'informations par l'entremise d'une seule interface. Le Web et ses explorateurs permettent aux bibliothèques d'exécuter les opérations suivantes :
![]() |