World Wide Web - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Technologies

Pré-existantes

Le Web repose sur les technologies d’Internet, notamment TCP/IP pour assurer le transfert des données, DNS pour convertir les noms d’hôte en adresses IP et MIME pour indiquer le type des données. Les standards de codage de caractères et les formats d’image numérique GIF et JPEG ont été développés indépendamment.

Spécifiques

Trois technologies ont dû être développées pour le World Wide Web :

  • les URL pour pouvoir identifier toute ressource dans un hyperlien ;
  • le langage HTML pour écrire des pages Web contenant des hyperliens ;
  • le protocole de communication HTTP utilisé entre les navigateurs et les serveurs Web, qui permet d’indiquer le type MIME des ressources transférées.

Ces premières technologies ont été normalisées comme les autres technologies d’Internet : en utilisant le processus des Request for Comments. Cela a donné le RFC 1738 pour les URL, le RFC 1866 pour HTML 2.0 et le RFC 1945 pour HTTP/1.0.

Le World Wide Web Consortium (W3C) a été fondé en 1994 pour développer et promouvoir les nouveaux standards du Web. Son rôle est notamment de veiller à l’universalité des nouvelles technologies. Des technologies ont également été développées par des entreprises privées.

Actuelles

Les principaux standards actuels sont :

  • XML 1.0 développé pour donner aux langages de balises, dont HTML, une syntaxe plus simple que SGML ;
  • HTML 4.01 basé sur SGML, et XHTML 1.0 basés sur XML ;
  • le RFC 2396 (Uniform Resource Identifiers), qui recouvre les URL ;
  • le RFC 2616 (HTTP/1.1) ;
  • les feuilles de styles en cascade CSS level 1 et level 2 ;
  • les modèles de document DOM level 1 et level 2 ;
  • le langage de script JavaScript pour manipuler les documents ;
  • les formats d’image numérique PNG, JPEG et GIF.

Technologies serveur

Outre les protocoles de communication et formats de données échangés sur le Web, plusieurs techniques propres au Web sont mises en œuvre pour faire fonctionner les serveurs Web. Comme ces techniques ne sortent pas du serveur, elles ne sont pas standardisées par le World Wide Web Consortium.

  • Le standard CGI (Common Gateway Interface) est un protocole de communication inter-processus entre le serveur HTTP et des applications externes.
  • Le langage de programmation PHP (PHP: Hypertext Preprocessor) a été développé pour générer les pages Web. Il jouit d’une forte intégration avec le serveur HTTP et les langages HTML.
  • Le moteur ASP (Active Server Pages) a été développé par Microsoft pour interpréter du langage de script dans le serveur IIS (Internet Information Services).

Conception

Universalité

Le Web a été conçu pour être accessible avec les équipements informatiques les plus divers : station de travail, terminal informatique en mode texte, ordinateur personnel, PDA, etc. Cette universalité d’accès dépend en premier lieu de l’universalité des protocoles Internet. En second lieu, elle dépend de la flexibilité de présentation des pages Web, offerte par HTML. En outre, HTTP offre aux navigateurs la possibilité de négocier le type de chaque ressource. Enfin, CSS permet de proposer différentes présentations, sélectionnées pour leur adéquation avec l’équipement utilisé.

Le W3C a pour cela créé des normes dans le but de permettre l'indépendance des outils qui servent à créer du contenu avec ceux qui servent à le lire. On appelle cela l'interopérabilité.

L’accessibilité du Web pour les individus handicapés est aussi l’objet d’attentions particulières comme la Web Accessibility Initiative.

Décentralisation

Les technologies du Web n’imposent pas d’organisation entre les pages Web, ni a fortiori entre les sites Web. Toute page du Web peut contenir un hyperlien vers toute autre ressource accessible d’Internet. L’établissement d’un hyperlien ne requiert absolument aucune action du côté de la ressource pointée. Il n’y a pas de registre centralisé d’hyperliens, de pages ou de sites. Le seul registre utilisé est celui du DNS, c’est une base de donnée distribuée qui répertorie des hôtes et est utile à tous les systèmes basés sur Internet.

Cette conception décentralisée devait favoriser, et a favorisé, une augmentation rapide de la taille du Web. Elle a aussi favorisé l’essor de sites spécialisés dans les informations sur les autres sites : les annuaires et les moteurs de recherche. Sans ces sites, la recherche d’information dans le Web serait extrêmement laborieuse. La démarche inverse, le portail Web, tente de concentrer un maximum d’informations et de services dans un seul site.

Une faiblesse de la décentralisation est le manque de suivi lorsqu’une ressource est déplacée ou supprimée : les hyperliens qui la pointaient se retrouvent cassés. Et cela n’est visible qu’en activant l’hyperlien, le résultat le plus courant étant le message d’erreur 404.

Page générée en 0.062 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise