Extensible Markup Language - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Extensible Markup Language
Extension .xml
Type MIME application/xml, text/xml
Développé par World Wide Web Consortium
Type de format Langage de balisage
Standard(s) 1.0 (5e édition)

1.1 (2e édition)

Spécification Format ouvert

Extensible Markup Language (XML) (français : « langage extensible de balisage ») est un langage informatique de balisage générique. Il sert essentiellement à stocker/transférer des données de type texte Unicode structurées en champs arborescents. Ce langage est qualifié d’extensible car il permet à l'utilisateur de définir les balises des éléments. L'utilisateur peut multiplier les espaces de nommage des balises et emprunter les définitions d'autres utilisateurs.

Le World Wide Web Consortium (W3C), promoteur de standards favorisant l'échange d'informations sur Internet, recommande la syntaxe XML pour exprimer des langages de balisages spécifiques.

De nombreux langages respectent la syntaxe XML : SVG pour des données de graphique vectorisé, XHTML pour des données de page web, RSS pour des données de syndication de contenu, XSLT pour des données de transformation d'un document XML, etc. Cette syntaxe est reconnaissable par son usage des chevrons (< >) pour les balises d'éléments et de la chaîne pour les commentaires du code.

L'objectif initial est de faciliter l'échange automatisé de contenus entre systèmes d'informations hétérogènes (interopérabilité). XML est une simplification du Standard Generalized Markup Language (SGML) dont il retient les principes essentiels comme :

  • la structure d'un document XML est définissable et validable par un schéma,
  • un document XML est entièrement transformable dans un autre document XML.

Historique

Dan Connolly ajoute le Standard Generalized Markup Language à la liste des activités du World Wide Web Consortium lorsqu'il s'y joint en 1995. Les travaux débutent à la mi-1996 lorsque l'ingénieur Jon Bosak de Sun Microsystems élabore une charte et recrute des collaborateurs. Bosak se fait connaître dans la petite communauté de personnes qui avaient de l'expérience à la fois dans le SGML et dans le Web.

XML est compilé par un groupe de travail de onze membres, soutenu par environ 150 membres de divers groupes d'intérêt. Le débat technique a eu lieu sur la liste commune et les questions ont été résolues par consensus ou, lorsque cela a échoué, à la majorité des voix du groupe de travail. Un compte rendu des décisions de conception et de leurs justifications ont été compilées par Michael Sperberg-McQueen de Chicago, le 4 décembre, 1997. James Clark servit comme responsable technique du groupe de travail, notamment en contribuant à l'élément vide «  » et au nom « XML ». Les co-rédacteurs du cahier des charges étaient à l'origine Tim Bray, qui a notamment conduit l'informatisation du Oxford English Dictionary, et Michael Sperberg-McQueen, de l'Université de l'Illinois, qui était éditeur en chef de la DTD TEI ; accompagnés ensuite de Jean Paoli, de Microsoft, comme troisième co-éditeur.

Le groupe de travail XML ne s'est jamais rencontré face-à-face, la conception a été réalisée en utilisant courrier électronique et téléconférences hebdomadaires. Les principales décisions de conception ont été prises en une vingtaine de semaines de travail intense entre juillet et novembre 1996, lorsque le premier travail de spécification XML a été publié. D'autres travaux de conception sont poursuivis jusqu'en 1997, puis le XML 1.0 est devenu une recommandation W3C le 10 février 1998.

Objectif initial

L'objectif initial de XML est expliqué au début de la spécification du 10 février 1998, la phrase est toujours d'actualité : « Son but est de permettre au SGML générique d'être transmis, reçu et traité sur le web de la même manière que l'est HTML aujourd'hui. »(fr). SGML est un langage de balisage, employé dans les industries de la documentation et de l'édition. En adoptant cette syntaxe pour HTML, Tim Berners-Lee confrontait une technologie complexe à de plus en plus d'utilisateurs. L'objectif d'XML était de définir un langage aussi générique, mais plus simple : « XML has been designed for ease of implementation »(en), « XML a été conçu pour une facilité de mise en œuvre »(fr).

Tim Bray, dans son Annotated XML Specification (en) « la spécification XML annotée », explique plus longuement le contexte qui a rendu possible ce standard, en mentionnant notamment les contributions décisives de James Clark. À la lumière des années passées, cette spécification a rempli l'objectif qu'elle se fixait, XML a été largement suivi et favorise l'interopérabilité. Plusieurs choix ont contribué à ce succès.

  • Unicode - Par défaut, SGML était en ASCII (alphabet latin sans lettre accentuée). Il apportait un système d'encodage pour les autres signes, les entités caractères que l'on trouve encore parfois en HTML (exemple : é pour é). En 1996, apparaît la version 2.0 d'Unicode, XML adoptera cet encodage par défaut.
  • Délimitation explicite du contenu - SGML était orienté pour la saisie humaine de textes structurés, sur des machines moins puissantes qu'aujourd'hui. Il autorisait beaucoup de raccourcis. HTML conserve par exemple les balises à fermeture optionnelle (exemple :
  • ). Ces possibilités compliquaient l'implémentation de la norme. En XML, toute balise ouverte doit être fermée.
  • Espace de noms - SGML insistait surtout sur la validation, sur la conformité à un modèle contraignant. XML prévoyait un usage plus souple de l'information structurée, il spécifie un moyen de faire cohabiter plusieurs vocabulaires de balises dans un même document.

Au-delà de HTML, le W3C avait d'autres projets pour lesquels une syntaxe plus facilement extensible était nécessaire. Ces directions ont annoncé une très grande plasticité de XML pour de nombreux usages. SGML était une technologie de niche, sa simplification l'a universalisé avec Internet. Il pénètre désormais la plupart des secteurs de l'informatique. Mais avant de détailler ces utilisations, il peut être utile de préciser un peu ce que c'est.

Versions

La version 1.0 d'XML a été publiée le 10 février 1998.

La version 1.1 publiée le 4 février 2004 apporte des améliorations dans le support des différentes versions d'Unicode.

Le W3C recommande aux processeurs XML de reconnaître les deux versions, bien que la première version soit beaucoup plus répandue que la seconde.

Page générée en 0.082 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise