Métadonnée - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Une métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).

Les métadonnées sont à la base des techniques du web sémantique. Elles sont définies dans le cadre du modèle Resource Description Framework (RDF).

Historique

Tous les établissements qui ont à gérer de l'information, bibliothèques, archives ou médiathèques ont déjà une longue pratique dans la codification du signalement ou des contenus des documents qu'ils manipulent. Avant l'arrivée de l'informatique on utilisait des fiches cartonnées dont la structure a été normalisée en 1954 sous la référence ISBD (International standard bibliographic description).

Ces descriptions ont ensuite été informatisées sous la forme de notices bibliographiques et normalisées (voir par exemple les formats MARC en 1965 utilisant la norme ISO 2709 dont la conception a démarré en 1960). Elles facilitent la gestion interne des ressources documentaires et, côté usagers, permettent d'optimiser la recherche et la localisation des documents.

Les bibliothèques numériques ont eu recours aux mêmes dispositifs pour gérer et localiser des documents électroniques. Dans les applications distribuées, on a rapidement normalisé l'échange d'éléments de données extraits de ces notices et en 1988, la Bibliothèque du Congrès, aux États-Unis, proposait un protocole pour la recherche d'information (Z39.50) qui fut revu en 1992.

Le terme métadonnée (en anglais : metadata) est apparu dans le cadre de la description de ressources sur Internet dans les années 1990 et s'est ensuite généralisé.

Généralisation

Les langages de balisage de type GML, puis SGML et HTML, ont introduit une rupture dans la nature des métadonnées. Auparavant la distinction entre les fiches, les notices, d'une part, et les contenus, d'autre part, était quasiment absolue. Cette nouvelle structuration de l'information permit d'introduire des métadonnées dans les documents eux-mêmes. Les Communautés européennes adoptèrent le langage SGML dès 1984.

La notion de métadonnées utilisables par les ordinateurs fut proposée assez tôt dans l'histoire du Web, dès 1994, par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Les métadonnées sont en effet au cœur de l'architecture Web.

En 1995, les métadonnées firent l'objet d'un atelier à Dublin (Ohio), pour les méthodes de recherche d'information. En parallèle, la bibliothèque du Congrès proposait une 3e version du protocole Z39.50.

En 1999, le W3C définit le cadre permettant de créer un réseau de métadonnées acceptant le langage XML : Resource Description Framework (RDF).

Le tronc commun de métadonnées Dublin Core a été adopté par l'Union européenne en 2002.

Différence de perception entre l'Amérique et l'Europe

Selon Robert Steele, expert américain en sources ouvertes, qui intervient à Bruxelles, les métadonnées sont appelées à jouer un rôle de plus en plus important pour la représentation avancée de contexte dans les modèles de contrôle d'accès et les langages de ressources Web actives.

En Amérique

Un certain nombre d'équipes impliquées dans la sémantique sur le web ont organisé un atelier à Dublin (Ohio) en 1995 sur les métadonnées, en définissant le standard Dublin Core.

Différents départements du gouvernement fédéral (DoD, ...) se sont dotés de registres de métadonnées, qui permettent de définir un champ commun de partage de connaissances entre des organisations travaillant sur des sujets de souveraineté : défense, justice, environnement.... La Bibliothèque du Congrès, située à Washington, joue un rôle moteur dans la définition des métadonnées aux États-Unis.

Les standards de métadonnées sont l'un des trois éléments clés de la stratégie données en réseau centré (Net-Centric Data Strategy) du département de la défense des États-Unis, avec les communautés d'intérêt et les services d'entreprise GIG.

Le gouvernement canadien doit se conformer au Dublin Core depuis octobre 2001. Le gouvernement canadien a édicté des lignes directrices pour décrire les métadonnées utilisées dans les ressources Web.

Dans l'Union européenne

Au Royaume-Uni, l'UKOLN (United Kingdom Office for Library and Information Networking) est l'organisme le plus avancé sur la gestion de l'information numérique (métadonnées et interopérabilité). Il développe des projets pour la recherche et développement financés par l'Union européenne. Il a une influence sur la réglementation, l'« awareness », la recherche et développement, les techniques Web. Le gouvernement britannique a défini un standard de métadonnées pour le e-gouvernement (e-GMS)

En France, par manque d'information ou de formation à ce propos, relativement peu de webmestres intègrent des métadonnées aux contenus numériques qu'ils publient. La raison est probablement que les métadonnées n'ont pas de valeur juridique normative au niveau européen et dans les États membres (en particulier en France), puisqu'il n'y a pas d'obligation légale ni de standard officiel. Les webmestres introduisent au coup par coup des métaéléments (meta tags, balises meta) dans les pages web.

Des organismes comme le Commissariat à l'énergie atomique et le CNES (membres de l'association ARISTOTE) emploient des métadonnées pour l'archivage à long terme, en utilisant les recommandations de l'OAIS.

La CORES Resolution (standards interoperability forum Resolution on Metadata Element Identifiers 12-12-2002) a adopté en 2002 les Identifiants de Ressource Uniformes (Uniform Resource Identifiers, URI) pour l'accès aux ressources Web, en s'appuyant sur des standards de métadonnées.

« Nos standards de métadonnées ont des éléments - unités signifiantes - qui peuvent être comparés et mis en correspondance avec des éléments d'autres standards ».

Ce groupe de projet a travaillé pour la Commission européenne. Il est composé de personnes appartenant à :

  • GILS : Government Information Locater Service (USA)
  • MARC21 : standards de la bibliothèque du Congrès américain (USA)
  • IEEE/LOM : Learning Object Metadata (USA)
  • DCMI : Dublin Core Metadata Initiative (USA)
  • DOI Foundation : Digital Object Identifier
  • ONIX : ONIX for books, diffusion de livres
  • CERIF : Common European Research Informade0031.htm Metadata/Taxonomy]
  • la NASA :

NASA taxonomy - Metadata.

Les classifications étant structurées, il est plus aisé de gérer la traçabilité, d'agréger les données, et de protéger le patrimoine informationnel.

Les métadonnées sont ainsi un élément essentiel du chantier de gestion de contenu en ingénierie des connaissances.

Métadonnées et traçabilité : gestion de la preuve

La gestion des documents d'archives doit pouvoir s'appuyer sur des données cohérentes le long du cycle de vie des données. Il existe donc des normes de gestion des documents d'archives (ISO 15489), et une norme particulière sur les métadonnées (ISO).

Métadonnées et agrégation des données : gouvernance

Dans le domaine de la gouvernance en général (gouvernement, administrations, entreprises, les métadonnées stockées dans des métadictionnaires (ou repository ; référentiels) sont utilisées comme « données sur les données », ou données de référence.

Les métadonnées permettent de décrire les données utilisées dans les analyses et prises de décisions :

  • la définition exacte des données (sémantique)
  • la source des données (date, origine)
  • la façon dont elles sont calculées, agrégées, ... (règles de calcul)
  • les règles métier qui s'y rapportent
  • le processus d'extraction, transformation et chargement qui a été mis en œuvre (voir ETL et Intégration d'applications d'entreprise).

Les métadonnées facilitent les analyses croisées dans la gouvernance d'entreprise :

  • Les tableaux de bord de gestion et l'informatique décisionnelle (entrepôts de données et datawarehouse).
  • Les tableaux de bord prospectifs, encore peu employés en France.
Page générée en 0.084 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise