Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C.
La notion de métadonnées utilisables par les machines fut proposée assez tôt dans l'histoire du Web, dès 1994 par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles sont alors présentées comme une nécessaire représentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employée par une organisation Y.
Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework), langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web.
Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF destiné à décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publiés dans leur forme finale en février 2004.
Au cours de cette évolution, la notion de ressource s'étend de son sens original de « document publié sur le Web » à des sens plus généraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de développement, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l'indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l'environnement Web, permettant de transformer automatiquement les données en information, et les informations en savoir.
Ces nouveaux protocoles de communication et langages standards permettent le développement de nouveaux usages qui rendent concrète la notion d'intelligence collective. C'est notamment le cas du « social bookmarking », de la recherche sociale (voir par exemple Lycos IQ [1]). Les wiki sémantiques permettent de créer des contenus en précisant leur sens et en caractérisant leurs relations via une syntaxe de type wiki.
La recherche de données par requêtes en langage naturel et systèmes de question réponses est l'un des enjeux du web sémantique. La plupart des algorithmes des systèmes de questions-réponse reposent en effet sur l'usage intensif des étiquetages sémantiques (ou étiquetages par entités nommées). Comme illustré par le système de question-réponse EAGLi [2], appliqué aux sciences de la vie et de la santé.
Avec ces systèmes, l'utilisateur ne saisit plus dans un moteur de recherche une requête composée de terme décrivant l'objet de sa recherche (exemple « logiciel freeware traduction ») mais une question en clair, susceptible de produire un résultat de recherche construit et fruit d'un assemblage d'informations (exemple, « qui sont les auteurs classiques du XIXe »).
Les expériences menées actuellement, comme par exemple celle de DBpedia, en construisant des bases d'informations relationnelles décrivant le contenu sémantique de Wikipédia, permettent d'envisager la mise au point rapide de tels moteurs. On visitera par exemple Berlin SNORQL [3] pour imaginer ce que pourraient être ces applications.