Web 3.0 : Le web sémantique

semantique

Le concept a été introduit par un article intitulé The Semantic Web de Tim Berners-Lee, James Hendler and Ora Lassila, en mai 2001, dans le magazine Scientific American.

Le web sémantique est un web lisible non plus seulement par les humains, mais également par les machines. Le web sémantique doit passer par le Web des données, qui lui, doit lier et structurer l’information présente sur internet. Tout cela dans le but que l’information puisse être manipulée à l’échelle d’internet et qu’elle puisse être combinée afin de générer nouvelles informations.

Les technologies clés du web sémantique sont le RDF, les OWL et le SPARQL query, définis par le W3C (World Wide Web Consortium).

Le RDF (Ressources Description Framework) est la norme du W3C pour les métadonnées. Il s’agit d’un texte au format XML qui autorise la description de ressources. Le RDF est constitué de trois informations que l’on nomme «triplet RDF ». Celui-ci est constitué d’un sujet, d’un prédicat et d’un objet. Ces trois éléments sont écrits sous forme d’URI (Uniform ressources Identifier) qui est une courte chaîne de caractères identifiant une ressource sur le Web. En fait, un URL est un URI. Les triplets RDF sont logés dans des dépôts RDF que l’on nomme « Triplestore » et qui sont en fait des bases de données spécialement conçues pour le stockage et la récupération de données RDF.

SPARQL veut dire  « Protocol and RDF Query Language ». Il s’agit de l’équivalant de SQL, mais pour les bases de données RDF.  C’est donc un langage de requête et un protocole qui permet de rechercher, d’ajouter, de modifier ou de supprimer des données RDF disponibles à travers Internet.

Le OWL (Ontology Web Language) est un langage XML d’ontologies web. Une ontologie est l’ensemble structuré des termes et concepts représentant le sens d’un champ d’informations. Il est constitué de deux parties, l’une défini la nature des éléments de l’ontologie (les concepts) et la seconde, explicite les relations de ses éléments. Dans une ontologie, les concepts sont définis les uns par rapport aux autres. Dans le contexte du Web sémantique, les ontologies sont la clé pour « se donner les moyens de faire faire des traitements automatiques à des modules logiciels au sein du Web, que ce soit pour faire interagir et inter-opérer des machines entre elles ou faire interagir des machines avec des humains. »

Beaucoup d’efforts et d’énergies sont déployés à son développement. Le format RDF est de plus en plus utilisé. L’organisation DBpedia travaille à extraire de l’information structurée à partir des infoboxs de Wikipédia et la rend disponible sur le web. DBPedia est l’un des plus grands dépôts RDF du web sémantique. Le gouvernement britannique publie ses données ouvertes en utilisant les technologies du web sémantique depuis 2010. La Bibliothèque nationale de France considère que le partage des données structurées et de confiance fait partie de la mission des bibliothèques. Elle transforme donc ses catalogues afin que ceux-ci s’adaptent aux standards du web tout en s’inscrivant dans le web des données.

Les grands moteurs de recherche (Bing, Google et Yahoo) ont lancé une initiative conjointe nommée schema.org en 2011. Il s’agit d’un schéma de microdonnées (HTML5) utilisé sur le web. Les microdonnées permettent aux robots d’indexation de saisir plus précisément le sens des pages indexées. Une adaptation du schéma au format RDF est disponible.
Google, en septembre 2013, a introduit un tout nouvel algorithme de recherche, hummingbird. Les mots-clés perdent de l’importance au profit du contenu. Ce qui est la nouvelle tendance. L’achalandage est encore roi, mais on tient maintenant compte de la réputation de l’auteur (c à-dire la réputation google + de l’auteur).

Pour plusieurs spécialistes, le chemin du Web sémantique comporte trop d’obstacles et tient même de l’utopie. En tentant de faire une synthèse des ces obstacles, j’ai constaté qu’ils variaient considérablement d’un auteur à l’autre. Si l’on ne peut s’entendre sur un seul problème insurmontable, ne peut-on pas douter de son existence ?

Caroline Arseneau

Laisser un commentaire