Quand parlons-nous de la « même » chose?

Périodiquement, le débat sans fin sur la définition de ressource et de ce que les URI identifient, resurgit ici et . J’avais essayé il y a quelques mois de résumer les termes de ce débat dans l’article Wikipédia Ressource Web, et dans sa version originale en anglais. Curieusement, alors que le débat sur le sujet est toujours vif sur les forums du Web Sémantique, le contenu de cet article n’a suscité pratiquement aucune discussion interne à Wikipédia, ni pour la version anglaise ni pour la version française.

Pour le W3C, le débat est tranché depuis deux ans et les réponses exposées dans divers documents à valeur de recommandations comme Architecture of the World Wide Web, ou la résolution du problème httpRange-14. Malgré tous ces efforts, si le problème resurgit, c’est qu’aucune résolution technique ne répond de façon totalement satisfaisante à des questions de fond extrêmement ardues sur lesquelles philosophes et linguistes s’usent les dents depuis la nuit des temps. Ce qu’on peut retenir de la persistance de tels débats, c’est que l’environnement technique du Web complique encore le problème essentiellement ardu de l’identification des choses.

Tout d’abord l’application du principe « Everything is a Thing », développé dans notre première leçon de choses, entraîne que le même type d’ identifiant – URI, et singulièrement http URI – est utilisé à tous les niveaux de représentation, aussi bien pour identifier un document statique (par exemple une image), une page web à contenu dynamique (la page météo du jour), une chose documentée par de telles ressources (la personne définie par son profil FOAF, un lieu identifié dans GeoNames), ou un concept abstrait (une classe dans une ontologie). De nouveaux types de ressources apparaissent sans cesse, comme cette notion très intéressante d’ « objet d’information composite« , qui affecte une URI à un graphe reliant les différents avatars Web d’une même ressource d’information (versions PDF ou HTML en différentes langues, pour application mobile etc).

En principe, une URI est une chaîne de caractères opaque, c’est-à-dire que la seule façon de savoir ce qu’elle identifie est de la soumettre au protocole associé (http par exemple). Mais les possibilités techniques croissantes du Web (redirection, négociation de contenu, cache, cookies …) font que les octets effectivement reçus du système à travers le protocole http pour une URI donnée, c’est-à-dire le résultat de la résolution de l’URI, et son rendu dans une interface utilisateur finale, dépendent de plus en plus du contexte : moment de la requête, configuration du client et du serveur etc. Donc l’axiome de départ : « une URI = une ressource » est intenable si on entend par ressource un document unique, à contenu statique, traduit en tout temps et en tout lieu par le même paquet de données brutes. L’axiome continue à tenir la route si on donne à « ressource » le sens d’un « quelque chose » supposé(e) unique au-delà de ces diverses représentations obtenues à partir de l’URI à travers le protocole associé. Dans ce cadre on peut, comme le fait la résolution http-Range14 citée plus haut, distinguer les types de ressources identifiées par une URI http en fonction du type de réponse renvoyée par le serveur dans le protocole en question.

Cette résolution technique ne résoud pas la question de fond : le statut « ontologique » de la ressource, qui se pose de façon critique quand il s’agit de déterminer si oui ou non deux URI sont des « alias » ou des « avatars » de la même ressource, une question tout à fait identique à celle du langage naturel, à savoir comment déterminer si deux mots, ou termes, sont synonymes, c’est-à-dire désignent la même chose. Le langage OWL donne un moyen technique d’affirmer une telle identité grâce à la propriété owl:sameAs, mais reste agnostique sur ce qui peut justifier l’emploi de cette propriété, à la valeur sémantique très forte. Dans le cadre du projet Linking Open Data dont nous avons déjà parlé, cette propriété est utilisée à grande échelle, par exemple pour signifier que la ville de Berlin identifiée par DBpedia et la ville de Berlin identifiée par GeoNames sont bien « la même chose ».

<http://dbpedia.org/resource/Berlin&gt; owl:sameAs <http://sws.geonames.org/2950159/&gt;

La thèse que je défends dans ce cadre est qu’une telle assertion est d’autant plus « crédible » qu’elle est fondée sur un accord réciproque entre les deux parties. Accord qui pourrait se traduire d’un point de vue « social » par la déclaration dans le sens ci-dessus dans la description publiée par DBpedia, et dans le sens réciproque dans celle de GeoNames. Du point de vue « logique » de la sémantique formelle de OWL, une telle assertion est symétrique, et implique que toute assertion valide pour la première ressource l’est aussi pour la seconde (et inversement), ce qui permet à un raisonneur de détecter éventuellement des incohérences entre les descriptions fournies de part et d’autre, et donc de signaler aux parties en présence que si elles déclarent parler de la même chose, elles en parlent de façon contradictoire.

Pour finir, si une telle infrastructure ne permet pas de répondre à la question fondamentalement indécidable : « Parlons-nous de la même chose? », elle permet aux parties en présence de déclarer : « Nous pensons que oui, jusqu’à preuve du contraire », et aux systèmes logiques de détecter de telles « preuves du contraire », et de les renvoyer aux parties en présence pour qu’elles statuent sur ces incohérences, soit en modifiant leurs descriptions, soit en revenant sur leurs déclarations en se mettant d’accord sur un nouveau « Non, finalement, nous ne parlons pas de la même chose ».

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :