Leçon 3 : Anatomie d’une Description (1)

Les descriptions en RDF utilisent des constructions très simples, qu’on peut assimiler en grammaire de l’école élémentaire à des phrases de type  « Sujet + Verbe + Complément » ou plus généralement « Groupe Sujet + Groupe Verbal + Groupe Complément », et appelées dans le vocabulaire technique RDF des triplets « Sujet Prédicat Objet », ou encore « Sujet Propriété Objet ».  Avec cette boite à outil minimaliste, une description RDF peut se réduire en première approximation à un ensemble de phrases qui ont toutes le même sujet. En langage naturel, plusieurs éléments de description sont souvent imbriqués dans une expression complexe, comme par exemple : « … une montagne d’altitude 3913 m, voisine du Mont Pelvoux« .  A noter que la chose qui est le sujet n’est dans ce cas ni identifiée ni nommée explicitement, mais sa description contient implicitement trois phrases ayant ce même sujet. 

 … « est une » montagne
 … « a une altitude en mètres de » 3913
 … « est voisin de » Mont Pelvoux

Le premier élément de description définit un type pour le sujet. La façon la plus fréquente d’exprimer le typage en RDF est d’utiliser une classe, de préférence définie dans un langage d’ontologie comme RDFS ou OWL. On peut chercher une telle ontologie dans une bibliothèque comme Swoogle, et comme la plupart des ontologies disponibles sur le Web utilisent l’anglais, chercher si une classe « Mountain » est disponible.
http://swoogle.umbc.edu/index.php?service=search&queryType=search_swd_ontology&searchString=mountain
Le nombre de réponses laisse l’embarras du choix, mais par exemple http://sweet.jpl.nasa.gov/ontology/earthrealm.owl définit une classe « Mountain » qui semble convenir. 
On peut donc se risquer à écrire ce morceau de description (D1)

<rdf:Description>
 <rdf:type rdf:resource= »http://sweet.jpl.nasa.gov/ontology/earthrealm.owl#Mountain »/&gt;
 …
</rdf:Description>

Si on choisit ce genre de déclaration il faut bien en mesurer les conséquences. L’ontologie où cette classe est définie attache toutes sortes de propriétés logiques à la classe en question, et donc si je déclare ma chose comme instance de cette classe, pour tous les agents du Web sémantique, elle héritera de toutes les propriétés de la dite classe, pour le meilleur et pour le pire. En particulier si l’éditeur de l’ontologie (la NASA) décide de modifier cette ontologie, il y aura un impact sur ma description. La déclaration ci-dessus implique qu’on assume ces conséquences.

Une façon différente d’exprimer le typage est d’utiliser un vocabulaire contrôlé, de type thesaurus ou taxonomie, typiquement représenté en langage SKOS, et de déclarer le typage comme une indexation/classification de ma chose sur un élément de ce vocabulaire, en utilisant un attribut d’indexation spécifique, moins contraignant que le rdf:type ci-dessus.
Par exemple en utilisant l’ontologie geonames dont nous avons déjà parlé, on aura la description (D2)

<rdf:Description>
 <geonames:featureCode rdf:resource= » http://www.geonames.org/ontology#T.MT »/&gt;
 …
</rdf:Description>

La définition de la propriété « featureCode » dans l’ontologie de référence http://www.geonames.org/ontology/ontology_v1.2.3.rdf permet de déduire de cette déclaration que ma chose est de classe http://www.geonames.org/ontology#Feature, qui entraîne certes moins de contraintes logiques que la classe « Mountain » de la NASA, mais qui est néanmoins le rattachement à une classe logique avec des propriétés attachées comme latitude et longitude. Un autre intérêt de la description D2 est qu’elle permet a priori des descriptions multiples, utilisant des attributs et/ou des vocabulaires différents.

Pourquoi choisir D2 plutôt que D1? Tout dépend de l’usage que l’on veut faire de la description. Si on veut l’attacher à une chose bien identifiée et utiliser cette description dans une base de connaissances pour faire des raisonnements en utilisant des règles complexes, une description de type D1 est sans doute préférable. Mais si le but de la description est plutôt l’indexation et la recherche – classer et pouvoir retrouver les choses à partir de leurs éléments de description, par une recherche multicritères ou les rubriques d’une taxonomie de navigation – une description de type D2 sera plus adaptée.

Sans aller davantage dans les détails, une leçon à tirer est que pour formaliser une description « naturelle » en RDF, on doit prendre en compte les usages qu’on aura de cette description. Aucun choix n’est « bon » ou « mauvais » dans l’absolu, et aucune description n’épuise le sujet.

2 commentaires pour Leçon 3 : Anatomie d’une Description (1)

  1. […] Leçon 1 : Toute chose est une Chose Leçon 2 : Sémantique du Pic Sans Nom Un mot, plusieurs choses Leçon 3 : Anatomie d’une Description (1) […]

  2. […] Dans une leçon précédente on avait volontairement laissé en pointillés la chose décrite, pour ne s’intéresser qu’aux éléments de la description elle-même. Je vais donc revenir là-dessus aujourd’hui à partir du même exemple, cette fameuse montagne d’altitude 3913 m, voisine du Mont Pelvoux. Le lecteur un peu familier du Massif des Ecrins, à l’aide d’une bonne carte, aura tôt fait de s’assurer qu’il ne peut s’agir d’autre chose que de notre bon vieux Pic Sans Nom. Et s’il a suivi les leçons précédentes, il pourra même lui attribuer illico un identifiant homologué Web sémantique. Et il pourra dire que tout est pour le mieux dans le meilleur des mondes sémantiques, où toutes les choses sont identifiées par une URI. Fort bien. Mais est-ce que deux utilisateurs humains qui effectuent le même processus d’identification ci-dessus, et tombent d’accord sur le fait d’attribuer à la chose cette même URI, sont pour autant d’accord sur l’identité de la chose en question? Après Quine, nous pouvons soutenir qu’une telle conclusion est impossible. Et de fait, on peut raisonnablement douter que Pierre le géographe qui a identifié la montagne à partir d’une carte topographique, et qui n’a encore jamais mis les pieds dans les Ecrins, en aura la même conception que Jacques l’alpiniste qui a failli y mourir de froid lors d’une tentative hivernale sur la redoutable face Nord. Et si l’on va plus loin dans le détail de la description, les éléments que vont y ajouter Pierre et Jacques risquent d’être au mieux singulièrement différents, et au pire totalement contradictoires. On découvrira sans doute assez vite qu’au-delà de leur accord initial sur le fait qu’ils parlent bien de la même montagne, ils ne décrivent pas vraiment la même conception de cette montagne. Et nous arrivons ici à un point fondamental : on ne décrit jamais directement une chose, on décrit le concept qu’on a de la chose. Et même si on s’accorde à parler de la même chose, on peut être en désaccord sur la conception qu’on en a. L’approche linguistique, et en particulier le triangle sémiotique introduit par Saussure signifiant, signifié, référent, peut être utile ici. Une ressource RDF identifiée par une URI, décrite par un ensemble de propriétés formelles est dans cette approche un signe linguistique. L’URI en est le signifiant, la description formelle associée est une explicitation du signifié, et la chose décrite est le référent. […]

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :