Common Tag Standard : les tags + la sémantique

La publication de Common Tags Standard est à mon avis un événement majeur dans la construction du Web sémantique. J’avais déjà parlé ici de Faviki qui permet le marquage de ses favoris par des concepts de DBpedia, les dits concepts étant suggérés par le moteur Zemanta. Common Tag propose de standardiser ce mécanisme de marquage sémantique par l’utilisation d’un vocabulaire RDF simple, destiné à être utilisé principalement sous forme de RDFa.

Quel est le principe de Common Tag? Au lieu de considérer le marquage comme la pose d’un mot-clé sur une ressource, avec tous les problèmes connus que cela comporte (homonymie, ambiguité, synonymie, langues multiples), on considère que derrière le tag (le libellé en langage naturel, une chaine de caractères) se cache un concept qui lui peut être défini de façon formelle dans l’univers RDF, typiquement défini par une URI décrite dans un vocabulaire contrôlé. Un tag sémantique sera donc un objet de type relation (de classe Tag avec majuscule) à trois pattes dont l’une est le « tag minuscule », c’est-à-dire le libellé, la deuxième la ressource marquée, et la troisième l’URI du concept. Des informations complémentaires portées par le Tag peuvent être l’auteur et la date, l’origine (auteur de la ressource ou lecteur, marquage automatique). Tout cela est très simple.

Les utilisations sont multiples, si on considère que les trois pattes du Tag peuvent être utilisées deux par deux et dans tous les sens.

  1. Attacher un tag(libellé) à une ressource comme dans le tagging ordinaire
  2. Rechercher les ressources marquées par un libellé
  3. Attacher un concept contrôlé à une ressource (indexation sémantique)
  4. Retrouver toutes les ressource attachées à un concept (recherche par métadonnées contrôlées)
  5. Retrouver tous les libellés utilisés pour un même concept, dans toutes les langues ou dans une langue donnée
  6. Retrouver tous les concepts attachés à un libellé

… plus les options de filtrage par date et auteur.

Les utilisations 5 et 6 sont des effets collatéraux du standard qui ne sont pas des moins intéressants. Si le marquage sémantique se fait dans le contexte de la ressource marquée, il est de fait aussi un enrichissement du concept par des libellés. On marque donc le concept en même temps que la ressource, et tout le monde y gagne.

Pour l’instant les outils d’aide au marquage comme Zemanta ne fonctionnent qu’en anglais, mais le standard fournit bel et bien l’infrastructure pour l’intégration du marquage multilingue. Il n’y a plus qu’à …

2 commentaires pour Common Tag Standard : les tags + la sémantique

  1. […] Ces soucis seront peut être résolus grâce à Common tags,  qui a vu le jour en juin 2009. Ce système est très futé : il se propose de formaliser les tags en RDF (langage de base du web sémantique). En fait, derrière le tag (le libellé en langage naturel, une chaine de caractères) se cache un concept qui peut être défini de façon formelle dans l’univers RDF, et permet ainsi pas mal d’utilisations comme nous l’explique leçon de choses. […]

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :