Voici un petit billet de vacances à glisser entre deux pages du livre que vous lisez sur la plage ou à la terrasse d’un café. Le seul danger de ce qui suit étant de ne plus être tout à fait sûr à la fin de ce que vous êtes en train de lire. Vous voilà prévenus, continuez à vos risques et périls ou bien retournez tranquillement à votre lecture de vacances car en icelle bien aultre goust trouverez.
« Tu as lu ça? » Voilà une question simple et anodine qu’on imagine posée dans une conversation tranquille entre amis, autour d’un verre. Le livre est posé là sur un coin de table, désigné d’un geste ou même d’un simple regard. Pas besoin semble-t-il d’explications supplémentaires pour identifier l’objet de la question. Selon l’expression de Pat Hayes dans In Defence of Ambiguity et que je traduis ici au mieux il s’agit d’une identification ostentatoire : on identifie ce dont on parle en le montrant. Et la plupart du temps la question sera comprise sans problème, et la réponse « oui » ou « non » considérée comme non ambiguë dans le contexte de cette conversation. Ce qui est assez extraordinaire quand on y pense, tant cette question est beaucoup plus subtile qu’il n’y parait, et susceptible de toute une palette d’interprétations et de réponses. Suivant le contexte de la conversation l’objet de la question, le « ça » qui a été lu (ou pas) peut représenter en effet des choses bien différentes.
Si le livre posé sur la table m’a été offert ou prêté par cette amie qui pose la question, sa question peut concerner explicitement cet exemplaire physique bien précis et unique qu’elle a peut-être dédicacé et annoté de façon à le distinguer de tous les autres exemplaires de la même édition, autrement interchangeables. Mais la plupart du temps cet exemplaire n’a rien de particulier et le « ça » que j’ai lu pourrait être tout aussi bien un autre exemplaire identique sans changer le sens de la question ni de la réponse. Et comment savoir que j’ai lu un exemplaire identique à celui-ci, sans même l’ouvrir? Je reconnais la maquette de couverture, le nom de l’auteur, le titre, tout cela la plupart du temps par un processus global ne nécessitant pas une analyse explicite et formelle en termes d’éléments identifiants. Je reconnais ce livre du premier coup d’œil comme je reconnaîtrais un modèle de voiture ou un paquet de mes biscuits favoris, par comparaison instantanée à une représentation stockée dans ma mémoire.
J’ai pu aussi lire « ce livre » dans une autre édition, voire en version électronique sur ma tablette, en ligne sur Google Books. Si je réponds malgré tout « oui, je l’ai lu » dans ce cas, comment est-ce que je décrète que c’est bien « ce » livre, dans une édition différente? Cette fois je dois bien passer par une analyse un peu plus formelle d’éléments identifiants : c’est bien le même auteur, le même titre, mais est-ce suffisant? Je poserai peut-être quelques questions sur le contenu pour être bien sûr qu’on parle bien du même. Et mon édition n’a peut-être pas exactement le même contenu. Peut-être une préface différente? Est-ce qu’avec une autre préface c’est toujours le même livre ?
Un autre cas encore : mon amie lit dans la version originale, et j’ai lu une traduction. Je répondrai encore oui peut-être, mais en précisant bien que c’est une traduction que j’ai lue. Il faut dans ce cas que je fasse le rapprochement, par exemple dans la traduction que j’ai lue il y avait le titre original et je m’en souviens, sinon il faudra que je fasse la traduction, ça commence à devenir compliqué si l’original est en chinois.
C’est toute la richesse et la flexibilité du langage et de l’esprit humain de pouvoir gérer instantanément toutes ces subtilités et l’ambiguïté fondamentale du référent de la question (le livre), de pouvoir passer sans dommage de l’objet physique désigné à mon regard à des représentations mentales plus larges. Comment traduire cette flexibilité dans des langages formels, des vocabulaires qui nous permettent de communiquer sans ambigüité avec les machines? Cette traduction nécessite des objets clairement identifiés, typés et décrits qui peuvent expliciter le « ça » de différentes façons. Pour ce faire, les bibliothécaires ont mis au point un cadre de représentation assez élaboré nommé FRBR, qui distingue quatre niveaux de représentation du livre (Œuvre, Expression, Manifestation et Item). Découpage intéressant et utile, mais dont le nombre de niveaux et leur distinction parait finalement assez arbitraire, et dont la terminologie peut paraître déroutante a priori, même pour les documentalistes. BIBFRAME dont nous avons déjà parlé réduira d’ailleurs le nombre de niveaux à trois seulement, pour simplifier, mais la démarche générale de FRBR est intéressante et peut sans doute être utilisée dans d’autres domaines (voir quelques réflexions récentes à ce sujet).
Le modèle FRBR est-il suffisant ou même pertinent quand je considère le livre dans un tout autre contexte que la classification et la recherche documentaire comme la vente en ligne? Un livre sur un site marchand, c’est un produit, c’est-à-dire une référence et une description, je l’achète comme n’importe quel autre produit en ligne. Je ne sais pas quel exemplaire m’arrivera par la poste. Du point de vue FRBR, ce que j’achète serait à la rigueur au niveau de la Manifestation, identifiée par un ISBN par exemple. Mais le vendeur stocke et me propose des données qui ne sont pas du tout de l’ordre de FRBR : nombre d’exemplaires en stock, état neuf ou occasion, pourcentage de remise, délai d’acheminement, options de livraison, recommandations (ceux qui ont acheté ce livre ont aussi consulté …), et une fois expédié, c’est un exemplaire (Item) qui est géré par le service de suivi, avec un transporteur, un numéro de colis, une date de livraison prévue … Dans ce contexte, le livre sera sans doute mieux décrit par un vocabulaire comme GoodRelations.
Un autre schéma de représentation serait nécessaire pour décrire la chaîne de fabrication du livre, un autre pour le processus de sélection chez un éditeur (ce manuscrit non encore publié est un livre en puissance, mais est-ce déjà un livre), un autre encore pour le processus de restauration s’il s’agit d’un livre ancien et précieux.
On le voit, il ne peut exister de représentation unique du livre, chaque contexte d’information utilise son mode de représentation et d’identification. Vouloir les unifier dans une représentation unique de ce qu’est un livre est un exercice de compromis difficile, entre les deux extrêmes de l’accumulation (la réunion de toutes les représentations risque d’être incohérente) et du plus petit modèle commun (l’intersection de toutes les représentations risque d’être vide). C’est pourquoi on peut se poser la question du périmètre d’utilisation d’une représentation à tout faire comme http://schema.org/Book qui à la fois ne capture pas tous les aspects du concept, et se trouve encombrée par héritage de son parent http://schema.org/CreativeWork de propriétés dont la pertinence dans certains des contextes évoqués plus haut est plus que douteuse.
Ce qui est indispensable par contre ce sont des interfaces de traduction entre la représentation de la bibliothèque et celle du site marchand, entre le site marchand et son fournisseur, entre la bibliothèque et l’atelier de restauration, et à ces interfaces le partage d’identifiants et de vocabulaires minimaux communs. Une architecture composée de représentations pertinentes dans un contexte, et d’interfaces explicitant les règles de traduction d’un contexte à l’autre, est certainement l’avenir de l’architecture des systèmes d’information sémantique. D’où l’importance de la gouvernance des biens communs que représentent des vocabulaires variés et interconnectés, écosystème que nous avons commencé à décrire dans le projet Linked Open Vocabularies, et auquel le W3C s’intéresse de près avec sa nouvelle proposition de Vocabulary Services. Nous en reparlerons.
En attendant, bonne lecture … et beuvez frais si faire se peut.
Vous devez être connecté pour poster un commentaire.