Croyez-vous (crois-tu, Bernard ?) en la noosphère, cette conscience collective de l’humanité, dans laquelle les idées circulent librement d’un cerveau à l’autre, captées par nos inconscients, créant ainsi modes, courants intellectuels, et tendances ? Me croyez-vous si je dis que je préparais un article justement intitulé… “Data, Information… and Knowledge ?”, expliquant les mêmes idées que celui-ci trouvé par Bernard dans un précédent post ?
Encore que, à bien y réfléchir, ce n’étaient pas exactement les mêmes idées, même si le découpage (somme toute classique) “Données / Information / Connaissance” était le même. L’un de mes anciens professeurs de l’UTC, Jean-Paul Barthes, dans cette description condensée du domaine du “Knowledge Management”, décrit en effet un point de vue légèrement différent de celui des technologies de l’information, que je n’hésite pas à reprendre à mon compte, en m’essayant à la comparaison des deux points de vue.
Le premier, décrit dans l’article de SemanticWeb.org pointé plus haut, est celui de la technologie de l’information, presque du programme informatique, dont on pourrait résumer les étapes comme suit :
- un programme reçoit un fichier (de la data, suite de 0 et de 1)
- une syntaxe (XML) permet au programme de parser le fichier
- une sémantique (Dublin Core) lui permet de trouver l’information de date de modification du fichier (à ce stade, le programme est passé de la data à l’information)
- Puisque le but du programme est de rechercher les documents ayant la date de modification la plus récente, une comparaison est faite entre les documents A et B, pour trouver que B a une date de modification plus récente que A.
- Le programme en déduit donc que B a un contenu plus récent que A (à ce stade, le programme est passé de l’information à la connaissance).
C’est dans cette dernière étape que réside d’après moi la faiblesse de cette description. En effet, dire que B a un contenu plus récent que A n’est pas une connaissance, c’est toujours une information, certe contextualisée entre 2 entités, mais qui reste au stade de l’information. Ce qui a été réalisé ici est une inférence, une déduction, la création d’une nouvelle information. On confond ici connaissance et inférence.
L’autre point de vue, celui de Barthes, est plus généraliste. Je reprend ici son exemple :
- Je pars à la cueillette des champignons en forêt. Je ramène un plein panier de champignons (de la data)
- De retour à la maison, je consulte des livres sur les champignons dans le but d’identifier les champignons que j’ai ramenés (et de savoir s’ils sont comestibles ou pas !). J’y trouve 3 descriptions de champignon toutes très similaires à ceux de mon panier. J’ai donc traité et contextualisé la donnée (je sais qu’il y a 3 descriptions candidates possibles, que les autres descriptions ne correspondent pas, que sur les 3 descriptions possibles 1 seule est comestible, etc…). A ce stade, la donnée contextualisée est devenue une information.
- Cependant, l’information en ma possession ne me permet pas encore de savoir si mes champignons sont comestibles ou pas, puisque sur les 3 descriptions trouvées, 1 seule est dite comestible (les autres causant d’horribles maux de ventre…). Pour déterminer cela, je me rend chez mon pharmacien, qui saura me dire (en fonction de ses connaissances) si mes champignons sont comestibles. Au fil des années, en continuant à ramasser des champignons régulièrement, j’intégrerai moi aussi cette connaissance, en faisant passer des informations dans mon système de valeurs (mon histoire, mes jugements, mon environnement, mes buts, mes peurs, etc…), passant ainsi de l’information à la connaissance.
De la donnée contextualisée donne de l’information, et de l’information intégrée par une personne dans son système de valeurs devient de la connaissance. En conséquence de quoi :
- ce qui s’échange entre 2 personnes (ou 2 systèmes) est toujours de l’information
- la connaissance reste toujours propre à une personne
Dans cette stricte perspective, parler de “systèmes de gestion de connaissances” ou de “bases de connaissances” est donc abusif (à moins de savoir transférer dans une machine un système de valeurs et de jugements…). Tout au plus peut-on parler d’information fortement structurée, fortement contextualisée, et présentée de manière sensible à l’utilisateur du système de façon à ce qu’il se l’approprie facilement et qu’il en fasse sa propre connaissance.
Cette définition – je trouve – a le mérite de recadrer le concept de connaissance (légèrement galvaudé dans le domaine des technologies de l’information). Notez par exemple que, dans le cas du programme informatique plus haut, une personne regardant le contenu du document B pourrait savoir (par une foule d’indices étonnement complexes) qu’il n’est pas plus récent que le document A, même si sa date de modification dit le contraire; ou encore, elle pourrait très bien faire le choix de préférer un document plus vieux, là aussi pour une foules de raisons compliquées. Ca, c’est de la connaissance.
A bien y regarder, les deux définitions ne sont pas si éloignées l’une de l’autre (on pourrait dire que le livre sur les champignons fait office à la fois de syntaxe et de sémantique par rapport au panier de champignons); simplement, elle ne s’entendent pas sur ce que veux dire “connaissance”; pour l’une, c’est une requête informatique, pour l’autre, c’est indissociable de la personne humaine.
Publié par Thomas Francart