Données, Information, Connaissance… et champignons ?

Croyez-vous (crois-tu, Bernard ?) en la noosphère, cette conscience collective de l’humanité, dans laquelle les idées circulent librement d’un cerveau à l’autre, captées par nos inconscients, créant ainsi modes, courants intellectuels, et tendances ? Me croyez-vous si je dis que je préparais un article justement intitulé… « Data, Information… and Knowledge ? », expliquant les mêmes idées que celui-ci trouvé par Bernard dans un précédent post ?

Encore que, à bien y réfléchir, ce n’étaient pas exactement les mêmes idées, même si le découpage (somme toute classique) « Données / Information / Connaissance » était le même. L’un de mes anciens professeurs de l’UTC, Jean-Paul Barthes, dans cette description condensée du domaine du « Knowledge Management », décrit en effet un point de vue légèrement différent de celui des technologies de l’information, que je n’hésite pas à reprendre à mon compte, en m’essayant à la comparaison des deux points de vue.

Le premier, décrit dans l’article de SemanticWeb.org pointé plus haut, est celui de la technologie de l’information, presque du programme informatique, dont on pourrait résumer les étapes comme suit :

  • un programme reçoit un fichier (de la data, suite de 0 et de 1)
  • une syntaxe (XML) permet au programme de parser le fichier
  • une sémantique (Dublin Core) lui permet de trouver l’information de date de modification du fichier (à ce stade, le programme est passé de la data à l’information)
  • Puisque le but du programme est de rechercher les documents ayant la date de modification la plus récente, une comparaison est faite entre les documents A et B, pour trouver que B a une date de modification plus récente que A.
  • Le programme en déduit donc que B a un contenu plus récent que A (à ce stade, le programme est passé de l’information à la connaissance).

C’est dans cette dernière étape que réside d’après moi la faiblesse de cette description. En effet, dire que B a un contenu plus récent que A n’est pas une connaissance, c’est toujours une information, certe contextualisée entre 2 entités, mais qui reste au stade de l’information. Ce qui a été réalisé ici est une inférence, une déduction, la création d’une nouvelle information. On confond ici connaissance et inférence.

L’autre point de vue, celui de Barthes, est plus généraliste. Je reprend ici son exemple :

  • Je pars à la cueillette des champignons en forêt. Je ramène un plein panier de champignons (de la data)
  • De retour à la maison, je consulte des livres sur les champignons dans le but d’identifier les champignons que j’ai ramenés (et de savoir s’ils sont comestibles ou pas !). J’y trouve 3 descriptions de champignon toutes très similaires à ceux de mon panier. J’ai donc traité et contextualisé la donnée (je sais qu’il y a 3 descriptions candidates possibles, que les autres descriptions ne correspondent pas, que sur les 3 descriptions possibles 1 seule est comestible, etc…). A ce stade, la donnée contextualisée est devenue une information.
  • Cependant, l’information en ma possession ne me permet pas encore de savoir si mes champignons sont comestibles ou pas, puisque sur les 3 descriptions trouvées, 1 seule est dite comestible (les autres causant d’horribles maux de ventre…). Pour déterminer cela, je me rend chez mon pharmacien, qui saura me dire (en fonction de ses connaissances) si mes champignons sont comestibles. Au fil des années, en continuant à ramasser des champignons régulièrement, j’intégrerai moi aussi cette connaissance, en faisant passer des informations dans mon système de valeurs (mon histoire, mes jugements, mon environnement, mes buts, mes peurs, etc…), passant ainsi de l’information à la connaissance.

De la donnée contextualisée donne de l’information, et de l’information intégrée par une personne dans son système de valeurs devient de la connaissance. En conséquence de quoi :

  1. ce qui s’échange entre 2 personnes (ou 2 systèmes) est toujours de l’information
  2. la connaissance reste toujours propre à une personne

Dans cette stricte perspective, parler de « systèmes de gestion de connaissances » ou de « bases de connaissances » est donc abusif (à moins de savoir transférer dans une machine un système de valeurs et de jugements…). Tout au plus peut-on parler d’information fortement structurée, fortement contextualisée, et présentée de manière sensible à l’utilisateur du système de façon à ce qu’il se l’approprie facilement et qu’il en fasse sa propre connaissance.

Cette définition – je trouve – a le mérite de recadrer le concept de connaissance (légèrement galvaudé dans le domaine des technologies de l’information). Notez par exemple que, dans le cas du programme informatique plus haut, une personne regardant le contenu du document B pourrait savoir (par une foule d’indices étonnement complexes) qu’il n’est pas plus récent que le document A, même si sa date de modification dit le contraire; ou encore, elle pourrait très bien faire le choix de préférer un document plus vieux, là aussi pour une foules de raisons compliquées. Ca, c’est de la connaissance.

A bien y regarder, les deux définitions ne sont pas si éloignées l’une de l’autre (on pourrait dire que le livre sur les champignons fait office à la fois de syntaxe et de sémantique par rapport au panier de champignons); simplement, elle ne s’entendent pas sur ce que veux dire « connaissance »; pour l’une, c’est une requête informatique, pour l’autre, c’est indissociable de la personne humaine.

2 commentaires pour Données, Information, Connaissance… et champignons ?

  1. bernard dit :

    La noosphère a effectivement repris du poil de la bête sous l’appellation plus sexy de « cerveau global » http://fr.wikipedia.org/wiki/Cerveau_global. Dire que j’y crois … c’est toujours un bon sujet de conversation quand il y a un blanc entre la poire et le fromage.
    Par contre le fait que dès qu’on pense à quelque chose, on n’est pas le seul, renvoie à une notion fascinante, découverte dans ma jeunesse dans une revue underground de l’époque où tu étais encore dans les limbes, qui est celle de « champ morphogénétique ». Voir http://en.wikipedia.org/wiki/Morphogenetic_fields (pas de traduction française de cet article controversé). La notion sent encore un peu le soufre et a été utilisée à tort et à travers par toutes sortes de charlatans, comme une recherche rapide sur le sujet le montre. Mais elle continue à me fasciner. Comme disait un médecin de mes enfants à propos de l’homéopathie : « Je n’y crois pas, mais çà marche. »

  2. […] LexiMédia2007 : L’outil LexiMédia2007 permet de suivre l’actualité des élections présidentielles de 2007 semaine après semaine (réalisé par Didier Bourigault et Franck Sajous du laboratoire CLLE-ERSS, unité mixte du CNRS et de l’Université Toulouse-Le Mirail). LexiMédia2007 analyse en permanence les articles des journaux Le Monde, Libération et Le Figaro issus du flux Présidentielle 2007 de Jean Véronis . LexiMédia2007 donne l’évolution au fil des semaines de la fréquence d’utilisation de certains syntagmes, globalement et par journal. Pour chaque semaine, il donne les syntagmes les plus utilisés, les syntagmes en forte hausse, les syntagmes en forte baisse et ceux dont la variation (hausse et baisse confondues) est la plus importante. Pour chaque syntagme, on peut voir le détail de son évolution (courbe de fréquence sur l’ensemble des semaines) et les liens vers les articles dans lesquels il apparaît (détail de la démarche). Google Patent Search : With Google Patent Search, you can now search the full text of the U.S. patent corpus and find patents that interest you. XML versus Json : “All markup ends up looking like XML”. The Future Of Education : What is Project Based Learning? Classer, trier et taguer pour retrouver : les enjeux documentaires du Web (2.0). Comment lire les documents électroniques sur écrans d’ordinateur ? Une solution proposée par Yves Guiard, directeur de recherche au laboratoire « Mouvement et perception » de Marseille, qui développe un « prototype qui permet d’incliner les documents électroniques et donc de les voir en perspective. Et le plus important, c’est que l’on peut faire défiler les pages avec cette vue perspective…”. Accès au prototype. Deux lectures complémentaires et pertinentes pour finir : Indexation et compréhension (sur Les Petites Cases.net) et Données, Information, Connaissance… et champignons ?. […]

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :