Le toro bravo et le top model

avril 28, 2010

Le dernier billet de Pierre-Yves sur l’art de la modélisation se termine sur l’importance de la re-présentation. On peut mettre en parallèle un billet un peu plus ancien sur le multilinguisme et la traduction, en profiter pour prolonger des réflexions déjà publiées par ailleurs, mais en anglais.  Traduire pour re-présenter.

Dans le magnifique exemple du travail de Picasso sur le taureau, si on parle peinture, on ne nommera pas en général modèle le résultat du travail de réduction à l’essentiel opéré par l’artiste, mais au contraire la réalité dont le peintre s’inspire, le taureau qu’il a pris comme modèle. Ce taureau modèle il l’a d’ailleurs peut-être choisi parmi une collection de taureaux déjà représentés par lui ou par d’autres, et s’il l’a dessiné sur le vif  il n’a certainement pas choisi n’importe quel taureau, mais un toro bravo, un taureau modèle élevé avec amour pour une unique représentation aux arènes le soir… Et ce taureau modèle, avant d’être un vrai taureau en chair et en os, c’est un rêve dans l’esprit des éleveurs, des matadors et des aficionados, le taureau parfait dans le moindre détail jusque dans sa mort, que les arènes applaudiront debout. Et au final ce que capture le génie du peintre, ce n’est pas tel taureau en particulier, mais ce rêve inaccessible du taureau idéal, et ce dessin n’est qu’un épisode après d’autres d’une série de traductions-représentations dont l’origine finalement importe peu.

Et ce n’est pas la fin de l’histoire. Pour des générations suivantes d’étudiants en art, le dessin de Picasso sera aussi un modèle à un autre niveau, un modèle de dépouillement et de maîtrise du trait. Pour ces élèves, la corrida sera peut-être un monde lointain, inconnu ou inquiétant.  A partir du dessin de Picasso, ils traduiront, interpréteront et représenteront à leur tour encore une fois cette réalité intraduisible qu’est le toro bravo. Et pour paraphraser Barbara Cassin c’est justement parce qu’elle est tellement intraduisible qu’il ne faut jamais s’arrêter de la re-traduire, de la re-présenter, en inventant d’autres moyens de la rendre présente à travers nos différences de langage et de culture.

Un autre aspect de la représentation ou du modèle (c’est tout un, on l’a compris), et que la tauromachie illustre bien également, c’est qu’il ne s’agit pas simplement d’une description de la réalité, mais aussi en retour d’une prescription. Voilà comment le toro bravo se doit d’être, et ce caractère prescriptif du modèle est le moteur même du travail de l’éleveur qui va sélectionner, élever, dresser l’animal pour qu’il soit au mieux conforme à ce modèle, et du torero qui doit lui aussi le conduire comme il faut, dans les règles, jusqu’à sa mort.

Dans tout travail de modélisation, il y a ce double aspect descriptif et prescriptif. Le linguiste constate les usages de la langue, les formalise dans une grammaire, et puis les faits de langue sont pris en charge par les grammairiens et les programmes scolaires et deviennent des règles,  normatives et contraignantes.  Et les exemples abondent, jusqu’au top model qui comme le toro bravo est la re-présentation stéréotypée d’un rêve devenu prescriptif.

Très souvent la frontière entre les aspects descriptifs et prescriptifs du  modèle est bien difficile à tracer, dans nos systèmes informatiques également. La forme de l’identité déclarée sur les réseaux sociaux l’illustre assez bien.  L’interface et le modèle de données sous-jacent contraignent de façon insidieuse l’utilisateur. Un champ non rempli  est comme un reproche. Votre profil n’est complet qu’à 60%. Vous pourriez avoir plus d’amis. Vous devriez ajouter des recommandations, vous n’avez pas ajouté votre numéro de téléphone portable, ni votre blog, ni votre compte Twitter.  Là encore, l’utilisateur incomplet, un peu coupable, se rapprochera peu à peu du modèle que le système lui présente.

Comme l’écrit Pierre Levy dans « Vers une science de l’intelligence collective »

… il n’y a pas de modèle qui ne co-produise la réalité qu’il modélise. La carte fait surgir un territoire là où il n’y avait que des expériences de mouvements et des mémoires de trajets … le code de lois transforme les moeurs d’une nation. Les dictionnaires et les grammaires influencent les apprentissages scolaires et les pratiques lettrées des langues … Le modèle est un facteur de l’agencement symbolique qu’il explicite.


La modélisation, un art?

avril 27, 2010

Comme le constatait déjà Paul Valéry, le fonctionnement de la pensée humaine s’appuie largement sur des modélisations du monde qui nous entoure : « Nous ne raisonnons que sur des modèles ». En informatique et plus spécifiquement en ingénierie de la connaissance, nous parlons souvent de modélisation comme la base de la construction d’un système d’information. Derrière cette notion de modèle, on pense souvent à un dessin d’un schéma assez simple sur une feuille de papier qui explique un fonctionnement de la réalité. On trouve dans cette description hâtive les caractéristiques d’abstraction et de simplification inhérentes à un modèle, mais elles ne sont pas suffisantes pour définir la modélisation.

La modélisation permet de représenter un phénomène complexe qu’il n’est pas possible d’observer directement. L’OMG donne la définition suivante : “A model represents some concrete or abstract thing of interest, with a specific purpose in mind.”. Cette définition met en avant la notion capitale d’intention d’une modélisation. Une modélisation est toujours faite avec un objectif précis (s’il n’est pas clairement défini, le modèle sera mal utilisé) qui va guider certains choix quant au modèle produit (granularité de la représentation, langage de description choisi, etc.). Ces choix auront un impact sur le périmètre de validité du modèle. Par exemple, si nous représentons l’eau comme un liquide, alors notre modèle n’aura de validité que dans les conditions de pression et de température où l’eau est en phase liquide. Le choix d’un langage de description va être contraint par les objectifs du modèle : est-ce un modèle destiné à la communication, au traitement informatique ?

Rothenberg insiste dans sa definition sur l’efficacité et la simplification d’un modèle vis-à-vis de la réalité qu’il se propose de représenter: “Modeling, in the broadest sense, is the cost-effective use of something in place of  something else  for some cognitive purpose.  It allows us to use something that is simpler, safer or cheaper than reality instead of reality for some purpose. A model represents reality for the given purpose; the model is an abstraction of reality in the sense that it cannot represent all aspects of reality. This allows us to deal with the world in a simplified manner, avoiding the complexity, danger and irreversibility of reality.”. Le degré de simplification choisi va directement impacter la granularité du modèle produit. La difficulté est de simplifier au maximum la représentation d’une partie du réel pour faciliter sa compréhension et son utilisation tout en gardant un niveau de détail suffisant afin d’être efficace pour l’objectif qu’il lui est donné. Ce même travail de simplification est illustré dans les 11 états de la lithographie « Le Taureau » par Pablo Picasso dans lesquels il cherche le juste niveau de simplification correspondant à sa vision.

Pablo Picasso, Les 11 états successifs de la lithographie Le Taureau , 1945.

La modélisation, comme toutes les activités humaines, est fondée sur des choix. Malgré la volonté d’objectivité, un modèle reste néanmoins subjectif. Il est important de veiller à son aspect consensuel dans la communauté de pratiques partageant les mêmes intentions comme nous le fait comprendre la parabole des aveugles et de l’éléphant. Ceci peut être atteint en impliquant un groupe d’experts représentatif de cette communauté. Cette subjectivité est un des écueils majeurs pour de futures utilisations ou réutilisations. Un objet du monde réel peut être modélisé au travers d’une infinité de points de vues comme le montre l’illustration de Grady Booch.

Illustration de Grady Booch, 2000

Pour réussir une bonne modélisation, il faut veiller à définir clairement :

  • le phénomène représenté ;
  • l’intention du modèle;
  • le périmètre de validité ;
  • le niveau de simplification et de granularité adéquats;
  • le langage de description ;
  • les choix pris au cours de la modélisation.

Nous insisterons dans ce paragraphe sur le danger que représente la réutilisation de modèles. En effet, il est très séduisant de réutiliser un modèle existant pour économiser du temps et pour s’appuyer sur une modélisation qui a déjà été éprouvée. Mais avant de réutiliser un modèle existant il faut se poser les questions suivantes : est-ce le même phénomène que je veux représenter ? Ai-je les mêmes intentions ? Est-ce que j’adhère aux principes adoptés lors de la modélisation ?  Il existe des représentations consensuelles qui sont reconnues comme efficaces dans  un but donné. C’est ce que l’on appelle les patrons de modélisation « design pattern ».

Comme nous venons de le voir, il est  imprudent de penser qu’à un phénomène réel corresponde une unique représentation. Un modèle (à la manière d’une œuvre d’art) ne décrira jamais de manière complète l’objet étudié, dès lors, c’est par la multiplicité des représentations (diversité des œuvres et des sensibilités des artistes) pour des intentions différentes qu’un objet sera le mieux décrit. Chaque modèle présente de manière différente, parfois conciliable et complémentaire, un fait réel. C’est le sens même d’une re-présentation.


Genèse des Systèmes d’Organisation de la Connaissance

avril 22, 2010

Depuis le début des peintures rupestres jusqu’à aujourd’hui, la transmission de connaissances n’a eu de cesse de s’organiser afin d’améliorer l’accès à l’information véhiculée. Dès la préhistoire, les peintures dans les grottes s’organisaient selon l’histoire qu’elles racontaient, puis se sont réparties en trois zones spatiales (l’entrée, la zone de passage et le fond) de la grotte, aux environs de 12000 avant notre ère.

Les premières apparitions de structurations après l’invention de l’écriture picto-idéographique en -4000 étaient des tableaux à buts administratifs, suivi en -800 des premiers catalogues avec un classement thématique. C’est au premier siècle avant notre ère qu’apparait la première encyclopédie « Antiquitates rerum humanarum et divinarum » de Varron présentant un classement systématique qui décrit, en 41 livres, l’histoire de l’Italie et de ses habitants. La première classification bibliothécaire apparaît au XVIe siècle avec une proposition de classification Universelle des œuvres passées et présentes.

Il faut attendre le début du XVIIe siècle à Londres pour voir apparaître une terminologie, dans le domaine médical. Celle-ci sert à recenser, de manière hebdomadaire, les cas de mort selon leurs causes au moyen de 44 termes comme « Peste, étouffé, subitement ou arrêt de l’estomac ». Les premières apparitions de collections de mots structurés selon leurs sens datent du XIXe siècle et sont nommées « thésaurus » par Rodget dans le « Thesaurus of English Words and Phrases ».

La dernière révolution majeure se passe dans les années 1960 avec l’apparition de l’informatique. Les recherches portent alors sur les techniques automatiques de recherche d’information linguistique (centrée sur le terme) mais également sémantique (centrée sur le concept) . L’utilisation des thésaurus devient alors une évidence. Ces réflexions sont même à l’origine des liens hypertexte qui permettent de relier des notions ayant un sens proche ou connexe. Suite à l’utilisation de l’outil informatique, le monde de la documentation se divise en deux pratiques (i) celle des bibliothèques qui utilisent les classifications et les listes de mots-vedettes et (ii) les centres de documentation qui développent des thésaurus permettant d’indexer automatiquement des documents.

L’intention de ces nouvelles organisations qui capturent de la sémantique, est de se rapprocher du fonctionnement non linéaire des idées dans la pensée humaine. Cette possibilité nourrit l’ambition de construire une unique ontologie décrivant formellement les concepts régissant le monde par analogie à l’Ontologie en philosophie ( étude des propriétés générales de tout ce qui est). La validité d’une telle ontologie est toutefois vite remise en question. Comme tout fruit de modélisation, cette ontologie est limitée par les outils de modélisation (expressivité du langage de représentation), les connaissances implicites (émotions, connaissances communes inconscientes, éducation, langue, etc.) qui participent néanmoins à la description du monde. Dans les années 1990, l’utilisation des ontologies en informatique se veut pragmatique et accepte la définition communément admise de Tom Gruber limitant sa validité à un domaine spécifique et dans un but donné.

Les thésaurus et ontologies capturent tous deux de la sémantique, mais leur engagement formel est différent : alors que les thésaurus reposent sur quelques notions formelles telle que la subsomption, les ontologies utilisent l’expressivité d’un langage formel mathématique. Cette différence influe directement sur l’utilisation que l’on aura de ces référentiels.

L’informatique a énormément changé la conception, la maintenance et l’utilisation des systèmes d’organisation de la connaissance. Leur nombre et leur volume ont considérablement augmenté ces dernières décennies. Cet outil permet de réaliser des manipulations automatiques complexes qui produisent des résultats jusqu’alors impensables comme la déduction automatique de nouvelles connaissances. Il reste toutefois de grands progrès à effectuer pour approcher le fonctionnement de l’information dans la pensée humaine.

Longue vie aux référentiels !

Références:

Chronologie des supports, des dispositifs spatiaux, des outils de repérage de l’information : http://biblio-fr.info.unicaen.fr/bnum/jelec/Solaris/d04/4fayet_1tab.html

Gruber, T.R., Towards Principles for the Design of Ontologies Used for Knowledge Sharing in Formal Ontology in Conceptual Analysis and Knowledge Representation, Kluwer Academic Publishers, 1993

Charlet, J., L’Ingénierie des connaissances : développements, résultats et perspectives pour la gestion des connaissances médicales, Université Paris 6, 2002