Genèse des Systèmes d’Organisation de la Connaissance

avril 22, 2010

Depuis le début des peintures rupestres jusqu’à aujourd’hui, la transmission de connaissances n’a eu de cesse de s’organiser afin d’améliorer l’accès à l’information véhiculée. Dès la préhistoire, les peintures dans les grottes s’organisaient selon l’histoire qu’elles racontaient, puis se sont réparties en trois zones spatiales (l’entrée, la zone de passage et le fond) de la grotte, aux environs de 12000 avant notre ère.

Les premières apparitions de structurations après l’invention de l’écriture picto-idéographique en -4000 étaient des tableaux à buts administratifs, suivi en -800 des premiers catalogues avec un classement thématique. C’est au premier siècle avant notre ère qu’apparait la première encyclopédie « Antiquitates rerum humanarum et divinarum » de Varron présentant un classement systématique qui décrit, en 41 livres, l’histoire de l’Italie et de ses habitants. La première classification bibliothécaire apparaît au XVIe siècle avec une proposition de classification Universelle des œuvres passées et présentes.

Il faut attendre le début du XVIIe siècle à Londres pour voir apparaître une terminologie, dans le domaine médical. Celle-ci sert à recenser, de manière hebdomadaire, les cas de mort selon leurs causes au moyen de 44 termes comme « Peste, étouffé, subitement ou arrêt de l’estomac ». Les premières apparitions de collections de mots structurés selon leurs sens datent du XIXe siècle et sont nommées « thésaurus » par Rodget dans le « Thesaurus of English Words and Phrases ».

La dernière révolution majeure se passe dans les années 1960 avec l’apparition de l’informatique. Les recherches portent alors sur les techniques automatiques de recherche d’information linguistique (centrée sur le terme) mais également sémantique (centrée sur le concept) . L’utilisation des thésaurus devient alors une évidence. Ces réflexions sont même à l’origine des liens hypertexte qui permettent de relier des notions ayant un sens proche ou connexe. Suite à l’utilisation de l’outil informatique, le monde de la documentation se divise en deux pratiques (i) celle des bibliothèques qui utilisent les classifications et les listes de mots-vedettes et (ii) les centres de documentation qui développent des thésaurus permettant d’indexer automatiquement des documents.

L’intention de ces nouvelles organisations qui capturent de la sémantique, est de se rapprocher du fonctionnement non linéaire des idées dans la pensée humaine. Cette possibilité nourrit l’ambition de construire une unique ontologie décrivant formellement les concepts régissant le monde par analogie à l’Ontologie en philosophie ( étude des propriétés générales de tout ce qui est). La validité d’une telle ontologie est toutefois vite remise en question. Comme tout fruit de modélisation, cette ontologie est limitée par les outils de modélisation (expressivité du langage de représentation), les connaissances implicites (émotions, connaissances communes inconscientes, éducation, langue, etc.) qui participent néanmoins à la description du monde. Dans les années 1990, l’utilisation des ontologies en informatique se veut pragmatique et accepte la définition communément admise de Tom Gruber limitant sa validité à un domaine spécifique et dans un but donné.

Les thésaurus et ontologies capturent tous deux de la sémantique, mais leur engagement formel est différent : alors que les thésaurus reposent sur quelques notions formelles telle que la subsomption, les ontologies utilisent l’expressivité d’un langage formel mathématique. Cette différence influe directement sur l’utilisation que l’on aura de ces référentiels.

L’informatique a énormément changé la conception, la maintenance et l’utilisation des systèmes d’organisation de la connaissance. Leur nombre et leur volume ont considérablement augmenté ces dernières décennies. Cet outil permet de réaliser des manipulations automatiques complexes qui produisent des résultats jusqu’alors impensables comme la déduction automatique de nouvelles connaissances. Il reste toutefois de grands progrès à effectuer pour approcher le fonctionnement de l’information dans la pensée humaine.

Longue vie aux référentiels !

Références:

Chronologie des supports, des dispositifs spatiaux, des outils de repérage de l’information : http://biblio-fr.info.unicaen.fr/bnum/jelec/Solaris/d04/4fayet_1tab.html

Gruber, T.R., Towards Principles for the Design of Ontologies Used for Knowledge Sharing in Formal Ontology in Conceptual Analysis and Knowledge Representation, Kluwer Academic Publishers, 1993

Charlet, J., L’Ingénierie des connaissances : développements, résultats et perspectives pour la gestion des connaissances médicales, Université Paris 6, 2002


Sur l’alignement et la mise en correspondance de terminologies

juin 29, 2009

Jean Delahousse

Introduction

Dans notre pratique quotidienne de mise en œuvre de solutions sémantiques, nous rencontrons de plus en plus régulièrement des besoins de mise en correspondances de référentiels. Cet article a pour objectif de dégager, à partir d’expériences concrètes une typologie des types d’alignement, des besoins métiers et des méthodes de mise en œuvre.

Lire la suite »


[Press Release] Mondeca Announce ITM T3

janvier 24, 2008

Multi-lingual Taxonomy, Terminology and Thesaurus Server Eases Integration of Reference Vocabularies in Enterprise Information Systems

T3 BOX cropped

Mondeca S.A., a leader in applying semantic technology to help organizations gain maximum return from their accumulated knowledge and content, today announced the forthcoming release of ITM T3, a collaborative server based environment for the creation, maintenance and sharing of multi-lingual taxonomies, terminologies and thesauri.

ITM T3 is based on Mondeca’s Intelligent Topic Manager semantic software platform, already in use by large organizations including Thomson, LexisNexis, Lafarge and Wolters Kluwer. ITM T3 will allow enterprises and organizations to manage reference vocabularies and make them interoperable with other information system applications such as search engine, text mining, translation and classification tools. Reference taxonomies and vocabularies may also be published in standard formats including XML, RDF, SKOS and Topic Maps.

“Organizations recognize the importance of reference taxonomies and thesauri to the provision of efficient content access and metadata management”, says Jean Delahousse, CEO of Mondeca. “Using ITM T3 enterprises can quickly and easily create internal reference taxonomies and map them to external partner or standard taxonomies to facilitate information sharing across corporate boundaries”.

Read the full press release at http://www.mondeca.com/index.php/en/news/mondeca_announce_itm_t3


Un moteur de transformation RDF basé sur SPARQL (2)

janvier 19, 2008

[la suite du billet précédent sur le manque d'outil pour effectuer des transformations sur un graphe RDF, et la pertinence de cette opération pour l'échange de données.]

Pourquoi faire ?

La problématique est la suivante : je veux échanger des données exprimées en RDF, d’un système de départ à un système d’arrivée; les ontologies de départ et d’arrivée sont différentes, je dois donc transformer les données de départ pour construire un graphe conforme à l’ontologie d’arrivée. Il sera possible que seule une partie m’intéresse, et que toute l’information ne soit pas transformée.

Chaque opération de transformation est exprimée sous la forme d’une requête CONSTRUCT en SPARQL (1), qui permet de construire un pattern dans le graphe d’arrivée en fonction d’un pattern dans le graphe de départ; la requête s’exécute sur le graphe de départ, et ses résultats sont insérés dans le graphe d’arrivée.

Il suffit donc de décrire les requêtes SPARQL à exécuter à chaque opération. A l’usage, un peu de « sucre syntaxique » ne sera pas complètement inutile; certaines opérations de transformations vont en effet souvent revenir, et des raccourcis pour les écrire seront les bienvenus :

  • recopier tous les statements RDF qui ont un prédicat donné (typiquement recopier tous les rdfs:label);
  • recopier tous les statements rdf:type qui ont une certaines valeur, éventuellement en changeant cette valeur si elle n’est pas dans mon ontologie d’arrivée;
  • etc;

Et maintenant… un exemple. Lire la suite »


L’extension des capacités des moteurs de recherche par l’utilisation de terminologies métier ou comment rendre les moteurs de recherche plus efficaces ?

octobre 6, 2007

Les moteurs de recherche comme outils d’accès à l’information dans les intranets et portails web des entreprises et administrations sont tout à la fois un sujet d’émerveillement et de frustration. Contrairement aux moteurs de recherche généralistes du web, où l’on accepte d’assez bon coeur que face au miracle de disposer en ligne d’autant d’information, un travail d’exploration et de tri soit nécessaire, l’attitude face au moteur de recherche du Ministère des Finances, de la base d’assistance de Microsoft, de SFR, d’Orange ou du moteur de recherche d’un spécialiste du bricolage est tout autre. Le domaine de recherche est fermé, l’information est limitée et nous nous attendons à un service de qualité de la part d’un fournisseur, d’un commerçant ou d’une administration. Bref nous ressortons en général frustré, incapable d’être certain d’avoir localisé toute l’information utile et en général déçu par le peu de soin apporté par l’éditeur à nous apporter une aide au delà d’avoir installé un moteur de recherche sur son site.

Lire la suite »


Suivre

Recevez les nouvelles publications par mail.