Sur l’alignement et la mise en correspondance de terminologies

juin 29, 2009

Jean Delahousse

Introduction

Dans notre pratique quotidienne de mise en œuvre de solutions sémantiques, nous rencontrons de plus en plus régulièrement des besoins de mise en correspondances de référentiels. Cet article a pour objectif de dégager, à partir d’expériences concrètes une typologie des types d’alignement, des besoins métiers et des méthodes de mise en œuvre.

Lire le reste de cette entrée »


How-to install a Sesame RDF server

avril 5, 2008

[An english translation of the previous french article]

Every profession has its own tools. For the emerging professions of the semantic web, RDF repositories will become the foundations of the semantic pyramid, a tool that every « semantic worker » will use; maybe one day, when referring to these « semantic workers », we will speak about « semantic manager », or « semantic architects »… Anyway these RDF repositories are talking about promising performances for growing amounts of data : they are reaching one billion of triples, and that is the focus of the next « semantic web challenge » (see also here and there). This remains however ridiculously small compared to relationnal databases, that can store terabytes of data; especially when you consider that, in order to garantee optimal performances on complex queries and inference, RDF databases are generally all loaded into memory…

But not everyone needs a billion-triple-large RDF database, and you can start working with such a tool by installing the Sesame RDF server. Lire le reste de cette entrée »


[Press Release] Mondeca Announce ITM T3

janvier 24, 2008

Multi-lingual Taxonomy, Terminology and Thesaurus Server Eases Integration of Reference Vocabularies in Enterprise Information Systems

T3 BOX cropped

Mondeca S.A., a leader in applying semantic technology to help organizations gain maximum return from their accumulated knowledge and content, today announced the forthcoming release of ITM T3, a collaborative server based environment for the creation, maintenance and sharing of multi-lingual taxonomies, terminologies and thesauri.

ITM T3 is based on Mondeca’s Intelligent Topic Manager semantic software platform, already in use by large organizations including Thomson, LexisNexis, Lafarge and Wolters Kluwer. ITM T3 will allow enterprises and organizations to manage reference vocabularies and make them interoperable with other information system applications such as search engine, text mining, translation and classification tools. Reference taxonomies and vocabularies may also be published in standard formats including XML, RDF, SKOS and Topic Maps.

“Organizations recognize the importance of reference taxonomies and thesauri to the provision of efficient content access and metadata management”, says Jean Delahousse, CEO of Mondeca. “Using ITM T3 enterprises can quickly and easily create internal reference taxonomies and map them to external partner or standard taxonomies to facilitate information sharing across corporate boundaries”.

Read the full press release at http://www.mondeca.com/index.php/en/news/mondeca_announce_itm_t3


Un moteur de transformation RDF basé sur SPARQL (2)

janvier 19, 2008

[la suite du billet précédent sur le manque d’outil pour effectuer des transformations sur un graphe RDF, et la pertinence de cette opération pour l’échange de données.]

Pourquoi faire ?

La problématique est la suivante : je veux échanger des données exprimées en RDF, d’un système de départ à un système d’arrivée; les ontologies de départ et d’arrivée sont différentes, je dois donc transformer les données de départ pour construire un graphe conforme à l’ontologie d’arrivée. Il sera possible que seule une partie m’intéresse, et que toute l’information ne soit pas transformée.

Chaque opération de transformation est exprimée sous la forme d’une requête CONSTRUCT en SPARQL (1), qui permet de construire un pattern dans le graphe d’arrivée en fonction d’un pattern dans le graphe de départ; la requête s’exécute sur le graphe de départ, et ses résultats sont insérés dans le graphe d’arrivée.

Il suffit donc de décrire les requêtes SPARQL à exécuter à chaque opération. A l’usage, un peu de « sucre syntaxique » ne sera pas complètement inutile; certaines opérations de transformations vont en effet souvent revenir, et des raccourcis pour les écrire seront les bienvenus :

  • recopier tous les statements RDF qui ont un prédicat donné (typiquement recopier tous les rdfs:label);
  • recopier tous les statements rdf:type qui ont une certaines valeur, éventuellement en changeant cette valeur si elle n’est pas dans mon ontologie d’arrivée;
  • etc;

Et maintenant… un exemple. Lire le reste de cette entrée »


How-to install a Sesame RDF server – Comment installer un serveur RDF Sesame

décembre 19, 2007

Il n’y a pas d’artisans sans outils. Dans les nouvelles professions du web sémantique, les repository RDF vont s’imposer comme des fondations incontournables, comme les outils de base des artisans de la pyramide sémantique; peut-être un jour, à propos de ces artisans, parlera-t-on de « semantic manager », ou de « semantic architect »… Bref, ces bases RDF commencent à annoncer de bonnes performances pour des volumes conséquents, on parle en ce moment du milliard de triplets, c’est d’ailleurs le sujet du prochain « semantic web challenge » (voir aussi ici). Cela reste toutefois bien en deçà des bases relationnelles classiques, où les volumes de données peuvent se compter en tera-octets, d’autant que, pour garantir des performances optimales sur des requêtes complexes et de l’inférence, les bases RDF sont en général entièrement montées en mémoire…

Mais tout le monde n’a pas besoin d’un bulldozer qui gère un milliard de triplets RDF, et pour commencer à se faire la main sur ces outils, je vous propose de vous équiper d’un simple marteau et d’un tournevis, en installant le serveur RDF Sesame. Lire le reste de cette entrée »


L’extension des capacités des moteurs de recherche par l’utilisation de terminologies métier ou comment rendre les moteurs de recherche plus efficaces ?

octobre 6, 2007

Les moteurs de recherche comme outils d’accès à l’information dans les intranets et portails web des entreprises et administrations sont tout à la fois un sujet d’émerveillement et de frustration. Contrairement aux moteurs de recherche généralistes du web, où l’on accepte d’assez bon coeur que face au miracle de disposer en ligne d’autant d’information, un travail d’exploration et de tri soit nécessaire, l’attitude face au moteur de recherche du Ministère des Finances, de la base d’assistance de Microsoft, de SFR, d’Orange ou du moteur de recherche d’un spécialiste du bricolage est tout autre. Le domaine de recherche est fermé, l’information est limitée et nous nous attendons à un service de qualité de la part d’un fournisseur, d’un commerçant ou d’une administration. Bref nous ressortons en général frustré, incapable d’être certain d’avoir localisé toute l’information utile et en général déçu par le peu de soin apporté par l’éditeur à nous apporter une aide au delà d’avoir installé un moteur de recherche sur son site.

Lire le reste de cette entrée »