How-to install a Sesame RDF server

avril 5, 2008

[An english translation of the previous french article]

Every profession has its own tools. For the emerging professions of the semantic web, RDF repositories will become the foundations of the semantic pyramid, a tool that every “semantic worker” will use; maybe one day, when referring to these “semantic workers”, we will speak about “semantic manager”, or “semantic architects”… Anyway these RDF repositories are talking about promising performances for growing amounts of data : they are reaching one billion of triples, and that is the focus of the next “semantic web challenge” (see also here and there). This remains however ridiculously small compared to relationnal databases, that can store terabytes of data; especially when you consider that, in order to garantee optimal performances on complex queries and inference, RDF databases are generally all loaded into memory…

But not everyone needs a billion-triple-large RDF database, and you can start working with such a tool by installing the Sesame RDF server. Lisez la suite de cette entrée »


Carto 2.0 : Mondeca sera présent !

mars 21, 2008

“Où en êtes-vous de la mise en scène de vos informations ?”

Face à la quantité d’information sans cesse croissante que les organisations sont contraintes de gérer, leur mise en scène au travers de représentations graphiques permet de mieux les appréhender et les valoriser. Intelligence économique, gestion des connaissances, apprentissage, réseaux sociaux, aide à la décision sont autant de domaines où la cartographie de l’information est de plus en plus populaire car elle permet en amont d’organiser et d’appréhender des données, puis en aval d’évaluer et de communiquer les résultats obtenus. Cette journée sera donc l’occasion de mettre en valeur le rôle majeur que peux jouer la cartographie dans nos sociétés dîtes de l’information.


Jean Delahousse, fondateur de la société Mondeca, interviendra sur le thème : « Cartographie et Ontologie : Généricité, réutilisabilité et spécificité »

Il présentera comment il est possible dans le contexte des technologies du Web Sémantique et des ontologies, de disposer de composants de représentation cartographique des connaissances réutilisables dans des contextes métiers très diverses. Lisez la suite de cette entrée »


Mondeca et les ontologies sur videolectures.net

février 22, 2008

2 vidéos de présentations réalisées par Jean Delahousse ont été enregistrées sur videolectures.net .

  1. La première a été enregistrée à l’ESWC06 (3rd Annual European Semantic Web Conference), et a pour thème l’utilisation des ontologies dans le domaine de l’édition juridique :


    Use of Ontology for production of access systems on Legislation Jurisprudence and Comments
  2. Et la seconde lors de la réunion du projet européen TAO (Transitionning Applications to Ontologies) auquel Mondeca participe, et qui a pour thème l’utilisation des ontologies dans le domaine du tourisme, et les enjeux de la transition vers des systèmes à base d’ontologies :


    WP8: Exploitation and Dissemination

[Press Release] Mondeca Announce ITM T3

janvier 24, 2008

Multi-lingual Taxonomy, Terminology and Thesaurus Server Eases Integration of Reference Vocabularies in Enterprise Information Systems

T3 BOX cropped

Mondeca S.A., a leader in applying semantic technology to help organizations gain maximum return from their accumulated knowledge and content, today announced the forthcoming release of ITM T3, a collaborative server based environment for the creation, maintenance and sharing of multi-lingual taxonomies, terminologies and thesauri.

ITM T3 is based on Mondeca’s Intelligent Topic Manager semantic software platform, already in use by large organizations including Thomson, LexisNexis, Lafarge and Wolters Kluwer. ITM T3 will allow enterprises and organizations to manage reference vocabularies and make them interoperable with other information system applications such as search engine, text mining, translation and classification tools. Reference taxonomies and vocabularies may also be published in standard formats including XML, RDF, SKOS and Topic Maps.

“Organizations recognize the importance of reference taxonomies and thesauri to the provision of efficient content access and metadata management”, says Jean Delahousse, CEO of Mondeca. “Using ITM T3 enterprises can quickly and easily create internal reference taxonomies and map them to external partner or standard taxonomies to facilitate information sharing across corporate boundaries”.

Read the full press release at http://www.mondeca.com/index.php/en/news/mondeca_announce_itm_t3


Un moteur de transformation RDF basé sur SPARQL (2)

janvier 19, 2008

[la suite du billet précédent sur le manque d'outil pour effectuer des transformations sur un graphe RDF, et la pertinence de cette opération pour l'échange de données.]

Pourquoi faire ?

La problématique est la suivante : je veux échanger des données exprimées en RDF, d’un système de départ à un système d’arrivée; les ontologies de départ et d’arrivée sont différentes, je dois donc transformer les données de départ pour construire un graphe conforme à l’ontologie d’arrivée. Il sera possible que seule une partie m’intéresse, et que toute l’information ne soit pas transformée.

Chaque opération de transformation est exprimée sous la forme d’une requête CONSTRUCT en SPARQL (1), qui permet de construire un pattern dans le graphe d’arrivée en fonction d’un pattern dans le graphe de départ; la requête s’exécute sur le graphe de départ, et ses résultats sont insérés dans le graphe d’arrivée.

Il suffit donc de décrire les requêtes SPARQL à exécuter à chaque opération. A l’usage, un peu de “sucre syntaxique” ne sera pas complètement inutile; certaines opérations de transformations vont en effet souvent revenir, et des raccourcis pour les écrire seront les bienvenus :

  • recopier tous les statements RDF qui ont un prédicat donné (typiquement recopier tous les rdfs:label);
  • recopier tous les statements rdf:type qui ont une certaines valeur, éventuellement en changeant cette valeur si elle n’est pas dans mon ontologie d’arrivée;
  • etc;

Et maintenant… un exemple. Lisez la suite de cette entrée »


How-to install a Sesame RDF server - Comment installer un serveur RDF Sesame

décembre 19, 2007

Il n’y a pas d’artisans sans outils. Dans les nouvelles professions du web sémantique, les repository RDF vont s’imposer comme des fondations incontournables, comme les outils de base des artisans de la pyramide sémantique; peut-être un jour, à propos de ces artisans, parlera-t-on de “semantic manager”, ou de “semantic architect”… Bref, ces bases RDF commencent à annoncer de bonnes performances pour des volumes conséquents, on parle en ce moment du milliard de triplets, c’est d’ailleurs le sujet du prochain “semantic web challenge” (voir aussi ici). Cela reste toutefois bien en deçà des bases relationnelles classiques, où les volumes de données peuvent se compter en tera-octets, d’autant que, pour garantir des performances optimales sur des requêtes complexes et de l’inférence, les bases RDF sont en général entièrement montées en mémoire…

Mais tout le monde n’a pas besoin d’un bulldozer qui gère un milliard de triplets RDF, et pour commencer à se faire la main sur ces outils, je vous propose de vous équiper d’un simple marteau et d’un tournevis, en installant le serveur RDF Sesame. Lisez la suite de cette entrée »


Requêter le contenu de Wikipedia avec SPARQL

décembre 6, 2007

Pour prolonger le débat récent entre Thomas et Bruno sur RDF et XML, un petit exemple illustrant le fait que SPARQL permet de requêter un graphe RDF, même très grand, sans connaître a priori ni sa structure, ni l’ontologie sous-jacente.

DBpedia, dont je vous ai déjà parlé, définit une URI à partir de chaque article du Wikipedia anglais, cette URI identifiant le sujet de l’article, la chose dont il parle. En fait l’article parle en général de beaucoup de choses, mais il a un sujet principal, par principe même de l’encyclopédie : “un article, une chose décrite”. Lisez la suite de cette entrée »