OpenLibrary API RDF wrapper on Google App Engine

janvier 5, 2009

I have written a wrapper to expose openlibrary.org api data as RDF. It is written in Python and deployed on Google App Engine. It is only an illustration of Linked Data publication, and in order to get a first feedback, so do not rely on it in your application since the URL or the content will change in the future.

How to use it :

Lire le reste de cette entrée »


Comment installer OWLIM dans Sesame – et jouer avec

octobre 29, 2008

Une des choses frustrante quand vous travaillez dans les technologies du web sémantique c’est que leur intérêt n’est pas facile à expliquer à des techniciens qui ont l’habitude de travailler sur des applications fermées, des bases de données, et du XML; exemple :

« RDF ? hé bien tu vois, c’est un peu comme du XML mais en mieux… »

« OWL ? hé bien tu vois, c’est un peu comme un schéma de base de données mais en mieux… »

« Les données ouvertes ? hé bien tu vois, tu peux partager tes données sur le web et les lier aux autres données existantes pour… comment ça tu t’en fiche ? »

Bref. Lire le reste de cette entrée »


Open Calais : du text-mining en mode SaaS

juin 7, 2008

Open Calais, ça aurait pu être le titre de la suite de « Bienvenue chez les ch’tis ». Non, en fait Open Calais c’est un nouvel outil de text-mining en mode SaaS (lancé au début 2008 environ ? je n’ai pas la date exacte). C’est gratuit, y compris pour les applications commerciales, en tout cas pour l’instant.

Là où ça devient intéressant, c’est que tout cela « cause RDF » :

Lire le reste de cette entrée »


L’absence de preuves n’est pas la preuve de l’absence

mai 24, 2008

Qu’on en commun la recherche de la vie extra-terrestre et la recherche des armes de destruction massive en Irak ?

Elles supposent toutes les deux que le monde est ouvert, et que ce n’est pas parce qu’on n’a rien trouvé qu’il n’y a rien; dans l’un et l’autre cas, l’absence de preuve n’est pas la preuve de l’absence(*).

Dans le monde ouvert des recherches sur le « web of data », hé bien c’est pareil.

Lire le reste de cette entrée »


How-to install a Sesame RDF server

avril 5, 2008

[An english translation of the previous french article]

Every profession has its own tools. For the emerging professions of the semantic web, RDF repositories will become the foundations of the semantic pyramid, a tool that every « semantic worker » will use; maybe one day, when referring to these « semantic workers », we will speak about « semantic manager », or « semantic architects »… Anyway these RDF repositories are talking about promising performances for growing amounts of data : they are reaching one billion of triples, and that is the focus of the next « semantic web challenge » (see also here and there). This remains however ridiculously small compared to relationnal databases, that can store terabytes of data; especially when you consider that, in order to garantee optimal performances on complex queries and inference, RDF databases are generally all loaded into memory…

But not everyone needs a billion-triple-large RDF database, and you can start working with such a tool by installing the Sesame RDF server. Lire le reste de cette entrée »


Un moteur de transformation RDF basé sur SPARQL (2)

janvier 19, 2008

[la suite du billet précédent sur le manque d’outil pour effectuer des transformations sur un graphe RDF, et la pertinence de cette opération pour l’échange de données.]

Pourquoi faire ?

La problématique est la suivante : je veux échanger des données exprimées en RDF, d’un système de départ à un système d’arrivée; les ontologies de départ et d’arrivée sont différentes, je dois donc transformer les données de départ pour construire un graphe conforme à l’ontologie d’arrivée. Il sera possible que seule une partie m’intéresse, et que toute l’information ne soit pas transformée.

Chaque opération de transformation est exprimée sous la forme d’une requête CONSTRUCT en SPARQL (1), qui permet de construire un pattern dans le graphe d’arrivée en fonction d’un pattern dans le graphe de départ; la requête s’exécute sur le graphe de départ, et ses résultats sont insérés dans le graphe d’arrivée.

Il suffit donc de décrire les requêtes SPARQL à exécuter à chaque opération. A l’usage, un peu de « sucre syntaxique » ne sera pas complètement inutile; certaines opérations de transformations vont en effet souvent revenir, et des raccourcis pour les écrire seront les bienvenus :

  • recopier tous les statements RDF qui ont un prédicat donné (typiquement recopier tous les rdfs:label);
  • recopier tous les statements rdf:type qui ont une certaines valeur, éventuellement en changeant cette valeur si elle n’est pas dans mon ontologie d’arrivée;
  • etc;

Et maintenant… un exemple. Lire le reste de cette entrée »


How-to install a Sesame RDF server – Comment installer un serveur RDF Sesame

décembre 19, 2007

Il n’y a pas d’artisans sans outils. Dans les nouvelles professions du web sémantique, les repository RDF vont s’imposer comme des fondations incontournables, comme les outils de base des artisans de la pyramide sémantique; peut-être un jour, à propos de ces artisans, parlera-t-on de « semantic manager », ou de « semantic architect »… Bref, ces bases RDF commencent à annoncer de bonnes performances pour des volumes conséquents, on parle en ce moment du milliard de triplets, c’est d’ailleurs le sujet du prochain « semantic web challenge » (voir aussi ici). Cela reste toutefois bien en deçà des bases relationnelles classiques, où les volumes de données peuvent se compter en tera-octets, d’autant que, pour garantir des performances optimales sur des requêtes complexes et de l’inférence, les bases RDF sont en général entièrement montées en mémoire…

Mais tout le monde n’a pas besoin d’un bulldozer qui gère un milliard de triplets RDF, et pour commencer à se faire la main sur ces outils, je vous propose de vous équiper d’un simple marteau et d’un tournevis, en installant le serveur RDF Sesame. Lire le reste de cette entrée »