Metadata never die

De temps en temps, je fais une recherche Google sur mon nom. J’ai la chance, ou la malchance, d’avoir une combinaison prénom + nom de famille assez rare, donc cette requête ramène peu de bruit. C’est toujours assez étrange de se regarder dans le miroir à géométrie variable du Web : papiers de conférences, forums publics, fragments de blogs … on y retrouve souvent des bribes oubliées depuis des années que les algorithmes mystérieux de Google font remonter en surface. C’est comme feuilleter un vieil album photos mal rangé …

L’autre jour j’ai eu la surprise de trouver dans la première page de cet « album » ce lien vers un fichier Powerpoint sous le titre Tutorial Content Structures Extreme 2002. Etonné que les slides d’un tutorial que j’ai effectivement donné à Montréal Extreme Markup en 2002 puissent être en ligne, j’ai donc cliqué sur le lien … et retrouvé des slides présentées par Jean Delahousse à l’Ecole d’Eté d’Informatique CEA EDF INRIA 2003 sous le titre « Rôle et mise en oeuvre des standards sémantiques dans un environnement distribué de partage des connaissances ». Le fichier téléchargé, un coup de bouton droit sur « Propriétés – Résumé » donne bien les métadonnées qui ont visiblement été utilisées par Google pour indexer ce document. « Titre : Tutorial Content Structures Extreme 2002 » – « Auteur : Bernard Vatant ».  Mais aussi « Date de création : 21/06/2001 », et « Numéro de révision : 965 ». Ces deux dernières informations sont sans doute celles qui laissent le plus songeur …

Plusieurs leçons à retenir.

  1. Les documents Office contiennent des métadonnées.
  2. Ces métadonnées survivent à tous les avatars du contenu sauf changement volontariste de l’éditeur du document.
  3. Google sait les trouver dans des documents en ligne, et il s’en sert, lui.
  4. Il est bien le seul … demandez autour de vous qui met à jour les métadonnées de ses documents Office avant de les diffuser, ou pire, de les publier sur le Web. Et même et surtout à ceux qui vous parlent savamment de l’importance des métadonnées.

Morale de cette morale. Les métadonnées ne peuvent être fiables que si elles sont synchronisées automatiquement, et mises en cohérence d’une façon ou d’une autre,  avec le contenu. Mais ne comptez pas sur les utilisateurs pour le faire spontanément …

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :