Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mise en œuvre.

L’utilisation du web pour donner accès à des contenus riches et structurés est de plus en plus courant :

– accès à un catalogue de produits

– accès à de la documentation technique, juridique, administrative

– accès à de la documentation scientifique : brevets, articles

– accès à des bases de connaissance : économiques, R&D, people, patrimoine …

Les informations mises à disposition dans ces sites web sont qualifiées par de nombreuses données : caractéristiques du produit, lieu géographique, taille, prix, âge, sujets traités, … qui doivent pouvoir être accessibles aux utilisateurs pour filtrer les informations et trouver une liste de réponses correspondant à leurs attentes.

Chaque type d’attribut correspond à un axe de recherche, à une facette de la recherche. Par exemple dans le site web faisant la promotion du tourisme d’une région, l’utilisateur pourra filtrer les offres en fonction du type de ressource touristique (hébergement, activité, restauration, patrimoine, culture, artisanat…), en fonction du lieu (région, ville), en fonction de la langue parlée, en fonction de son besoin (s’éclater, se retrouver, découvrir …).

Pour chacun de ces axes de recherche d’autres axes permettant d’affiner le choix peuvent être proposés; si l’utilisateur a demandé les hébergements on lui proposera d’affiner son choix sur 3 axes complémentaires : type d’hébergement, prix, labellisation de l’hébergement, s’il choisit de rechercher en fonction des activités on lui proposera différents types d’activité : artisanales, sportives, culturelles…

La recherche et le filtrage de l’offre par différents niveaux de choix permettent de guider progressivement l’utilisateur en fonction du contexte de la recherche.

Pour la suite de ce document nous appellerons « Taxonomies de navigation » l’ensemble des critères disponibles pour le filtrage des contenus du site. Ces taxonomies de navigation se décomposent en autant de taxonomies que l’on a d’axes de recherche : exemple : taxonomie géographique, taxonomie des types de produit, taxonomie des labellisations d’hébergement. La taxonomie principale présentée lors de l’accès au site est complétée par des taxonomies contextuelles qui ne sont présentées que pour certains choix de l’utilisateur, exemple : la taxonomie des labellisation d’hébergement n’est présentée que si l’utilisateur à choisi de consulter les hébergements.

Les taxonomies de navigation utilisées pour le filtrage ne sont pas entièrement composées de listes de choix, elles peuvent également inclure des choix de valeurs numériques; par exemple le choix d’un prix maximum et minimum pour un prix d’hôtel ou des valeurs temporelle une plage de date pour sélectionner des événements culturels.

Taxonomies dynamiques

Les taxonomies présentées à l’utilisateur au fur et à mesure de sa recherche sont dynamiques à deux titres :

  • elles présentent pour chacune des rubriques des taxonomies le nombre de résultats obtenu pour cette entrée
  • elles s’adaptent en fonction du contenu sélectionné : si il n’y a aucune activité sportive dans la ville indiquée, la rubrique « activité sportive » disparaîtra du choix donné à l‘utilisateur,
  • elles s’enrichissent de taxonomies contextuelles au fur et à mesure des choix de l’utilisateur

Les taxonomies de navigation : un choix éditorial et non un choix technique

Les taxonomies de navigation sont l’équivalent des rayons et la signalétique dans un super marché. L’utilisateur se fait une idée de l’offre à sa disposition par les taxonomies qui lui sont présentées. Les taxonomies de navigation doivent donc répondre à trois objectifs :

  • refléter les contenus mis à disposition par l’éditeur du site
  • correspondre au public visé
  • être simples et lisibles

Des taxonomies qui réflétent le contenu mis à disposition par l’éditeur

Si une région a une politique marketing accès sur la richesse de ses activités sportives, la première taxonomie doit d’abord afficher les principales activités sportives de la région. Si les ressources touristiques de la région sont principalement axées sur les sports nautiques, il serait logique que les premières activités listées soit la voile, le canoë, la pêche plutôt que le tennis et le golf.

On voit que le choix des premiers axes de recherche présentés aux utilisateurs répond aux mêmes contraintes que l’organisation des rayons et des têtes de gondole dans un supermarché ou et aux mêmes contraintes de présentation qu’un catalogue de vente par correspondance.

Des taxonomies adaptées aux publics visés

La souplesse du web permet de créer plusieurs portails d’accès aux contenus, comme on trouve pour une même société de vente par correspondance plusieurs catalogues en fonction des cibles de clientèle.

Si la région souhaite segmenter son offre pour un public 20/35 et un public de seniors, elle créera deux portails distincts. Pour chacun des portails les taxonomies de navigation seront différenciées. La liste des activités sportives pour le public jeune mettra en avant les activités rafting, canoe et kayak mais la liste des activités sportives pour un public senior commencera probablement par balade en péniche, pêche…

Des taxonomies simples à utiliser et comprendre

Les choix donnés aux utilisateurs doivent être simples à comprendre et efficaces, il est parfois utile de s’implifier l’organisation des contenus ou des offres. Par exemple, les offres d’hébergement utilisent des systèmes de classification hétérogènes ; les étoiles pour les hôtels, les tentes pour les campings, les épis pour les gîtes ruraux avec des variations importantes d‘un pays à l‘autre… L’utilisation directe de ces catégories dans le portail ne serait pas intuitive et exigerait de faire une exploration pour chaque type d’hébergement. Le choix de l’éditeur du site et du marketing est de présenter à l’utilisateur une liste à trois entrées : « luxueux », « standard », « économique », liste permettant de faire un choix sur tous les types d’hébergement en un seul clic.

Affiner la sélection avec de la recherche plein texte

Quand l’utilisateur a réalisé la sélection qui lui convient en utilisant les différents axes de recherche, il peut être satisfait du résultat obtenu ou souhaiter l’affiner en s’appuyant sur le texte même. Si la personne souhaite vérifier que les hébergements qu’il a choisi acceptent les chiens, il pourra affiner sa recherche en faisant une recherche sur le mot «chien» dans toutes les offres sélectionnées.

La recherche directe sur le contenu permet d’affiner la sélection sur des critères qui ne sont pas mis à disposition dans les taxonomies mais qui peuvent être présents dans les textes descriptifs.

Taxonomies de navigation et attributs descriptif des contenus ou des offres

Les contenus ou les produits mis à disposition dans le portail contiennent de nombreux attributs descriptifs gérés dans une base de données ou sous forme de métadonnées. Exemple :

  • une activité touristique est décrite par : une thématique (équitation, pêche, poterie…), un lieu, une plage de prix, un public visé,
  • un hébergement est décrit par : un nombre d’étoiles, une plage de prix des chambres, une adresse, les services complémentaires offerts.

Les attributs descriptifs des différents contenus ou offres correspondent en général à des tables de référence spécialisées : liste des activités, nomenclature des étoiles d’hôtel, liste des villes, liste des départements, liste de services associés dans l’hôtellerie, liste des moyens de paiement…

L’utilisation directe de ces nomenclatures pour construire les taxonomies de navigation ne permet pas de répondre aux besoins décrit de l’éditeur du site et du marketing :

  • les activités sont décrites dans la nomenclature par ordre alphabétique et par famille de sports alors que l’on veut les activités nautiques en haut de la liste et le sport automobile en second
  • les classifications des hébergements ne sont pas homogènes pour les hôtels, campings, gîtes ruraux et l’on veut présenter une classification simplifiée valable pour tous les hébergements : luxueux, standard, économique
  • les adresses n’indiquent que les villes alors que l’on veut regrouper les offres par bassins touristiques
  • les descriptions techniques des contenus et offres ne comprennent pas certaines information en particulier sur la qualification marketing des offre, par exemple on ne dispose pas d’indication permettant de segmenter les offres entre les 20/35 ans et les seniors.

Les taxonomies de navigation sont donc bien distinctes des nomenclatures utilisées pour décrire les contenus et les offres. D’un coté une présentation marketing, ergonomique, unifiée, simplifiée et adaptée à une cible, de l’autre une description détaillée et technique des contenus ou des offres.

Construire des taxonomies de navigation à partir de la description des contenus et des offres

Les taxonomies de navigation sont construites par le responsable éditorial du site et par le marketing guidés par un souci valorisation du contenu et des offres. Dans un second temps elles sont confrontés aux données disponibles dans la description des contenus et des offres pour examiner les correspondances entre la taxonomie de navigation souhaitée et les éléments descriptifs des offres et contenus.

La correspondance peut être évidente et directe : la troisième rubrique de la taxonomie: « kayak » a une correspondance « kayak » dans la nomenclature du catalogue des activités.

La correspondance peut être automatisée par un raisonnement simple : la taxonomie géographique présente un premier niveau listant les bassins touristiques et un second niveau indiquant les villes de chaque bassin touristique. Seule l‘indication de la ville est présente dans les attributs décrivant les offres. Quand un utilisateur fera une sélection sur un bassin touristique, le moteur de recherche fera automatiquement une recherche sur toutes les villes du bassin touristique telle que décrit dans la taxonomie.

La correspondance peut nécessiter une requête un peu plus complexe : si un utilisateur sélectionne la rubrique « luxueux » pour les hébergements le moteur de recherche devra sélectionner dans le catalogue hotel les 4 et 5 étoiles, dans la catégorie camping les 4 tentes et dans la catégorie gîtes ruraux les 3 épis (cette requête sera faite en temps réelle ou un index spécifique aura été préparé d’avance par le moteur pour pouvoir répondre plus rapidement).

Outils logiciels

Les outils logiciel pour la mise en œuvre simple et évolutive des taxonomies de navigation dans les différents sites et portails d’une entreprise sont de trois types : logiciel de gestion de référentiels terminologiques et taxonomies, moteurs de recherche, interfaces utilisateur du site web.

Logiciel de gestion de terminologies et taxonomies

Ces logiciels (dont ITM de Mondeca) ont pour objectifs de permettre l’édition des taxonomies de navigation, la gestion de leurs différentes versions, leur mise en correspondance avec les référentiels et nomenclatures utilisées pour qualifier les offres et contenus et finalement la publication des taxonomies de navigation à destination du moteur de recherche et du portail de navigation sous un format standardisé comme SKOS ou tout autre format de fichier adapté au moteur de recherche.

Moteur de recherche

Le moteur de recherche doit être capable de ré indexer les contenus et les offres en fonction de l’organisation de la taxonomies de navigation en s’appuyant sur la hiérarchie de la taxonomie et les correspondance décrites avec les attributs disponibles sur les contenus et les offres. Le moteur de recherche doit également disposer des fonctionnalités permettant de recalculer dynamiquement le nombre de résultats pour chaque rubrique de la taxonomie, supprimer les rubriques ne correspondant à aucun contenus et remettre ces informations à disposition du site web quasi instantanément.

Le moteur doit également être capable de fournir aux éditeurs du site des informations statistiques sur l’utilisation des taxonomies : par quelles rubriques les utilisateurs commencent leur sélection? Quel est l’enchaînement des sélections de rubriques? Quels mots utilisent-ils pour affiner la recherche en utilisant le plein texte? … Ces informations seront utilisées par le responsable éditorial et le marketing pour réorganiser et affiner les taxonomies de navigation.

Interfaces utilisateurs

Les interfaces utilisateurs dans le portail doivent être capables de présenter les différentes taxonomies sous forme de listes, d’arborescences, de cartes permettant de sélectionner une zone géographique, de widgets permettant la sélection d’une valeur numérique, de calendriers…. Les interfaces doivent permettrent à tout moment de voir les premiers résultats, avoir le nombre de réponse total, avoir un rappel des critères de sélection actifs, pouvoir supprimer certains critères, réinitialiser une nouvelle recherche ou de la sauvegarder pour une visite ultérieure.

Si le graphisme et la mise en page peuvent beaucoup varier d’un site à l’autre, les composants et leur ergonomies sont assez stables et permettent de capitaliser sur des composants logiciels réutilisables d’un projet à l’autre.

Conclusion

Les taxonomies de navigation sont tout à la fois un outil de mise en valeur des offres et un service rendus aux utilisateurs. Leur mise en place relève de choix éditoriaux et marketing et peut nécessiter une segmentation par type de clientèle visée. Les taxonomies de navigation sont un outil dynamique au service de l’éditeur et doivent pouvoir évoluer rapidement en fonction de l’évolution des demandes et des attentes des utilisateurs. Un travail de mise en correspondance entre les taxonomies de navigation et les attributs ou métadonnées qui décrivent les offres et les contenus doit toujours être réalisé. L’utilisation de logiciels spécialisés dans la gestion des taxonomies et référentiels, de moteurs de recherche spécialisés dans la recherche par taxonomies et d’interfaces utilisateurs adaptées et ergonomiques sont indispensables pour une gestion souple et évolutive des taxonomies de navigation dans les portails.

6 commentaires pour Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mise en œuvre.

  1. bruno dit :

    très intéressant. Si on sépare le faceted seach du faceted navigation, les problèmes ne sont pas exactement les même en terme de performance non? Je me place du côté algorithmique. Dans le cas du faceted navigation, on peut imaginer naviguer dans les résultats d’une recherche avec des facettes calculées en utilisant que les résultats de cette recherche : dans ce cas les facettes peuvent être calculées à la volée ?
    Dans le cas du faceted search, où les requêtes sont construites en utilisant les valeurs disponibles dans les facettes, il faut bien effectuer un précalcul : précalculer les facettes au moment de l’indexation (et plus de la query)?

    Les algorithmes ne sont donc pas les mêmes : peux tu me donner des références vers des algorithmes pour calculer les facettes dans ces deux cas? Je connais celui utilisé par SOLR, mais je ne trouve pas beaucoup de références sur ce sujet sur la partie algorithmique pure.

    Merci

  2. bruno dit :

    Ref vers SOLR : http://lucene.apache.org/solr/
    et quid des hypercubes?

  3. leguaib dit :

    Bonjour,

    votre article est très intéressant, j’aimerai savoir si des sites de e-commerce utilisés la faceted navigation ? Les avantages, et les inconvenents?!
    je vous remercie et félicitation pour votre blog.

  4. […] Bon, je résume un peu, mais il existe de trés bonnes ressources pour se renseigner sur le principe des recherches à facettes. […]

  5. […] Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mis… Pour la suite de ce document nous appellerons « Taxonomies de navigation » l’ensemble des critères disponibles pour le filtrage des contenus du site. Ces taxonomies de navigation se décomposent en autant de taxonomies que l’on a d’axes de recherche : exemple : taxonomie géographique, taxonomie des types de produit, taxonomie des labellisations d’hébergement. La taxonomie principale présentée lors de l’accès au site est complétée par des taxonomies contextuelles qui ne sont présentées que pour certains choix de l’utilisateur, exemple : la taxonomie des labellisation d’hébergement n’est présentée que si l’utilisateur à choisi de consulter les hébergements. […]

  6. […] Les Taxonomies de navigation – La recherche à facettes : Définition, utilisation, objectifs, mis… L’utilisation du web pour donner accès à des contenus riches et structurés est de plus en plus courant : – accès à un catalogue de produits – accès à de la documentation technique, juridique, administrative […]

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :