De la bibliothéque aux taxonomies, de la conversation au Web 2.0, de la critique littéraire aux Listmania, de l’expert aux bases de connaissances, des concordances bibliques aux index plein texte: Continuité et révolution dans l’accès aux contenus

 

Offrir un accès efficace à des tablettes, rouleaux, documents, livres, chapitres, paragraphes, versets a préoccupé les hommes depuis la création de l’écrit (en tout cas une petite partie d’entre eux) dans un esprit de service aux lecteurs. Aujourd’hui nous avons la même préoccupation dans un univers de contenus numériques et de réseaux internet.La mise à disposition des contenus ou de leurs références via l’internet entraine mécaniquement un besoin de transposition des méthodes d’accès aux contenus dans un environnement numérique. Cette migration dans un environnement numérisé qui dispose de capacités de traitement occasionne une évolution de ces outils et méthodes, l’apparition de nouvelles techniques de médiation mais aussi l’émergence de nouvelles pratiques dans leur utilisation et leur couplage.

La préoccupation de guider les hommes dans l’accès aux ouvrages et textes (comme les cartes routières nous guident pour trouver notre destination) a été partagée par Callimaque de Cyrène archiviste de la bibliothèque d’Alexandrie qui en rédige le premier catalogue raisonné en 120 rouleaux, Robert Estienne, imprimeur, qui en premier eut l’idée de découper la Bible en versets pour en faciliter l’étude en 1551, par les auteurs quand il rédigent le sommaire de leurs ouvrages, par le patient travail des responsables des index chez les éditeurs juridiques, par le thésard qui rédige une bibliographie sur son domaine de recherche, par Dewey qui conçoit la classification décimale visant à classer l’ensemble du savoir humain à l’intérieur d’une bibliothèque, par Bernard Pivot quand il édite « la bibliothèque idéale », par les équipes d’Amazon quand elles construisent les taxonomies permettant de filtrer leur offre de livres…

Sans souvent nous en rendre compte, tant ces services nous semblent naturels, nous utilisons ces outils pour sélectionner et accéder aux ouvrages qui nous intéressent ou dont nous avons besoin. Pourtant ces méthodes d’accès aux ouvrages qui nous paraissent si naturelles ont été pensées et créées progressivement au cours des siècles en fonction des besoins. Elles sont arrivées, dans le monde de l’imprimé, à une phase de stabilité et de maturité au cours du XXème siècle.

En une trentaine d’années seulement, les progrès de l’informatique et de l’internet ont remis en cause ces moyens d’accès aux contenus. Les nouveaux documents n’existent souvent qu’en version numérisée, des ouvrages anciens sont en cours de numérisation, les catalogues des ouvrages imprimés sont disponibles sur l’internet…

Ces évolutions ont eu plusieurs conséquences sur les moyens d’accès aux documents :

  • Les moyens d’accès doivent mener à des ouvrages numériques comme à des ouvrages papier
  • Les moyens d’accès doivent être gérés numériquement afin d’être disponibles à partir de l’ordinateur, outil privilégié d’accès aux contenus
  • Les technologies de l’informatique, de la linguistique et de la logique permettent d’automatiser certaines tâches, d’enrichir les fonctionnalités des outils d’accès mais aussi d’en inventer de nouveaux.

Dans cet article, nous tenterons de faire un inventaire des différents outils d’accès aux ouvrages et contenus dans un environnement internet, mais aussi de les repositionner dans leur continuité historique puisque la majorité d’entre eux sont la continuité de méthodes déjà éprouvés dans le monde de l’imprimé.

Cet article ne traite que des outils textuels d’accès aux contenus (index, tables, bibliographies…) et n’aborde pas les outils graphiques ou iconographiques. Cet article n’a pas non plus comme objectif de traiter de la navigation à l’intérieur des ouvrages ou articles mais bien de s’intéresser à tout ce qui à l’extérieur du contenu lui-même permet d’y accéder.

Continuité et transformation des outils et services d’accès aux ouvrages et contenus

Des bavardages et discussions aux web 2.0

Le premier moyen d’accès à un ouvrage, un poème, un chapitre, une recette de cuisine, un article de loi… est probablement le conseil amical ou professionnel : il faut que tu lises cela…, vous devriez trouver ce que vous chercher dans cet ouvrage…, voici quelques livres pour ton anniversaire…, sur une île déserte je prendrais….

Ces conseils amicaux, éducatifs, professionnels, dictatoriaux… ont trouvé une continuité naturelle sur le web par la multiplication des possibilités d’échanges : mail, blog, wiki… Leur puissance a été décuplée car ils ne s’adressent plus un ami ou collègue mais à tous les anonymes qui auront l’occasion des les lire via internet. Autre avantage notable, dans la majorité des cas le conseil donne également un lien directe sur le contenu numérique ou un lien sur le libraire en ligne qui se fera un plaisir de vous faire parvenir l’ouvrage.

De l’avis des critiques professionnels aux avis de personnes reconnues dans leur communauté

L’échange ou le conseil amical ou pédagogique se professionnalise avec le travail des critiques. Leurs analyses critiques, publiées dans la presse, sont un moyen d’accès aux ouvrages et contenus. J’irai acheter tel roman recommandé dans le supplément livres du Monde ou la rubrique Livres de Elle ou tel article commenté dans une revue spécialisée.

L’internet et le Web 2.0 on eu un double effet sur ce type d’accès aux ouvrages :

  • La publication en ligne des critiques ce qui les rend accessible à un public plus large
  • L’historisation de ces critiques qui me permette de les retrouver plusieurs mois après
  • La multiplication des vocations de critique, activité qui n’est plus réservée à des professionnels rémunérés par la presse mais s’ouvre à tout lecteur voulant faire part de son avis avec la bénédiction et le soutien des librairies en ligne (voir les avis des lecteurs dans Amazon ou la Fnac).

La publicité

La publicité pour les ouvrages, que ce soit celle d’un roman à la radio ou d’un ouvrage spécialisé de droit dans une revue professionnelle est un moyen de communication et d’accès à un contenu ou un ouvrage. Dans le Web, principalement sous s’impulsion d’Amazon, la publicité pour les livres c’est considérablement développée. La capacité de faire apparaître les publicités en fonction du contenu de la page consultée a permis d’affiner les cibles client et de transformer les publicités en un quasi service pour les lecteurs (publicité contextuelle). Le lien est maintenant presque direct entre la publicité et l’ouvrage : un clic nous amène à la fiche décrivant l’ouvrage dans le catalogue, on pourra probablement en consulter des extraits sans l’acquérir, un dernier clic et un N° de carte de crédit nous permettent de l’acquérir.

Des bibliographies aux playlists, listmania

Les conseils ponctuels de lecture peuvent se transformer en un réel travail de sélection d’ouvrages ou contenus sur une thématique réalisée par un expert d’un domaine : c’est la bibliographie. On sort du conseil personnalisé pour aller vers une notion de service pédagogique s’adressant à ses étudiants ou à des d’anonymes qui voudraient être guidés dans l’étude d’un champ de savoir.

L’organisation, la disposition, la typographie des bibliographies ont fait l’objet d’un soin et d’une standardisation progressive, en particulier dans le monde universitaire. On trouve les bibliographies sous forme numérique sur le web avec quelques aménagements typographiques et techniques permettant entre autre de pointer directement sur le document numérique.

Mais la bibliographie a pris un essor nouveau et s’est rapidement « démocratisée » avec la possibilité de publier des « listes » dans le web. Cette fonction ce retrouve dans de nombreux environnements collaboratifs : site Amazon avec ListMania, liste d’ouvrages préférés, liste de poèmes préférés dans les sites communautaires… La mise à disposition de listes personnelles d’ouvrages touche tous les domaines : musical, cinéma, touristique… les documents écrits et livres ne sont ici qu’un média parmi les autres.

Identifier un objet en décrivant ses caractéristiques : de la demande à un expert au formulaire de recherche dans un catalogue

Quand la recherche est très ciblée, que l’on souhaite utiliser des critères détaillés sur le sujet de la recherche ou le type d’ouvrage, on peut se tourner directement vers l’expert du domaine pour lui demander « mais quel ouvrage me conseillez vous sur ce point particulier ? » ou « chez quel éditeur puis je trouver ce texte de Tolstoï ? », ou se tourner vers l’interrogation directe de catalogues spécialisés (catalogue d’une bibliothèque, d’un éditeur, d’un libraire, d’une base de données scientifique). Le formulaire de recherche qui permet de décrire sa recherche en utilisant tous les champs détaillés du catalogue est alors le moyen d’accès à l’ouvrage, ou à l’article. Le résultat peut être une fiche descriptive ou un accès direct au contenu.

De la liste des bestsellers à de nouveaux types de listes basées sur les statistiques

L’utilisation des statistiques comme moyen de constituer des listes d’accès aux ouvrages est courant : liste des best-sellers, liste des meilleures ventes, liste des ouvrages élus par les lectrices d’un magazine…

L’internet a permis de généraliser ces listes sur des critères plus variés, plus fins et donnent des résultats en temps réel :

  • Statistiques des meilleures ventes selon des catégories ajustables par l’utilisateur, par exemple « meilleures ventes de livre de cuisine italienne en français »
  • Statistiques sur les évaluations des livres par les lecteurs
  • Statistiques sur l’accès aux contenus (nombre de personnes ayant accédé à ces contenus la semaine dernière, le mois dernier, au total… – ce type de données est très utilisé dans les blogs)
  • Statistiques sur le nombre de recommandations ou références à ce contenu (Google)

De la table des matières à la navigation dans un site éditorial – plan de site

La table des matières, qui détaille les différentes parties de l’ouvrage et la page ou débute chaque partie, est bien un outil d’accès aux différentes parties d’un ouvrage. Ces tables des matières peuvent être simples quand elles donnent les chapitres des « Malheurs de Sophie » ou très importantes, détaillées, organisées selon plusieurs niveaux pour un ouvrage juridique.

Ces tables de matières sont également disponibles dans les ouvrages numériques organisés comme des livres. On trouve par exemple dans Adobe une navigation dans le texte à partir d’une table des matières qui apparait à gauche du texte. Les tables des matières comme moyen de comprendre le contenu sont également valorisées par Amazon qui pour de nombreux ouvrages fait l’effort de numériser les tables des matières.

Mais le web a entraîné la création de nouveaux types de présentations éditoriales comme le site web où les différents contenus sont disposés dans des pages autonomes. La présentation de l’organisation du contenu et la navigation repose sur une organisation hiérarchique des différents contenus qui apparait dans le site sous forme de liens de navigation. Une vision synthétique de l’organisation de l’ensemble des pages est en général disponible sous le nom de « plan du site ».

De l’organisation d’une bibliothèque à la recherche à facettes

L’organisation physique des livres dans une bibliothèque privée, publique, chez un libraire est toujours un choix, une décision motivée par le désir de fournir un accès compréhensible, utilisable, lisible à ceux qui viennent chercher l’information. Ces choix sont très divers en fonction de la taille du fonds, de la spécialisation de la bibliothèque (généraliste, enfantine, historique, scientifique, d’entreprise…), des contraintes de rangements (où mettre les très grands livres qui ne rentrent pas dans le rayonnage prévu pour sa thématique ?). L’organisation physique des ouvrages dans les rayonnages d’un libraire par exemple, repose très généralement sur une première organisation basée sur un classement thématique (histoire, roman, voyage, médecine…) et un second niveau de classement dont le choix est assez variable ; ordre alphabétique des auteurs, éditeur puis ordre alphabétique des auteurs, ordre d’arrivée… avec des sous organisation ad-hoc (taille des livres, fragilité..).

Dans les rayonnages le rangement et l’ordre des livres ne peux être qu’unique, si l’utilisateur ne l’apprécie pas il n’a pas le loisir de réorganiser la bibliothèque ou la librairie pour ses besoins propres mais il trouvera peut être une autre bibliothèque ou librairie lui proposant une organisation plus adaptée à son besoin.

Le besoin de pouvoir se diriger rapidement vers un ensemble d’ouvrages et de contenus correspondant à la thématique de notre recherche a été résolu dans le monde numérique par la capacité de filtrer un ensemble de contenus sur plusieurs facettes (thématique, éditeur, auteur, date d’édition, langue de l’ouvrage…) et d’organiser la liste résultante dans l’ordre qui nous convient (ordre alphabétique des auteurs, des titres, des maisons d’édition, plus forte vente, meilleurs critiques des lecteurs…).

La sélection par des facettes ou via des « taxonomies de navigation » nous permet de réorganiser en une seconde en ensemble d’ouvrages pour nous constituer une bibliothèque ou librairie numérique adaptée à notre besoin du moment : bibliothèque des livres de cuisine américains publiés avant 1950, bibliothèque des ouvrages en français sur la seconde guerre mondiale…

La recherche à facettes repose sur le même principe que l’organisation des bibliothèques : choisir des caractéristiques des ouvrages (thématique, langue, auteur, titre, éditeur, critiques..) et organiser la présentation des ouvrages selon certains de ces critères.

La magie (le terme ici semble approprié) est de pouvoir en une seconde réorganiser l’ensemble du fonds selon les critères de notre choix.

Des index de l’encyclopédie aux index dans une publication web

L’outil le plus fin d’accès aux contenus est l’index : une liste de sujets organisés avec soin par un spécialiste nous donne un accès direct aux contenus au niveau de l’article, du paragraphe, du verset. La mécanique est précise, la liste des contenus pertinente et complète (nous parlons ici d’un bon index, construit avec soin).

L’index peut être simple ou composé de plusieurs index et tables :

  • index thématique,
  • index des personnages cités,
  • index des lieux,
  • index des ouvrages cités,
  • tables des iconographies…

L’index donne tout à la fois une vision très fine des sujets traités dans l’ouvrage, une navigation alphabétique et hiérarchique dans cette liste de sujets et un accès direct aux contenus en indiquant le N° de la page ou un lien directe sur le contenu quand il s’agit d’un ou une publication web.

La qualité des index est très variable, elle dépend :

  • du type de contenu; les index des ouvrages juridiques, scientifiques et des encyclopédies sont en général de grande qualité
  • des éditeurs et auteurs qui apportent un soin inégal aux index
  • des traditions éditoriales ; les éditeurs anglo-saxons, sont en général, plus soucieux que d’autres de la qualité des index

La création d’un index et sa maintenance pour les nouvelles éditions représentent un travail complexe : choix d’une liste de sujets, organisation hiérarchique quand les sujets ont plusieurs niveaux de détail, choix de synonymes pour nommer certains sujets, renvois entre sujets, création des références entre les sujets et les textes de l’ouvrage…

Le service rendu par un index dépend beaucoup de la taille de l’ouvrage et de la complexité des sujets ; c’est pour certains ouvrages et utilisateurs l’index est le premier outil utilisé pour accéder au contenu et le seul apportant un réel gain de temps et de productivité (droits, réglementations, médecine..).

Pour les contenus publiés sous forme de sites web ou portails, la mise à disposition d’un index est assez rare en particulier dans les sites francophones. On trouve souvent de très bons index dans les sites gouvernementaux anglo-saxons.

Plusieurs facteurs jouent pour un retour à la mise à disposition d’index pour l’accès aux contenus :

  • Qualité de service : offrir aux utilisateurs une cartographie complète des sujets traités, de leur granularité et de leurs relations
  • Qualité de service : indiquer comment les sujets traités sont nommés dans la collection de contenus, évitant ainsi les longs tâtonnements des utilisateurs
  • Référencement dans les moteurs de recherche : la mise à disposition aux moteurs de recherche internes ou généralistes (Google, Yahoo…) d’index thématiques oriente leur travail d’indexation et améliore la visibilité des contenus dans les moteurs
  • Automatisation : apparition d’outils automatiques ou semi-automatiques de génération d’index thématiques s’appuyant sur différentes techniques linguistiques, sur des thésaurus existants, sur les métadonnées présentes dans les documents

Des connaissances de l’expert aux connaissances transformées en services aux utilisateurs

Dans l’édition papier, l’index et les tables constituent le degré le plus sophistiqué de présentation d’une liste de sujets et de leurs relations. Les contraintes de l’édition papier n’autorisent en effet qu’une présentation sous forme de listes de sujets complétées de renvois vers d’autres sujets.

Au final seul les experts d’un domaine sont à même d’avoir une représentation fine des relations entre les sujets d’un domaine, d’avoir une cartographie des connaissances et c’est vers l’expert que l’on se tourne traditionnellement pour une recherche complexe nécessitant une bonne connaissance du domaine (avocat, médecin, agent de voyage, fiscaliste, expert technique…).

L’informatique autorise une nouvelle approche de l’accès aux contenus via une description fine des sujets d’un domaine et de leurs relations, une représentation des connaissances du domaine. Cette nouvelle approche est incarnée dans les technologies du web sémantique, des ontologies, de la représentation sémantique des connaissances.

Les services rendus sont de deux ordres :

  • Recherche et navigation de l’utilisateur au travers d’une représentation des connaissances du domaine
  • Automatisation partielle des recherches par la machine qui utilise la représentation des connaissances du domaine pour faire des raisonnements et navigation et identifier les contenus utiles

Recherche et navigation de l’utilisateur dans une représentation des connaissances du domaine

Dans la même philosophie que celle des index et tables, le service est :

  • de fournir un inventaire raisonné des sujets traités dans un domaine
  • de décrire les différentes relations qu’ils entretiennent (est une partie de, est contradictoire avec, a un impact sur, est confirmé par, participe à, est localisé à, s’applique à telle population…),
  • de pouvoir rechercher et naviguer au travers de ces sujets par type de sujets (auteurs, thématiques, lieux, technologies, types d’objet…),
  • de pouvoir naviguer entre les sujets en utilisant leurs relations

et finalement de pouvoir accéder aux contenus référencés.

Le développement et la maintenance des outils d’accès aux contenus basés sur une représentation des connaissances du domaine nécessitent des investissements humains et technologiques plus importants qu’une indexation plein texte des contenus puisqu’elle mobilise les experts du domaine. Pourtant cette approche est retenue pour différents systèmes car elle permet un important saut de productivité pour les utilisateurs comme un important saut qualitatif sur la précision et complétude des réponses.

Certains secteurs d’activité disposent à la fois des moyens et d’un enjeu économique pour systématiser ce type d’approche, comme par exemple :

  • les centres d’appel de plus en plus spécialisés sur des domaines techniques, légaux, fiscaux, administratifs doivent tout à la fois répondre de manière précise et exhaustive car ils engagent leur responsabilité, employer des personnes non expertes du domaine, manipuler un contenu complexe et en constante évolution, respecter des critères de productivité très stricts (ex : centre d’appel des impôts américains)
  • les sites de e-commerce qui souhaitent offrir en amont de leurs produits un savoir détaillé sur leur domaine pour fidéliser le client et augmenter les ventes : un vendeur d’articles de sports gérera une base de connaissance sur les différents sports, règles du jeu, club, événements, un vendeur de composants informatiques mettra à disposition des bases de connaissances permettant de choisir les composants, configurer les machines…
  • les éditeurs juridiques qui souhaitent garder une valeur ajoutée les différentiant des autres sources d’information et offrent à leurs abonnés professionnels de véritables bases de connaissances juridiques pour accéder aux contenus législatifs, réglementaires et à la jurisprudence

Automatisation de l’accès à des contenus

Les bases de connaissances, si elles sont bien conçues, formellement représentées, peuvent devenir la base à des services automatisés d’accès aux contenus sur la base d’une description du besoin de l’utilisateur :

  • création en temps d’une documentation réglementaire personnalisée concernant un navire marchand en fonction de caractéristiques et dates de contrôle
  • création d’une documentation personnalisée sur les subventions possible à l’embauche en fonction des caractéristiques de l’entreprise et du profil de la personne à recruter
  • aide à la création d’un voyage avec ce que cela implique de choix, de disponibilité, de tarification

L’accès direct à une chaîne de caractères : une expérience nouvelle

L’accès au contenu par la recherche d’une série de mots est un mode d’accès révolutionnaire, moins par son principe que par l’automatisation du processus et la rapidité d’accès au contenu (on retrouve en effet l’application du principe de la recherche plein texte dans les « concordances bibliques » où chaque mot de la Bible est classé de manière alphabétique, accompagné de la phrase où il se trouve et de sa référence. cf note 1)

La rupture introduite par les technologies de moteurs de recherche vient de l’automatisation du processus, de l’incroyable rapidité des recherches et du très faible coût d’indexation des documents.

Cette méthode présente certaines limites :

  • elle ne pas être mise en place que pour les contenus textuels (ce qui exclu les images, vidéo…)
  • les contenus textuels doivent être numérisés
  • le contenu plein texte doit être disponible ce qui exclu tous les ouvrages ou contenus qui ne sont pas mis à disposition dans leur texte intégral par leur propriétaire, soit la plupart des livres, articles de journaux…

L’efficacité brutale de la méthode a fait ses preuves dans les moteurs de recherche généraliste comme dans les sites web pour un travail de fouille de contenus. Les limites de la méthode sont liées à son manque de finesse, au nombre de contenus non pertinents remontés ainsi qu’à l’impossibilité de savoir si les réponses sont exhaustives. Cette critique s’adresse plus aux méthodes de recherche s’appuyant sur une indexation plein texte, qu’aux moteurs de recherche qui quand ils sont utilisés plus finement pour indexer des mots clés, des champs structurés, des métadonnées donnent des résultats d’une grande précision.

Le flux RSS – se constituer un index vivant des nouvelles publications

Les flux RSS peuvent également être classés dans une technologie en rupture. Ils permettent en sélectionnant un éditeur de contenus et éventuellement une thématique particulière d’être averti de toutes les nouvelles informations parues par un bref message donnant le titre du contenu, un rapide résumé et un lien sur le contenu. Les outils de lecture des flux RSS (par exemple NetVibes) quand ils agrègent de nombreux fils RSS sélectionnés soigneusement par l’utilisateur en fonction de ses centres d’intérêt constituent de véritables index thématiques automatiquement mis à jour et fédérant des contenus de multiples sources.

Combinaison des modes d’accès

L’ensemble de ces modes d’accès sont disponibles dans une plateforme unifiée, répandue et d’un faible coût : un ordinateur connecté à l’internet. En se combinant dans une plateforme unique, ils démultiplient leur efficacité :

  • Une publicité contextuelle pour un ouvrage apparait lors de la lecture d’un texte, un clic permet d’accéder au site d’Amazon, on peut consulter le sommaire de l’ouvrage, sa présentation par l’éditeur et des retours de lecture. Un autre clic permet de consulter dans le catalogue les autres ouvrages de l’auteur. En copiant le nom de l’auteur dans Google on arrivera à un lien sur la fiche Wikipédia parlant de cet auteur…
  • En revenant sur la liste des personnes ayant commenté l’ouvrage, on accédera probablement aux listes qu’ils ont pu constituer sur d’autres ouvrages qu’ils aiment dans le même domaine…

En quelques minutes nous avons utilisés une dizaine de mode d’accès différents aux contenus, sans réellement en prendre conscience. Pourtant cette expérience repose bien sur les efforts conjugués des auteurs, éditeurs, distributeurs ou communautés d’intérêt dont les efforts conjugués permettent un accès efficace et rapide aux contenus.

Continuité des modes d’accès, révolution de l’expérience de l’utilisateur

On voit que dans leur majorité les principes d’accès aux contenus préexistaient à la numérisation et à la généralisation d’internet. La rupture technique vient réellement de la combinaison des différents modes d’accès à partir d’un outil unique, de la rapidité des opérations réalisées, de la fédération des contenus et de la fédération des moyens d’accès dans outil unique.

L’expérience pour l’utilisateur est radicalement différente de ce que l’on pouvait vivre avant les années 90 : disparition des déplacements physiques, utilisations combinées de moyens d’accès aux contenus, accès direct aux contenus ou au moins à leur description, publication accélérée des retours des lecteurs…

Une convergence rapide de l’ergonomie des outils d’accès aux contenus

L’ergonomie, la mise en page, la manière d’utiliser les moyens d’accès aux contenus papier ont évolués lentement au long des siècles et tout particulièrement entre le 17 et 20 ème siècle pour arriver aux systèmes de classification des bibliothèques publiques, aux index des encyclopédies, aux règles de mise en page et typographie des bibliographies, index, catalogues….

Les moyens d’accès numériques aux contenus n’ont que quelques dizaines d’années. Un travail continue, intense, mondial est en cours pour améliorer l’ergonomie des ces outils, expérimenter de nouveaux modes d’utilisation, améliorer la mises en page des résultats, trouver des façons d’assister l’utilisateur.

Nous avons vu en une quinzaine d’années apparaître :

  • La navigation dans les sites web éditoriaux
  • Le plan de site du site web
  • Les moteurs de recherche basés proposant sur des plans de classement de l’information (Yahoo)
  • Les bandeaux publicitaires
  • La recherche à la Google
  • Les addwords de Google
  • La recherche à facette dans les sites e-commerce
  • Les liens de suggestion vers d’autres contenus
  • Les index de sujets dans des sites professionnels (e-gouvernement, administration)
  • Les bases de connaissances thématiques donnant accès à des contenus (par ex dans IMDB, certains sites touristiques, les bases juridiques)
  • L’arrivée des listes personnelles (musiques, livres)
  • Les flux RSS

et pour chacun de ces moyens d’accès nous avons constaté une évolution rapide et continue de l’ergonomie, de la mise en page, de l’intégration des services.

Les sites de e-commerce, qui donnent accès à de grandes quantités de contenus/produits déjà bien décrits dans des catalogues structurés, ont été particulièrement innovants dans leur effort pour offrir des outils d’accès simples et puissants. Ils prennent un soin particulier à offrir une ergonomie qui ne fera pas fuir les clients, ils essayent de vendre plus de produits tout en rendant un service qui fidélisera le client (ex : service de suggestion de livres sur Amazon).

Pendant cette période d’évolution rapide des moyens d’accès aux contenus, les éditeurs de portails et sites doivent veiller à remettre à niveau les services qu’ils proposent de manière quasi continue ou devenir force de proposition pour offrir des services d’accès plus efficace que ceux de leurs concurrents (Fnac vs Amazon, LexisNexis vs Wolters Kluwer, Elsevier vs Thomson…)

Comme dans le monde de l’imprimé, mais dans un laps de temps beaucoup plus court, on arrivera progressivement à une ergonomie, une grammaire, des modes d’utilisation assez standardisés de services d’accès aux contenus pour le plus grand bénéfice des utilisateurs et la relative tranquillité des éditeurs.

Au cœur des systèmes d’accès aux contenus et connaissances : la sémantique, le concept, le sujet

Les outils d’accès aux contenus forment une infrastructure d’organisation indépendante des contenus mais pointant vers eux (par des liens, par des références d’ouvrage…). Ces infrastructures d’accès aux contenus sont composées de sujets organisés entre eux pour un usage particulier : index des sujets traités, taxonomies pour la recherche à facette, bibliographies sur un sujet donné…

Les technologies du web sémantique et des ontologies ont été imaginées et conçues pour traiter de la description des sujets et pour gérer leur organisation :

  • La norme ISO Topic Maps a eu comme premier objectif de gérer des index complexes basés sur une description des connaissances d’un domaine,
  • Les premières descriptions du Web Sémantique donnaient comme objectif le traitement automatiquement des relations entre les sujets pour un accès assisté aux contenus et produits….

L’objectif principal des technologies du Web Sémantique est de fournir des normes, des outils et des méthodologies pour construire des outils efficaces, ouverts, normalisés, interopérables d’accès aux contenus utilisables aussi bien par les hommes que par les machines.

Pour la première fois, nous disposons, au travers de technologies interopérables :

  • des références précises pour identifier les contenus
  • de grandes quantités de contenus sous forme numérisée
  • d’une très large palette de technologies d’accès aux contenus

Le travail à faire pour améliorer les outils d’accès aux contenus, leur normalisation et leur interopérabilité comme le travail à faire pour augmenter la part des contenus disponibles sous forme numérique reste considérable, mais ce travail est en cours sous l’impulsion conjuguée des acteurs privés et publics et des communautés d’intérêt.

On peut parier que nous jugerons un jour les solutions actuelles d’accès aux contenus via l’internet comme archaïques et désordonnées mais que certains (peu d’entre nous) regretterons cette période de mise au point, de créativité et d’inventivité journalière visant à choisir les meilleurs outils, méthodes et ergonomies.

Note 1 : Hugues de Saint Cher, mort en 1263, dominicain, est à l’initiative de la première concordance biblique. VIGNAUX Georges http://liris.cnrs.fr/as50/Journee-7-juillet/Vignaux-Indexation-classification0703.doc

3 commentaires pour De la bibliothéque aux taxonomies, de la conversation au Web 2.0, de la critique littéraire aux Listmania, de l’expert aux bases de connaissances, des concordances bibliques aux index plein texte: Continuité et révolution dans l’accès aux contenus

  1. […] Accéder au contenu Je viens de lire un intéressant article de chez mondeca "De la bibliothéque aux taxonomies, de la conversation au Web 2.0, de la critique littéraire aux Li…" […]

  2. […] de Nicole Boubée sur l’accès des élèves à la recherche par l’image. Enfin cet article chez Mondeca que je trouve exhaustif des modes de recherche. Et pour introduire sur la […]

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :