Gestion d’une terminologie d’entreprise : utilisations, enjeux et différentes formes d’organisation

L’accès efficace aux contenus et connaissances au sein de l’entreprise, à destination de ses clients ou de ses partenaires est un enjeu de tous les jours. Intranet, sites internet, accès aux documentations techniques, centres d’appel, partage de connaissances, réutilisation de contenus, partage de contenus avec les filiales étrangères, veille économique et technique sont autant de facettes de cette problématique unique.

Les investissements pour répondre à ces enjeux sont nombreux et souvent dispersés : moteurs de recherche, portails, intranets, systèmes de gestion documentaire, outils de texte mining, outils d’aide à la traduction, bases de connaissance. Tous ces outils participent à l’acquisition des connaissances, des contenus, à leur organisation et à leur accès.

L’efficacité des solutions mises en œuvre reposent en grande partie sur l’utilisation de terminologies métier propre à l’entreprise permettant de définir, classer, filtrer et naviguer dans les contenus et connaissances de l’entreprise. Les outils spécialisés dans la gestion de la terminologie des entreprises permettent aujourd’hui une unification de la gestion de la terminologie de l’entreprise, sa gestion au jour le jour et l’alimentation régulière des différents outils.

L’objectif de cette présentation est de décrire les apports d’une terminologie d’entreprise dans le processus de rédaction, capitalisation, organisation et accès aux contenus et connaissances.

Les besoins

Assistance à la rédaction de documents

La rédaction de documents techniques, contractuelles, marketing nécessite l’utilisation d’un vocabulaire d’entreprise cohérent, stable, multilingue.

La gestion d’une terminologie d’entreprise permet de mettre à disposition des auteurs la liste des termes préférentiels, avec leur définition, leurs traductions, leurs synonymes ainsi que des références d’utilisation.

La terminologie peut être utilisée pour alimenter des logiciels de correction orthographique et des outils de text mining capable d’assister directement l’auteur lors de la rédaction de son texte, en proposant les termes préférentiels au lieu du synonyme utilisé et en vérifiant l’orthographe du terme utilisé. Dans le cadre des travaux de traduction le référentiel de terminologie multilingue assiste directement les traducteurs ou alimente les logiciels d’assistance à la traduction.

Aider à la recherche et à l’accès à l’information

Le référentiel terminologique de l’entreprise intervient de plusieurs manières pour assister les utilisateurs dans la recherche de l’information dans un intranet d’entreprise ou un site web :

  • en étendant automatiquement leurs recherches à des termes équivalents,
  • en proposant des axes de filtrage des informations,
  • en proposant des liens sur des sujets complémentaires ou reliés.

L’extension des recherches

Dans le cadre des recherches plein texte les utilisateurs utilisent leur propre vocabulaire sans connaître les termes réellement utilisés dans les documents. Une extension automatique des recherches sur les termes équivalents, synonymes, acronymes, références, codes ou des traductions de l’expression choisie par l’utilisateur permet au moteur de recherche de rendre un résultat complet à l’utilisateur qui n’a plus à tâtonner en cherchant désespérément les termes qui ont pu être utilisés pour décrire son sujet de recherche.

Les fonctions d’extension des recherches que l’on trouve dans la majorité des moteurs de recherche repose sur la fourniture régulière au moteur d’une terminologie métier à jour. Les terminologies à fournir au moteur peuvent être des listes de termes comprenant leurs synonymes, acronymes, codification mais aussi leurs traductions. Il est également possible en fournissant une organisation hiérarchique des termes de disposer d’une extension des recherches portant sur des sujets plus précis. Par exemple une recherche sur « activités nautiques » ou « sports nautiques » donnera comme résultat tous les documents parlant de « canoë », « kayak », « aviron ».

Recherche à facettes et taxonomies de navigation

L’accès à de grandes quantités de contenus ou produits dans un portail repose souvent sur une mise en place de taxonomies de navigation permettant de filtrer le contenus selon plusieurs axes : axe thématique, axe géographique, type d’utilisation… En s’appuyant sur un référentiel terminologique d’entreprise pour construire ces taxonomies de navigation, l’entreprise s’assure d’une homogénéité des termes utilisés et de leur organisation dans les différentes applications.

Les logiciels de gestion de terminologie d’entreprise permettent une gestion spécifique de ces taxonomies de navigation ainsi que leur publication vers les sites web et portails.

Liens

Les sujets de recherche des utilisateurs sont souvent connectés à d’autres sujets ou d’autres thématiques de l’entreprise. Une gestion des liens entre les termes et sujets de l’entreprise permet d’offrir des services à valeur ajoutée aux utilisateurs : aide à la recherche, valorisation de produits ou offres connexes, enrichissement automatique de la liste des résultats.

Les logiciels de gestion de terminologies permettent une gestion complète des relations entre les termes et sujet métier au sein d’une base de liens qui alimentera les moteurs de recherche et portail web à partir d’un référentiel unique. Les solutions de gestion de terminologies basée sur des ontologies permettront de plus d’inférer de nouveaux liens en fonction des demandes des utilisateurs (ex : trouver les liens entre le navire marchand décrit par l’utilisateur et les réglementations s’appliquant à ce navire précis).

Aider à la compréhension de l’information

Les termes techniques, les acronymes, les codifications utilisés dans les contenus publiés dans les intranets et sites web ne sont pas toujours simples à comprendre pour les employés, clients et partenaires. Pouvoir d’un simple clic de souris disposer d’une explication du terme ou de l’expression utilisé est un service à forte valeur ajoutée. L’utilisation d’un référentiel unique de terminologie contenant toutes les informations explicatives sur les termes, y compris une photo ou un schéma descriptif, permet de mettre ce service à disposition de toutes les applications d’accès aux contenus avec la garantie d’offrir une aide homogène et à jour.

Des outils spécifiques de text mining sont capables à la volée de reconnaître un terme ou une expression dans un texte et d’interroger le référentiel terminologique pour faire apparaître à l’écran une définition complète. Ces outils peuvent être alimentés automatiquement par le gestionnaire de terminologie de l’entreprise (ex : le logiciel Xelda de Temis).

Organisation de l’information

Les contenus créés au sein de l’entreprise, les contenus gérés dans les bases de données ou acquis de sources extérieures sont qualifiées et classés par différents attributs ou métadonnées : sujet, projet, produit, client, fournisseur, type de contrat, lieu, auteur, type, droits d’accès, droits de propriété…

Une gestion homogène des contenus et informations nécessite l’utilisation de référentiels communs dans l’entreprise.

Le gestionnaire de terminologie a ici la fonction de dictionnaire de métadonnées, capable de fournir aux différentes applications de gestion des référentiels complets et à jour pour la qualification des informations ou de fournir aux utilisateurs des services d’aide à la l’indexation des contenus.

Les services d’assistance à l’indexation peuvent, entre autre, faire une première analyse automatique du document et proposer à l’utilisateur une liste réduite de termes pour l’indexation de son document en fonction de sa thématique.

Text mining, extraction automatique de connaissances, liens et classification automatique des contenus

Les entreprises utilisent les outils de text mining et de classification automatique pour extraire de l’information de documents non structurés et pour automatiser leur classification. Ces outils linguistiques dépendent étroitement des vocabulaires métiers dont ils disposent pour repérer les informations pertinentes dans les documents. Leur mise à jour régulière avec les terminologies métier de l’entreprise leur permettent de rester pertinents pour identifier des noms de produits, technologies, molécules, concurrents, clients… dans les textes qui leur sont soumis.

Partager, échanger, inter-opérer

L’interopérabilité des systèmes est une problématique essentielle au sein d’une entreprise mais dans ses échanges avec ses partenaires, clients, autorités de régulation. L’interopérabilité repose à la fois sur mise en forme des informations échangées mais aussi sur l’alignement des référentiels utilisées.

Les logiciels de terminologies permettent en décrivant des référentiels hétérogènes et leurs correspondances, de transcoder automatiquement les contenus entrant et sortant facilitant ainsi l’automatisation des échanges.

Différentes organisations des terminologies pour différents besoins

Dans ce document nous avons désigné sous le terme générique de « Ressources Terminologies » l’ensemble des composants permettant d’identifier des termes ou sujets dans l’entreprise, de les décrire, de les organiser et de gérer leurs relations et leurs équivalences.

Nous tenterons maintenant de décrire de manière un peu plus fine les différents aspects de la gestion des ressources terminologiques dans l’entreprise en repartant de notions que sont les terminologies, listes contrôlées, thésaurus, taxonomies, ontologies.

Terminologie

La terminologie de l’entreprise est l’ensemble des mots ou expression métier désignant les différents concepts gérés dans l’entreprise. Les mots ou l’expression choisis pour désigner chaque concept dans une langue sont déclinés dans les différentes langues utilisées par l’entreprise ou l’organisation. Chaque terme peut faire l’objet d’une description plus ou moins complète comprenant le genre du mot, une définition, une image descriptive, un acronyme, des synonymes, des exemples d’utilisation dans différents textes.

La gestion d’une terminologie permet de rendre les services d’aide à la rédaction et à la compréhension des documents. Si la terminologie comprend les synonymes et traduction la terminologie pourra :

  • alimenter les moteurs de recherche pour l’extension des recherches sur les expressions équivalentes,
  • augmenter la fiabilité des logiciels d’assistance à la traduction,
  • alimenter les outils de text mining pour une meilleur reconnaissance des termes métier.

La terminologie métier est le socle pour toutes les organisations ultérieures de la terminologie de l’entreprise en fonction d’objectifs spécifiques comme l’assistance à la recherche, à la classification ou au filtrage des contenus dans les portails.

Thésaurus

Les thésaurus sont une organisation des termes entre eux (souvent nommés descripteurs dans les thésaurus). Une organisation hiérarchique des termes permet de passer du général au particulier (activité nautique > kayak, canoë, aviron) ou de relier des termes connexes (association du terme « alcool » au terme « alcoolisme »).

L’organisation hiérarchique des termes est utilisée :

  • pour aider à comprendre les relations entre les concepts utilisés
  • comme référentiel pour l’indexation des contenus par ajouts de métadonnées,
  • pour l’extension automatique des recherches vers des sujets plus détaillés dans un moteur de recherche,
  • comme base pour un système de classification automatique de contenus.

Les thésaurus existants ont souvent été conçus pour la l’indexation des contenus dans un environnement de gestion documentaire, leur organisation ne permet pas toujours de les utiliser tel quel pour l’extension des recherches ou pour la classification des contenus.

L’organisation des concepts dans un thésaurus est toujours spécifique à un métier ou un type d’utilisation. Dans des domaines complexes telles que la médecine de très nombreux thésaurus sont utilisés en fonction des différents contextes d’utilisation ou des différentes spécialisation de la médecine.

Listes d’autorité, Notices d’autorités, Référentiels

Ces différents termes recouvrent en général des listes de mots ou expression désignant des entités nommées : noms d’entreprises, de personnes, de produits, de lieux géographiques, de périodes historiques, de médicaments, de molécules, de codes anomalie…

Chaque liste comprend des objets de méme nature avec pour chaque objet un niveau de détail pouvant aller du terme à utiliser pour désigner l’objet (« BNP Paribas » et non « Banque Nationale de Paris »), à une description détaillée de l’objet comprenant ses acronymes, synonymes, traductions, définition, autres type d’identification (N° insee, EAN, ISBN…).

Les listes d’autorités ou référentiels rendent différents types de service : ils sont indispensables au text mining afin de l’aider à identifier les entités nommées trouvées dans les textes et connaitre leur nature, ils sont utiles pour l’extension des recherches dans les moteurs en fournissant les différentes désignations possibles de l’objet dans les documents, ils sont utiles pour les outils de traduction qui éviteront de proposer une traduction à des noms propres, ils sont utilisés dans les fonctions d’indexation des contenus comme dictionnaire de métadonnées, ils permettent aux fonctions d’interopérabilité et transcodification de passer automatiquement d’un système de codification à un autre (sous réserve d’avoir établis les correspondances entre les deux référentiels).

Taxonomies de classification & Plans de classement

Les taxonomies peuvent être des organisations très formelles de classes d’objets ou d’êtres vivants avec des applications les sciences de la vie, la biologie. Dans le domaine de la gestion du contenu, le mot de taxonomie est utilisé pour désigner un plan de classement ad hoc.

Exemple de taxonomie : plan de classement unique dans un système de gestion documentaire comprenant de nombreux niveaux et mélangeant des concepts et des noms propres

Contrat

Contrats internationaux

Client X1

Proposition

Contrat

Avenant

Client X2

….

Projet R&D

Projets collaboratifs

Projets européens

Projet P1

Proposition

Contrat

Suivi financier

Projet P2

Ce type de taxonomie ou plan de classement composé d’une seule hiérarchie repose sur un modèle de plan de classement indiquant le contenu des différentes branches et niveaux et les référentiels utilisés pour chaque niveau (thématique, lieux, liste client, liste projet, typologie des documents…). Les logiciel de gestion de terminologie permettent la génération et contrôle de ces taxonomies en fournissant les différents référentiels entreprise utilisés.

Taxonomies de navigation

Le terme de taxonomies peut également désigner un ou plusieurs listes hiérarchiques de sujets permettant de filtrer le contenu dans un site web ou un intranet. On parlera alors de taxonomies de navigation.

Exemple de taxonomies de navigation dans un site e-commerce

Types de produits

  • Electroménager
  • Hifi
  • Ordinateur

Marques

  • Sony
  • Philips
  • Acer

Utilisations

  • Entreprise
  • Profession libérale
  • Familiale

Les taxonomies de navigation sont souvent créées à partir de la terminologie métier de l’entreprise (parfois adaptée à la cible clientèle) et de listes de référence (noms de marques, noms de produits). Les taxonomies métier ont comme objectifs d’offrir un système simple et clair de filtrage des contenus sur un site web en utilisant plusieurs axes de filtrage. Ces taxonomies font parties des ressources terminologiques de l’entreprise.

Ontologies

La notion d’ontologie recouvre la plupart des notions décrites ci-dessus. L’ontologie a pour objectif dans un domaine métier donné, de disposer d’un ensemble de concepts métiers non ambigus et de leur organisation par des relations hiérarchiques ou des relations sémantiques. Une ontologie métier s’inscrit dans une modélisation qui permet de définir les classes de concepts (termes, personnes, projets, molécules, hébergements…), leurs attributs descriptifs (nom, acronyme, définition, taille, âge, date de début, localisation…) ainsi que les types de relations sémantiques pouvant les relier (est un sous concept de, travaille avec, est une filiale de, a une interaction médicamenteuse avec…). Une ontologie bien réalisée permet d’effectuer des inférences et du raisonnement automatisé (ex: trouver les sociétés produisant des molécules ayant une interaction médicamenteuse avec un des produits de la société X).

En raison de ses capacités de modélisation de différents organisation de termes, les ontologies offrent une grande souplesse pour gérer :

  • Des ressources terminologiques organisées sous forme de listes de référence, de thésaurus…
  • Des taxonomies de classification ou de navigation
  • Des représentations des connaissances en reliant les concepts métier par des relations sémantiques
  • Des relations d’équivalence ou de correspondance entre des référentiels devant être alignés pour des besoins d’interopérabilité

Laisser un commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :