La taxonomie pour éviter le cagibi de l’oubli

Le terme taxonomie désigne une méthode de classification des informations dans une architecture évolutive. Le terme est couramment employé dans le cadre des systèmes de gestion de contenu. Mais quels sont ses secrets ?

Le terme taxonomie (taxonomy en anglais) désigne une méthode de classification des informations dans une architecture évolutive. Le terme est couramment employé dans le cadre des systèmes de gestion de contenu (CMS). Vous avez sûrement déjà entendu parler de taxonomie pour l'organisation des contenus d'un site. Mais c'est quoi concrètement ?

Côté client (MOA) la taxonomie sert à centrer les informations sur le client (user-centered). Côté informatique (MOE) la taxonomie sert à organiser hiérarchiquement les informations.

Nous pouvons donc considérer la taxonomie comme l'instrument de base (ou le dictionnaire) pour faire communiquer la MOA avec la MOE. En réalité, nous vivons aujourd'hui dans un monde où la quantité d'information disponible augmente rapidement et avoir trop d'informations revient souvent à ne pas avoir d'information. L'importance d'organiser correctement les informations, pour pouvoir ensuite les retrouver, a bien été comprise par le créateur de l'HTML. Aujourd'hui, Tim Berners-Lee travaille sur l'ambitieux projet du Web sémantique (connu aussi sous l'acronyme W3C).

Son projet vise à rendre le contenu des ressources en ligne plus accessible, et donc, utilisable. Vous le savez : un des meilleurs effets qu'on peut obtenir avec une connaissance détaillée des informations de l'entreprise est d'augmenter le retour sur investissement (ROI).

Très souvent, j'étais confronté au dilemme des libellés. Dans la première réunion, pour la création d'un site web, le client veut définir immédiatement les points d'entrés de la page d'accueil et il commence à énumérer les catégories. Une fois les rubriques créées, il s'applique à les remplir avec les contenus de son entreprise. Morale : il y a toujours des documents qui n'arrivent pas à être classés et donc ils sont « garés » dans la catégorie « non classé ».

Regardez votre site web ou votre intranet. Si vous retrouvez des points d'entrés génériques alors cela signifie qu'il n'y a pas eu d'étude sur l'architecture de l'information : vous avez créé le « cagibi de l'oubli ». Votre entreprise utilisera cet espace pour stocker tout ce qu'elle n'arrive pas à classer. À mesure, les navigateurs ne trouveront plus les informations (ou les pages) stockées dans le « cagibi ». Plus l'entreprise est importante, plus cet espace devient inutilisable.

La perte économique devient donc énorme :

•    l'entreprise ne partage pas les informations (et donc la connaissance) correctement.
•    le travail et l'argent nécessaire pour produire ses informations sont gâchés.

Tout ça pour ne pas avoir pris le temps de travailler à la taxonomie. Je me rappelle encore le concept de base d'un livre publié en 1997 : Intranet Bible (Lynn M. Bremner, Anthony F. Iasi, Al Servati). Le concept était simple : un intranet doit être conçu comme un iceberg ; nous ne voyons pas l'information submergée (90%), mais seulement l'information publiée (10%).

Je me suis toujours efforcé d'appliquer ce principe à mes conceptions pour les intranets, les extranets et les sites web. Afin que l'iceberg puisse vivre, la partie submergée doit alimenter et régénérer la partie visible ; de la même façon, l'information invisible doit alimenter l'information visible. Si au contraire on imagine créer un intranet de « publication » où l'information n'est pas générée automatiquement, alors nous n'avons pas un intranet-iceberg, mais une plaque de glace qui va fondre très rapidement.

Mais quelle approche pour une étude taxonomique ?

Il y a des approches statistiques (ou quantitatives) et des approches hiérarchiques (ou qualitatives/logiques). Grâce à la taxonomie statistique, où la hiérarchie est créée selon la récurrence des mots-clés, nous pouvons visualiser les grandes familles des concepts par rapport aux métiers. Je trouve que cette approche peut générer des « croyances erronées ».

Imaginez de lister tous les objets de votre maison et de trier cette liste par récurrence (en partant du principe que les objets les plus fréquents sont les plus importants) cette liste par récurrence (soit les objets plus fréquents sont les plus importants). Vous trouverez que les objets indiqués comme les plus importants sont, en fait, des objets relativement peu importants comme les cure-dents, cotons-tiges, clous, etc. Au contraire, des objets fondamentaux dans la vie quotidienne, seront placés à la fin de la liste. Mais pourriez-vous vivre sans un frigo ?

Je suis relativement pour la taxonomie hiérarchique, qui permet de classer les informations par ordre logique. Une taxonomie hiérarchique nous permettra ensuite de créer rapidement la navigation et d'en choisir les libellés permettra après de créer rapidement la navigation et choisir les libellés ; en même temps, cette organisation permettra à l'utilisateur d'accéder à l'information recherchée en suivant un parcours rationnel.

La taxonomie est fluide et évolutive. Après avoir travaillé sur la taxonomie, hors de question de l'abandonner à elle-même. La taxonomie doit être comme une langue, donc évoluer avec le temps. Sinon nous aurons une taxonomie qui parle en latin et une entreprise qui travaille en français.

Le résultat final d'une étude taxonomique sera :

•    Une charte pour la gouvernance taxonomique ;
•    Une formation régulière pour la maintenance taxonomique ;
•    Un changement dans l'organisation de l'entreprise (pour que ça marche il faut bien mettre les moyens à disposition !).

En définitive, il faut :

1.    Collecter toutes les informations ;
2.    Essayer de les classer (en utilisant la méthode du « card sorting ») ;
3.    Donner des libellés aux groupes d'information ;
4.    Etudier le cycle de vie des informations ;
5.    Mettre en place les procédures de maintenance de l'information ;
6.    Créer la gouvernance ;
7.    Former le « pôle taxonomie ».

Cela paraît aisé mais de vrais problèmes apparaissent pendant le « card sorting ». Comment classer les informations ? En réalité, nous ne pouvons pas les classer, car nous ne connaissons pas les utilisateurs, donc nous les classons selon notre « vision du monde » (ou selon le langage spécifique de l'entreprise).

Comment éviter ça ?

En répondant à diverses questions de base, mais très difficiles à poser au client :
1.    A quoi sert votre intranet (Extranet / site web) ?
2.    Voulez-vous communiquer, vous protéger, imiter les autres ou collaborer ?
3.    Avez-vous défini les profils de base des utilisateurs ?

À quoi sert votre intranet/extranet/site Web ?

Ça semble être une question limpide, mais souvent elle reste sans réponse. Un intranet, par exemple, peut servir pour communiquer verticalement (avec des actualités) et donner l'accès à d'autres sites de l'entreprise (fonction Portail). Mais pas seulement ! Il peut également, être votre système de diffusion de la connaissance complètement intégré à la vision du « knowledge management ». En réalité, un intranet (comme un site web) doit être le reflet de la philosophie de l'entreprise. Pas de philosophie distincte ? Vos sites seront « quasi » inutiles.

Communiquer, se protéger, imiter, collaborer ?

Vos sites ont été construits pour fournir un service réel à vos clients ou pour « flatter votre ego » et vous mettre à l'abri ? Oui, la « valorisation de la vanité » est le risque majeur dans la construction d'un site. Je fais un site I-NU-TI-LI-SABLE pour parler de moi et, en même temps, publier les protections légales (comme le CGV - Conditions Générales de Vente) sur chaque page. Mais . . . je ne vends pas de produit, je ne génère pas d'argent et en plus je me fais détester par mes collaborateurs.

Avez-vous défini les profils de base des utilisateurs ?

Les utilisateurs d'un site n'ont pas le même profil que les responsables qui ont commandé sa création. Je conseille d'utiliser toujours la technique des « personas » avant de commencer une conception (et là je ne parle pas que du web).

En conclusion, combien de mots doit-on utiliser pour créer une taxonomie suffisamment granulaire ? Pas beaucoup. La puissance d'une taxonomie multi-facettes est qu'avec 4 catégories indépendantes de 10 noeuds chacune, on a la même puissance qu'une hiérarchie à 10000 noeuds. De plus, la taxonomie multi-facettes est :

•    Plus simple à maintenir ;
•    Plus simple à étiqueter ;
•    Plus simple à naviguer.

Conclusion philosophique.

Les taxa (en singulier taxon ou unité taxonomique) sont les entités conceptuelles qui sont censées regrouper tous les informations possédant en commun certains caractères taxinomiques. Or en biologie le statut ontologique des taxa est encore mis en discussion par la philosophie de la biologie, principalement par le nominalisme (qui nie l'existence réelle des taxa en nature) et l'essentialisme (qui au contraire en affirme l'existence).

En jargon informatique, nous utilisons les termes libellés, et nous essayons de classer les informations selon notre vision philosophique du monde (ou simplement notre conception de rangement). Pour arriver à une taxonomie réellement correcte de l'information, il faudra partir du « spectateur ». Un exemple : en biologie (considérée comme la vraie partie de la taxonomie), nous classifions les animaux selon une taxonomie « globale ». Donc un chat est du même ordre qu'un chien : les carnivores. Ils font partie de deux familles différentes : les canidés et les félidés. Etc.
Mais si on prend le point de vue du chat, dans sa taxonomie « de proximité », le chien est (souvent) l'ennemi et une souris est son repas.

Donc pour créer une taxonomie de l'information efficace, il faudra travailler sur la proximité (en utilisant la technique des Personas) plutôt que d'essayer d'appliquer une taxonomie « globale » de l'information. Si vraiment nous ne voulons pas réfléchir et travailler sur la proximité, alors je conseille au moins d'utiliser la « Corporate taxonomy » ou « Taxonomie d'entreprise ». Seul point faible, c'est onéreux.