L'automatisation
du traitement des contenus passe par le Web sémantique
Fonctions de classification, de recherche, de navigation, dispositifs d'assistance à l'indexation... les applications du Web sémantique sont nombreuses et encore mal connues. (Mercredi 24 septembre
2003)
Notion encore peu connue dans
l'entreprise, le Web sémantique joue traditionnellement
le rôle d'un espéranto conçu pour
permettre à différents systèmes de
se comprendre mutuellement. Une méthode élaborée
au sein de différents consortiums, dont le W3C,
qui passe notamment par un couplage des informations délivrées
(textes, images, etc.) à une couche de structuration
standardisée au format XML.
"A l'origine cantonnée au monde de la gestion
de contenus Web, l'indexation notamment, cette technologie
commence à entrer petit à petit dans les
entreprises, commente Jean Delahousse, PDG de la société
de services Mondeca. Elle intéresse en premier
lieu les sociétés faisant face à
des problématiques de gestion de données
métier pointues. C'est le cas notamment dans les
secteurs industriels, juridiques
et pharmaceutiques."
Des
technologies de description et de classification L'apport du Web
sémantique à l'entreprise ? Il se place
principalement sur le terrain de la gestion des connaissances
(KM). "Concrètement, il dote les portails traditionnels,
généralement basés sur des mécanismes
d'indexation 'plein texte' (voir le questions
/ réponses), d'un niveau de modélisation
(XML) supplémentaire contribuant à améliorer
la pertinence de leurs fonctions de recherche et de classification",
souligne le dirigeant.
Il
est vrai que la boîte à outils du Web sémantique
couvre plusieurs grands enjeux de la gestion documentaire :
les ressources ontologiques (OWL) permettent de fournir
aux portails un cadre général de catégorisation.
Les meta données allouées aux documents
(RDF) contribuent à améliorer les capacités
d'analyse des modules de recherche, en les étendant
par exemple aux requêtes multicritères et
croisées. Enfin, le champs taxinomique (Topic Map)
affine la structuration des objets manipulés, en
décomposant par exemple les domaines d'une société
en familles et sous-familles.
Une
interface d'accès aux sources de données Au total, ces différents
éléments représentent le socle d'un
serveur de connaissances : ils se placent entre l'interface
utilisateur du portail et les diverses bases de l'entreprise,
en vue de gérer efficacement l'accès aux
informations métier, notamment en réduisant
au maximum les effets de bruits (à savoir, les
remontées de données non pertinentes).
Fonctions de classification, de recherche, de navigation
intersujet et interdocument, dispositif d'assistance à
l'indexation, espace de travail pour réexploiter
les données extraites... les applications du Web
sémantique sont nombreuses. En ligne de mire, elle vise
toute l'automatisation du traitement des contenus.
Reste que la mise en oeuvre d'une telle solution peut
paraître complexe. Un projet de ce type implique
en effet un travail de fourmis autour de l'urbanisation
des contenus de l'entreprise, sans compter les déploiements
qui en découlent. "Mieux vaut commencer par
un périmètre restreint dans un premier temps,
le département juridique par exemple, puis étendre
le chantier de façon itérative à
d'autres domaines. Et surtout éviter les projets
'cathédrale', qui se révèlent souvent
trop complexes à gérer, insiste Jean Delahousse.
Dans la plupart des cas, l'entreprise dispose d'un existant
(taxonomie, etc.) qui pourra servir de base de travail."
La fidélité
aux standards Conclusion :
il est conseillé de vérifier la compatibilité des applications
retenues dans le cadre d'un projet de portail avec les
standards recommandés par le W3C en matière de Web sémantique.
"Parmi les produits fidèles à ces langages XML, on compte
notamment l'application de gestion de contenu de Documentum,
les outils de gestion électronique de documents
d'Adobe ou encore la plate-forme applicative d'Oracle",
indique-t-on chez Mondeca.