L'automatisation du traitement des contenus passe par le Web sémantique

Infrastructure/Chantiers

L'automatisation du traitement des contenus passe par le Web sémantique

Fonctions de classification, de recherche, de navigation, dispositifs d'assistance à l'indexation... les applications du Web sémantique sont nombreuses et encore mal connues. (Mercredi 24 septembre 2003)

En savoir plus

Web sémantique

Actualité OWL: naissance d'un nouvel outil sur le terrain du Web sémantique

Notion encore peu connue dans l'entreprise, le Web sémantique joue traditionnellement le rôle d'un espéranto conçu pour permettre à différents systèmes de se comprendre mutuellement. Une méthode élaborée au sein de différents consortiums, dont le W3C, qui passe notamment par un couplage des informations délivrées (textes, images, etc.) à une couche de structuration standardisée au format XML.

"A l'origine cantonnée au monde de la gestion de contenus Web, l'indexation notamment, cette technologie commence à entrer petit à petit dans les entreprises, commente Jean Delahousse, PDG de la société de services Mondeca. Elle intéresse en premier lieu les sociétés faisant face à des problématiques de gestion de données métier pointues. C'est le cas notamment dans les secteurs industriels, juridiques et pharmaceutiques."

Des technologies de description et de classification
L'apport du Web sémantique à l'entreprise ? Il se place principalement sur le terrain de la gestion des connaissances (KM). "Concrètement, il dote les portails traditionnels, généralement basés sur des mécanismes d'indexation 'plein texte' (voir le questions / réponses), d'un niveau de modélisation (XML) supplémentaire contribuant à améliorer la pertinence de leurs fonctions de recherche et de classification", souligne le dirigeant.

Il est vrai que la boîte à outils du Web sémantique couvre plusieurs grands enjeux de la gestion documentaire : les ressources ontologiques (OWL) permettent de fournir aux portails un cadre général de catégorisation. Les meta données allouées aux documents (RDF) contribuent à améliorer les capacités d'analyse des modules de recherche, en les étendant par exemple aux requêtes multicritères et croisées. Enfin, le champs taxinomique (Topic Map) affine la structuration des objets manipulés, en décomposant par exemple les domaines d'une société en familles et sous-familles.

Une interface d'accès aux sources de données
Au total, ces différents éléments représentent le socle d'un serveur de connaissances : ils se placent entre l'interface utilisateur du portail et les diverses bases de l'entreprise, en vue de gérer efficacement l'accès aux informations métier, notamment en réduisant au maximum les effets de bruits (à savoir, les remontées de données non pertinentes).

Fonctions de classification, de recherche, de navigation intersujet et interdocument, dispositif d'assistance à l'indexation, espace de travail pour réexploiter les données extraites... les applications du Web sémantique sont nombreuses. En ligne de mire, elle vise toute l'automatisation du traitement des contenus.

Reste que la mise en oeuvre d'une telle solution peut paraître complexe. Un projet de ce type implique en effet un travail de fourmis autour de l'urbanisation des contenus de l'entreprise, sans compter les déploiements qui en découlent. "Mieux vaut commencer par un périmètre restreint dans un premier temps, le département juridique par exemple, puis étendre le chantier de façon itérative à d'autres domaines. Et surtout éviter les projets 'cathédrale', qui se révèlent souvent trop complexes à gérer, insiste Jean Delahousse. Dans la plupart des cas, l'entreprise dispose d'un existant (taxonomie, etc.) qui pourra servir de base de travail."

En savoir plus

Web sémantique

Actualité OWL: naissance d'un nouvel outil sur le terrain du Web sémantique

La fidélité aux standards
Conclusion : il est conseillé de vérifier la compatibilité des applications retenues dans le cadre d'un projet de portail avec les standards recommandés par le W3C en matière de Web sémantique.

"Parmi les produits fidèles à ces langages XML, on compte notamment l'application de gestion de contenu de Documentum, les outils de gestion électronique de documents d'Adobe ou encore la plate-forme applicative d'Oracle", indique-t-on chez Mondeca.

[Antoine Crochet-Damais, JDNet]

Accueil | Haut de page

Nouvelles offres d'emploi sur Emploi Center

Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY