L'Université de Technologie de Compiègne (UTC) s'invite dans le monde de la gestion
de contenu documentaire à travers sa solution Open Source Scenari.
Ce logiciel, disponible sous les licences CECILL, MPL, GNU
et LGPL, surprend par son approche modulaire, fruit des différents
travaux de recherche réalisés pour des industriels clients.
"Ce projet est né en 1999, à la demande de la société Axa. Pour son centre de formation AEA, Axa avait besoin de numériser un volume de contenus de 20 000 pages. Il fallait que cette numérisation permette l'impression de ces informations, mais aussi pouvoir le réutiliser dans le cadre d'un programme de e-learning", déclare Stéphane Crozat, enseignant chercheur à l'Unité d'Innovation "Ingénierie des Contenus et Savoir" de l'UTC.
Partant
de ce besoin, l'équipe de l'UTC développe une chaîne XML
séparant le contenu de son mode de traitement de manière à pouvoir
indifféremment réutiliser l'information pour de l'impression,
un site internet, un intranet,
un export en document bureautique (OpenOffice ou PDF), Flash
ou RSS. Le projet intéresse ensuite d'autres acteurs comme la
SNCF ou Peugeot, et passe d'un traitement de contenu purement
pédagogique à tout type de contenu.
Le moteur s'est peu à peu enrichi et supporte désormais la mise en place de règles. Il est ainsi possible de spécifier un schéma documentaire qui correspond à l'organisation du document, à la validation des données saisies (format, taille). "Contrairement à un outil de gestion de contenu traditionnel, où l'on va associer le contenu à une mise en forme, Scenari associe un sens au contenu, c'est-à-dire une intention de communication particulière", ajoute Stéphane Crozat.

L'architecture du logiciel Scenari
Un peu à la manière des CSS
sur Internet, Scenari applique des règles au contenu qu'il a
précédemment balisé. Mais ces règles ne servent pas uniquement
à la couche présentation, elles peuvent changer l'ordre des
éléments d'un document ou changer ses règles. Une fois le contenu
saisi, une modification dans l'algorithme est indépendante du
volume de l'information.
Pour simplifier le travail de l'utilisateur, une interface d'édition XML a été développée à partir des technologies Mozilla XUL. A travers un navigateur Web, les clients produisent leur propre contenu, ou modifient l'existant. Pour générer un document Flash ou OpenOffice, le logiciel cible doit être présent sur la machine.
Des modèles prédéfinis sont disponibles pour accélérer le travail de modélisation |
"Scenari se base sur des primitives codées en Java.
Cette base du logiciel réalise des choses très génériques comme
éditer une image, la redimensionner, saisir du texte, structurer
ce texte et organiser un document. Nous sommes par exemple en
train de finaliser une nouvelle primitive pour le traitement
du son pour l'INA", explique Stéphane Crozat.
En l'état, ces primitives ne suffisent pas à faire fonctionner l'algorithme du logiciel. Elles ont besoin de la couche supérieure, appelée Scenari Builder, qui déclare comment vont se comporter ces fonctions dans un contexte particulier et définissant les balises et leur comportement. C'est ici que se concentre l'intelligence du produit, concrétisée par des modèles de document définis soit par l'utilisateur, soit par l'expert Scenari Builder.
"Nous recréons un schéma en fonction de chaque contexte. Les gens montrent leurs documents et à partir de cette information nous créons notre modèle de balises. Dans la pratique toutefois, nous avons développé une vingtaine de contextes différents réutilisables en fonction des clients", précise l'enseignant chercheur de l'UTC.
|