Positionné sur le terrain
de la consolidation de contenu XML, Xyleme
adosse son offre à une base de données couplée
à diverses fonctions d'intégration, mais
également de recherche et de catégorisation.
Lancé en septembre
2000,
cet éditeur français -qui compte aujourd'hui
25 salariés dont 13 sont dédiés aux
activités de développement- tire sa technologie
d'un projet initié par
l'INRIA
(Institut National de la Recherche en Informatique et
en Automatique). Au total, la solution aurait fait l'objet
de 60 années/homme de recherche et développement.
"Elle cherche à exploiter au mieux toutes
les fonctions de ce langage de description -notamment
ses capacités dans le domaine de l'exploitation
sémantique, lance Régis Nacfaire, PDG de Xyleme.
A l'heure de l'explosion des formats et des normes XML
métier, notre ligne de produits vise en particulier
à fournir de manière abstraite des vues
homogènes de contenus XML hétérogènes."
Partant de cette problématique, Xyleme cible l'ensemble
des domaines faisant face à des projets de traitement
d'informations. Elle vise notamment le secteur de l'édition,
mais également les domaines gouvernemental, juridique
et financier. Parmi ses tout premiers clients figurent
l'AFP, NetBooster ou encore la Bibliothèque Nationale
de France.
Un entrepôt
de documents au format XML
La plate-forme de Xyleme
s'articule autour d'une base de données archivant l'ensemble
des documents XML manipulés. En amont, un module
de butinage et un agent de collecte assurent respectivement
le repérage et le chargement de contenus XML stockés
sur des serveurs Web distants. Une fois rapatriés, ceux-ci
sont indexés. Une opération qui permet ensuite aux utilisateurs
finaux d'effectuer des recherches via un système de
requêtage, mais aussi d'être alertés des nouvelles entrées
susceptibles de les intéresser.
Parallèlement, un outil de traitement sémantique assure
la création de liens personnalisés entre contenus ou
balises XML basés sur des vocabulaires différents (ou
DTD). Un mécanisme qui au total contribue à agréger
données et structures XML au sein de vues homogènes.
"Suite à un paramétrage spécifique, l'outil peut ainsi
repérer que le nom d'une société apparaissant dans une
fiche d'identité correspond à celui d'un fournisseur
dans une autre", pointe pour l'exemple Sophie Cluet,
directrice recherche et développement à l'INRIA. Côté
client, l'ensemble des fonctions de la solution (interrogation,
etc.) sont publiables sous forme de Services Web par
le biais d'une interface de programmation d'applications
SOAP (Simple Object Access Protocol).
Au côté
du module sémantique, l'originalité de
la plate-forme se situerait dans son outil de butinage
et son entrepôt de données. "Le premier
définit la fréquence de lecture des pages
distantes à la fois en fonction de leur degré
de référencement, de l'évolution
des contenus et du besoin des utilisateurs. Quant au
second, il s'adapte directement à la structure
des documents XML qu'il contient en vue d'indexer données
et balises -et ceci selon un taux d'expansion situé
entre 0,4 et 0,7 ", insiste-t-on chez Xyleme.
Une
offre de solutions verticalisée
Hormis le
module de collecte, l'ensemble des outils de Xyleme
est diffusé en licence définitive. Tournant
sur une architecture Linux, la logique applicative qui
est développée en C++ s'appuie sur les
protocoles SOAP et HTTP pour traiter les transactions
Internet, et sur le bus Corba pour gérer les
communications inter-applicatives. Le tout accompagné
de mécanismes de répartition des composants
sur diverses grappes de machines. "Au côté
d'une édition standard (Xyleme Zone), nous proposons
également des déclinaisons verticalisées telle
que Xyleme News -qui s'adressent aux domaines du journalisme
et de la documentation", complète Régis
Nacfaire.
|