Journal du Net > Solutions >  Celex diffuse les textes européens en 11 langues
Article
 
06/07/2000

Celex diffuse les textes européens en 11 langues

  Envoyer Imprimer  

Lancé en 1970 sous forme d'une base de données interne, ouvert dès 1979 sur l'extérieur via une liaison X-25, Celex est devenu depuis 1995 un extranet documentaire législatif. Dépendant de l'Opoce (Office des publications de la Commission Européenne), il représente un ensemble de 11 bases de 230.000 documents chacune, correspondant aux 11 langues parlées en Europe. Celex reprend l'ensemble des textes législatifs de l'Union Européenne qui paraissent au Journal Officiel de la Commission, ainsi que la jurisprudence des différentes instances comme le Comité Economique et Social, le Comité des Régions et la Cour de Justice des communautés européennes. Aujourd'hui réservée à environ 2.000 abonnés et plus de 20.000 utilisateurs, la base documentaire enregistre en moyenne plus de 300.000 connexions et 1,6 million de documents visualisés par mois. Elle s'adresse avant tout aux fonctionnaires des institutions européennes, les abonnés étant répartis entre des cabinets législatifs, des universités, des sites titulaires de licences pour la rediffusion des textes au sein de leur contenu, et des institutionnels des pays de l'Union. Parmi ces derniers, le secrétariat général du premier ministre français est l'un des plus importants utilisateurs.

Jusqu'en décembre 1999, date de la mise en production de la solution Doris d'Ever SA, Celex reposait sur la plate-forme Mistral sous G-COS 8. "Nous en étions satisfaits, mais le système était trop propriétaire", explique Sylvie Tarizzo-Thonier, responsable du projet Celex à l'Opoce. "Nous étions en contradiction avec la politique informatique de la Commission, qui préconise depuis plusieurs années le recours aux systèmes ouverts et à la plate-forme Unix. Il fallait donc migrer. Le choix de la DSI s'est d'abord porté sur Fulcrum pour la base documentaire, mais les essais se sont révélés non concluants, car la structure de la masse d'informations repose sur 120 ou 130 champs différents."

L'Opoce a donc opté pour la solution Doris de l'éditeur français Ever SA, jugée plus proche de Mistral dans son concept. La migration des bases de diffusion s'est étalée sur 9 mois, de septembre 1998 à fin juin 1999. Son coût total a représenté 1,3 million d'Euros, dont 600.000 à 700.000 Euros pour la partie liée à Ever SA. Le système documentaire global se compose exactement de 11 bases Doris et de deux instances Oracle 8.05, l'une pour les caractères grecs et l'autre pour les caractères romans. En clair, Doris s'appuie sur le moteur relationnel d'Oracle, qui ne joue pas ici un rôle de base de données. Sur le devant, un serveur d'application propriétaire développé en interne, du nom de Smart Gateway, gère les sessions et les contextes des interrogations, et s'occupe des relations entre Doris et les utilisateurs eux-mêmes. Les applications qu'il gère sont composées d'éléments graphiques en HTML et procéduraux en langage Perl. Les documents sont saisis au format XML dans les bases Doris qui, quant à elles, ont recours à son équivalent plus ancien ASN-1 développé par ISO. Pour les recherches, le moteur d'indexation Context de l'éditeur Oracle a été choisi au détriment de Topic, qui est intégré à Doris.

Côté architecture, l'ensemble des bases est hébergé sur un gros serveur Enterprise 10000 de Amdahl disposant d'un grand nombre de processeurs. Il fonctionne avec la plate-forme Unix Solaris de Sun et Netscape Enterprise Server en tant que serveur Web. "Le site est géré par une administration complexe", poursuit Sylvie Tarizzo-Thonier. "Derrière l'équipe réseau se trouve celle qui gère le site Web. Puis vient Celex, et derrière quelques serveurs proxy et pare-feux, l'utilisateur arrive chez nous. Nos serveurs de sessions gèrent les appels des utilisateurs. Si 800 personnes sont connectées, 55 serveurs seront à leur disposition pour leur répondre. Et nous pouvons ouvrir jusqu'à 350 connexions à Doris en simultané. Lorsque nous subissons des ralentissements, cela se situe donc au niveau des réseaux plutôt que de l'architecture."

Parmi les évolutions techniques que va connaître Celex, la norme UTF-8 devrait être retenue afin de regrouper les instances grecques et latines en une seule base. La migration vers Oracle 8i devrait apporter une meilleure intégration avec l'outil de requêtes Context. D'après Sylvie Tarizzo-Thonier, "cette évolution intervient dans l'optique d'autres adhésions à l'Union Européenne. Nous nous préparons ainsi à recevoir d'autres alphabets. Mais c'est surtout au niveau du contenu que nous allons évoluer." [François Morel, JDNet]


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Votre entreprise évolue-t-elle vers une informatique bimodale ?

Tous les sondages