France 24 rend accessible son patrimoine multimédia

Lancée en 2006, la chaîne dispose déjà de 100 Tera de données. Un capital qui pour être exploité nécessite d'adosser à la production un système d'archivage pour son indexation et la recherche documentaire.

Chaîne trilingue (français, anglais, arabe) d'information internationale en continue lancée en 2006, France 24 diffuse ses programmes à la fois à l'antenne et sur Internet grâce à une équipe de plus de 520 collaborateurs, dont 260 journalistes. Le système d'information de France 24 repose sur une brique centrale : son infrastructure de production.

Celle-ci a été conçue au démarrage pour sa capacité à centraliser et fournir en temps réel des contenus vidéo en haute résolution. La chaîne française dispose en effet de plus de 100 Tera de données. Un volume colossal de données qui se heurte aux limites d'un système de production pour lequel l'archivage n'est pas natif. Ce besoin débouche rapidement sur un projet d'évolution du système d'information.

"Sur un plan technique, mais aussi documentaire, disposer d'un véritable système d'archivage permettant d'indexer notre patrimoine éditorial était indispensable. Notre système de production ne comportait en effet pas de fonctions avancées d'indexation et de recherche documentaire. Dès mars 2007, France 24 a essayé de cerner son besoin en termes de fonctionnalités documentaires et techniques", explique Stéphane Kersulec, responsable de l'ingénierie pour France 24.

Fonctionnalités du système : reconnaissance vocale et de texte dans l'image, découpage automatique de scène...

Après notamment une étude avec les utilisateurs (documentalistes et journalistes), un cahier des charges est rédigé. France 24 pose comme exigences du système sa fiabilité en matière de sauvegarde des données et son efficacité en restauration afin que les images, centralisées, puissent être restaurées en production et exploitables par les journalistes. D'un point de vue documentaire, les fonctionnalités attendues sont des capacités étendues d'indexation et de recherche.

Compte tenu des spécificités de son métier, France 24 recherche également une société compétente à la fois dans le domaine audiovisuel et documentaire. C'est finalement le couple Avid (intégrateur déjà du système de production) et l'éditeur Autonomy qui est retenu. Sans être des pré-requis, certaines innovations technologiques, comme la reconnaissance vocale et de texte dans l'image, ainsi que le découpage automatique de scène ont pesé en faveur des solutions d'Autonomy.

En juillet, la DSI et ses prestataires s'attèlent à la personnalisation de l'interface afin d'adapter au mieux celle-ci aux besoins des utilisateurs (champs, catégorisation, interface de recherche, ...). "Nous souhaitions que pour les journalistes, la consultation de la base archive se fasse le plus naturellement possible. Cela passait par la simplicité et l'intuitivité de l'interface, le look and feel. Une recherche simple se présente ainsi comme une opération sur les moteurs de recherche standards d'Internet, en saisissant juste quelques mots pour obtenir les résultats du moteur IDOL d'Autonomy", précise Stéphane Kersulec.

Le mois suivant peut débuter l'étape d'intégration, dont celle majeure avec le robot-cassettes d'archive. Cet outil assure le stockage des fichiers, jusqu'à 30 000 heures de médias. Cette intégration entre la solution d'indexation et le robot passe par des développements spécifiques. La validation technique débute ensuite, en septembre 2007.

Afin d'offrir une sécurisation maximum du système, l'architecture est redondée

L'architecture matérielle et logicielle comprend un serveur dédié à l'interface Web, un serveur pour le moteur de recherche IDOL et une base de données documentaire en MySQL. Diffusant en trois langues, France 24 a choisi de déployer trois serveurs Video Logger pour l'indexation automatique. Afin d'offrir une sécurisation maximum du système, cette architecture est redondée.

Le nouveau système d'archivage permet notamment de déposer une vidéo en haute définition sur le robot-cassettes et de créer automatiquement une vidéo basse résolution consultable depuis Autonomy. De multiples opérations sont également automatisées pour les documentalistes, avant même l'indexation manuelle, comme la création d'une fiche documentaire, d'un story board par reconnaissance de scène ou encore du contenu texte récupéré automatiquement par reconnaissance vocale.

Reste néanmoins l'épineuse question de l'existant. De nombreux Tera de données doivent en effet encore être eux aussi indexés dans la nouvelle solution. Compte tenu de l'ampleur de la tâche, France 24 a fait le choix de se concentrer uniquement sur les médias identifiés comme les plus importants. Le rattrapage de l'antériorité aura toutefois permis en pré-production (novembre-décembre 2007) de réaliser des tests avant la mise en production, en janvier 2008.

Après un an d'exploitation de cette solution, France 24 va intégrer une nouvelle fonctionnalité à l'application et qui n'avait pu être prise en compte de manière approfondie à l'origine : la gestion des droits. La chaîne d'information diffuse en effet un certain nombre d'images d'agences. Or des droits limités, notamment dans le temps, peuvent être associés à ces images. L'intégration de la gestion des droits, via un système d'alertes automatiques et éventuellement de blocages de contenu, facilitera le travail des documentalistes en termes de suivi de droit de chaque image.

 

Le projet en bref
Source : JDN Solutions
EntrepriseFrance 24
Editeur retenuAutonomy
IntégrateurAvid
Lancement du projet2007

Serveurs / Indexation