Journal du Net > Solutions >  Kinomai apporte l'intelligence artificielle à l'indexation vidéo
Article
 
14/06/01

Kinomai apporte l'intelligence artificielle à l'indexation vidéo

  Envoyer Imprimer  

Parmi les petits acteurs innovants que l'on découvre cette année à l'occasion du salon NarrowCast, il est probable que l'on retiendra le nom de Kinomai. Fondée en novembre 2000 par l'ancien responsable marketing des produits grand public de Microsoft Olivier Duizabo, la structure a pris la forme d'une filiale de la société (au nom évocateur) Mathématiques Appliquées. On comprendra mieux dès lors l'activité de Kinomai : sa maîtrise de la recherche en matière d'intelligence artificielle la conduit à développer actuellement une solution d'encodage et d'indexation de contenus vidéo segmentés. Prévue pour entrer en phase commercialisation fin 2001, l'offre de Kinomai s'adressera aux chaînes et autres producteurs de télévision, aux vidéothèques, laboratoires et fonds d'archivage mais également aux prestataires spécialisés, par exemple dans l'e-learning.

Une technologie de "vision artificielle"...
Les quarante chercheurs que compte Mathématiques Appliquées travaillent sur des algorithmes jusqu'ici réservés à des applications militaires ou à des entreprises dans quelques secteurs de pointe. "Nous avons créé cette filiale pour appliquer à la télévision leur moteur d'intelligence articficielle", annonce tout simplement Olivier Duizabo. Le moteur de "vision artificielle" dont dispose aujourd'hui Kinomai rend possible "la classification d'une population d'images". Capable de déterminer ce qui est un visage ou non, l'outil détecte également les changements de plan, de décor, d'émission... Bien sûr, le logiciel en appelle parfois à l'assistance humaine mais on était -jusqu'à présent- plutôt habitué à l'inverse.

Les éditeurs de la société n'ont plus qu'à superviser le bon déroulement de l'interprétation que le moteur effectue à partir de tout contenu vidéo (Betacam, VHS, etc.) préalablement encodé au format Mpeg haute résolution. L'application intègre même des fonctions lui permettant d'apprendre, lorsqu'un utilisateur le souhaite, comment reconnaître un avion, par exemple : une démonstration suffit à constater qu'il est relativement aisé d'enrichir ainsi les capacités du moteur, en lui présentant un nombre important d'images et en l'assistant dans l'interprétation qu'il en fait.

... et d'analyse sémantique en temps réel
Mais cette technologie d'interprétation purement visuelle se combine, grâce à d'autres algorithmes, avec des technologies de reconnaissance vocale et d'OCR (reconnaissance de caractères) développées précédemment par d'autres sociétés. "Nous sommes en train de faire notre choix parmi les solutions existantes", indique à ce sujet Olivier Duizabo. Ainsi le moteur Kinomai optimise-t-il son interprétation de la vidéo en tenant compte de tous les éléments qu'il analyse et en les recoupant : "l'image du ballon dans les filets, le coup de sifflet de l'arbitre puis les cornes de brume et l'incrustation du score qui change permettent par exemple de repérer un but marqué au cours d'un match de foot", illustre le fondateur.

Divers travaux menés auprès de grands sites de média intéressés par le projet prouvent que l'outil dispose d'application toutes trouvées. "Nous transformons la vidéo en texte", explique Olivier Duizabo. Un moteur de recherche peut permettre de retrouver en ligne tous les extraits vidéo correspondant à la requête d'un utilisateur. Et la segmentation automatique en fonction des noms, des visages et des thèmes abordés à l'échelle d'un plan ou d'une séquence permettent de ne délivrer que des fichiers courts et pertinents, et non plus des vidéo entières telles que stockées à l'origine. Par ailleurs, le système peut ensuite proposer un gravage direct sur CD ou DVD-Rom ou encore tout type de lien, en fonction des bases de données auquelles il est connecté.

Dans la perspective d'équiper, "les décodeurs pour la télévision interactive de prochaine génération, dotés d'un disque dur, vers la fin 2002", espère Olivier Duizabo, la société proposera en novembre cette année "une solution incluant le soft et la station d'encodage". En effet, le contenu vidéo doit être encodé par Kinomai pour que la couche de "méta-données" correspondant à la description des contenus soit directement intégrée au fichier. La petite équipe de quinze personnes qui oeuvre toujours au développement de la technologie mise maintenant sur des améliorations en termes de "fonctions de personnalisation". Un projet à suivre...


JDN Solutions Envoyer Imprimer Haut de page

Sondage

Votre entreprise évolue-t-elle vers une informatique bimodale ?

Tous les sondages