14/06/01
Kinomai
apporte l'intelligence artificielle à l'indexation vidéo
Parmi les petits acteurs innovants
que l'on découvre cette année à l'occasion
du salon NarrowCast, il est probable que l'on retiendra
le nom de Kinomai.
Fondée en novembre 2000 par l'ancien responsable
marketing des produits grand public de Microsoft Olivier
Duizabo, la structure a pris la forme d'une filiale de
la société (au nom évocateur) Mathématiques
Appliquées. On comprendra mieux dès lors
l'activité de Kinomai : sa maîtrise
de la recherche en matière d'intelligence artificielle
la conduit à développer actuellement une
solution d'encodage et d'indexation de contenus vidéo
segmentés. Prévue pour entrer en phase commercialisation
fin 2001, l'offre de Kinomai s'adressera aux chaînes
et autres producteurs de télévision, aux
vidéothèques, laboratoires et fonds d'archivage
mais également aux prestataires spécialisés,
par exemple dans l'e-learning.
Une
technologie de "vision artificielle"...
Les quarante
chercheurs que compte Mathématiques Appliquées
travaillent sur des algorithmes jusqu'ici réservés
à des applications militaires ou à des entreprises
dans quelques secteurs de pointe. "Nous avons créé
cette filiale pour appliquer à la télévision
leur moteur d'intelligence articficielle", annonce
tout simplement Olivier Duizabo. Le moteur de "vision
artificielle" dont dispose aujourd'hui Kinomai rend
possible "la classification d'une population d'images".
Capable de déterminer ce qui est un visage ou non,
l'outil détecte également les changements
de plan, de décor, d'émission... Bien sûr,
le logiciel en appelle parfois à l'assistance humaine
mais on était -jusqu'à présent- plutôt
habitué à l'inverse.
Les éditeurs de la société n'ont
plus qu'à superviser le bon déroulement
de l'interprétation que le moteur effectue à
partir de tout contenu vidéo (Betacam, VHS, etc.)
préalablement encodé au format Mpeg haute
résolution. L'application intègre même
des fonctions lui permettant d'apprendre, lorsqu'un utilisateur
le souhaite, comment reconnaître un avion, par exemple :
une démonstration suffit à constater qu'il
est relativement aisé d'enrichir ainsi les capacités
du moteur, en lui présentant un nombre important
d'images et en l'assistant dans l'interprétation
qu'il en fait.
... et d'analyse sémantique
en temps réel
Mais cette technologie
d'interprétation purement visuelle se combine,
grâce à d'autres algorithmes, avec des technologies
de reconnaissance vocale et d'OCR (reconnaissance de caractères)
développées précédemment par
d'autres sociétés. "Nous sommes en
train de faire notre choix parmi les solutions existantes",
indique à ce sujet Olivier Duizabo. Ainsi le moteur
Kinomai optimise-t-il son interprétation de la
vidéo en tenant compte de tous les éléments
qu'il analyse et en les recoupant : "l'image
du ballon dans les filets, le coup de sifflet de l'arbitre
puis les cornes de brume et l'incrustation du score qui
change permettent par exemple de repérer un but
marqué au cours d'un match de foot", illustre
le fondateur.
Divers travaux menés auprès de grands sites
de média intéressés par le projet
prouvent que l'outil dispose d'application toutes trouvées.
"Nous transformons la vidéo en texte",
explique Olivier Duizabo. Un moteur de recherche peut
permettre de retrouver en ligne tous les extraits vidéo
correspondant à la requête d'un utilisateur.
Et la segmentation automatique en fonction des noms, des
visages et des thèmes abordés à l'échelle
d'un plan ou d'une séquence permettent de ne délivrer
que des fichiers courts et pertinents, et non plus des
vidéo entières telles que stockées
à l'origine. Par ailleurs, le système peut
ensuite proposer un gravage direct sur CD ou DVD-Rom ou
encore tout type de lien, en fonction des bases de données
auquelles il est connecté.
Dans la perspective d'équiper, "les décodeurs
pour la télévision interactive de prochaine
génération, dotés d'un disque dur,
vers la fin 2002", espère Olivier Duizabo,
la société proposera en novembre cette année
"une solution incluant le soft et la station d'encodage".
En effet, le contenu vidéo doit être encodé
par Kinomai pour que la couche de "méta-données"
correspondant à la description des contenus soit
directement intégrée au fichier. La petite
équipe de quinze personnes qui oeuvre toujours
au développement de la technologie mise maintenant
sur des améliorations en termes de "fonctions
de personnalisation". Un projet à suivre...
|