Coach d'IA, le nouveau métier en vogue chez les start-up

Spécialisées dans la reconnaissance d'images, les start-up Angus.ai et Heuritech ont dû tout apprendre à leurs algorithmes. Voici comment elles s'y sont prises.

Pour devenir sagace, une IA a besoin d'un entraînement solide. Comment opèrent les start-up du secteur pour réussir cette gymnastique logicielle, alors qu'elles n'ont, contrairement aux Gafa, que des moyens limités pour rendre leurs solutions d'IA perspicaces ?

Fondée en avril 2015 à Paris par deux ingénieurs qui ont fait leurs armes chez Softbank Robotics, où ils ont développé les cerveaux des robots Nao et Pepper, Angus.ai a développé une solution de mesure d'audience capable d'analyser en direct le flux vidéo d'une caméra de surveillance installée dans les rayons d'un magasin, de donner le sexe et l'âge des prospects... "Si un chaland hésite entre deux téléviseurs et qu'il n'y a pas de vendeur dans les parages, nous envoyons immédiatement une notification au commerçant pour qu'il fasse le nécessaire", explique Gwennael Gate, cofondateur de la jeune pousse qui travaille notamment avec les Galeries Lafayette.

Pour entraîner ses algorithmes, Angus.ai a utilisé des jeux de 10 000 à 100 000 photos annotées mises à disposition en ligne par la communauté scientifique

Pour développer son IA, commercialisée depuis décembre 2016, Angus.ai a combiné douze algorithmes à partir de lignes de code disponibles en open source sur le net. "Nous avons utilisé les environnements de développement OpenCV, Theano et Tensorflow", détaille le polytechnicien.

Ces briques d'intelligence artificielle sont divisées en deux catégories. Les premières ont été entraînées pour identifier des formes données sur une image. Elles analysent les films des caméras de surveillance un cliché après l'autre. Chaque algorithme travaille sur une fonction précise : reconnaître la présence d'une personne humaine, savoir si c'est un homme ou une femme, déterminer son âge, comprendre s'il sourit, identifier où est dirigé son regard…

Les briques de la seconde catégorie permettent de relier les photos entre elles temporellement. Elles pistent les formes d'une image à l'autre dans un film et permettent au logiciel de comprendre qu'un enfant présent sur une image puis caché par une personne corpulente sur la suivante, ne s'est pas évaporé. Grâce à ces algorithmes, le bambin n'est pas oublié dans le compte des personnes présentes dans le champ de la caméra.

Pour entraîner chacun des algorithmes appartenant à la première division, Angus.ai a utilisé des jeux de 10 000 à 100 000 photos mises à disposition en ligne par la communauté scientifique. Pourquoi ne pas utiliser simplement des clichés extraits de Google Images ? "Car nous avons besoin de photographies annotées de façon précise et que celles regroupées par Alphabet ne le sont pas. Dans chaque image d'une base qui entraîne une IA à reconnaître le sexe d'une personne, le ou les visages présents doivent avoir été identifiés et encadrés à la main, grâce à un cadre virtuel. Le salarié qui effectue ce travail légende ensuite la photo en précisant si ledit visage est masculin ou féminin. C'est une tache fastidieuse qui ne peut être réalisée que par un humain", explique Gwennael Gate.

"Au démarrage, nous avions besoin de plusieurs centaines d'images pour être pertinents sur une caractéristique donnée, aujourd'hui, pour certains détails, quelques dizaines de clichés suffisent"

Une fois cette étape accomplie, Angus.ai a analysé les performances de sa première catégorie de briques. "Dans certaines situations, comme le contre-jour, nos résultats se cassaient la figure. Nous avons donc produit des films correspondant à ces cas précis directement dans les bureaux de l'entreprise et nous en avons nourri nos briques logicielles. Ces films ont été annotés à la main par nos salariés, image après image." Ils ont utilisé pour ce faire un logiciel de lecture vidéo classique. Lorsqu'ils cliquent sur un visage, le logiciel l'encadre automatiquement. Le collaborateur légende ensuite la photo en donnant l'âge et le sexe de la personne, par exemple, avant de passer à la suivante. Le système d'annotation utilisé par Angus.ai repère automatiquement sur une nouvelle image les formes qui ont été identifiées sur la précédente, ce qui facilite le travail. La start-up a utilisé ces films pour entraîner les briques IA de tracking, appartenant à la seconde catégorie.

Créée en 2013, la jeune pousse parisienne Heuritech travaille également sur la reconnaissance d'images. Son IA est capable d'identifier en direct les objets, personnes, matières et logos de marques présents sur les photos qui circulent sur le net et les réseaux sociaux. Elle analyse quotidiennement plus de 100 millions de pages web. Les clients de la jeune pousse, marques de luxe et sites d'e-commerce, peuvent ainsi concevoir des collections dans l'air du temps en fonction des tendances du moment repérées chez leurs concurrents, savoir quelles stars portent leurs produits…

Heuritech ne travaille pas avec un logiciel en particulier. "Chaussures, jupes, pantalons, sacs à main… Nous avons un modèle différent d'IA entraîné pour chaque catégorie de vêtement, c'est plus efficace", explique Charles Thurat, responsable business développement et évangélisation de la jeune pousse.

"Nous apprenons à nos IA à identifier un modèle particulier de sac à main, comme le Birkin d'Hermès, il est plus difficile de distinguer deux chemises masculines l'une de l'autre car elles ont moins de signes distinctifs"

Concrètement, Heuritech travaille sur ses logiciels en deux étapes. "Nous alimentons d'abord notre solution dédiée à la reconnaissance de chaussures, par exemple, avec des images de différents modèles, tailles et matières. Elle comprend ainsi quelle est la forme générale de ce produit. Nous affinons ensuite le niveau de détail. Sandales, bottines, tennis... Nous entraînons notre logiciel à reconnaître un certain style de chaussures. Nous lui apprenons également à distinguer certains éléments précis, comme les lacets, les talons ou encore le matériau utilisé. Pour certaines catégories de produits, notamment la maroquinerie, nous pouvons même éduquer nos IA pour qu'elles identifient un modèle particulier, comme le sac à main Birkin d'Hermès. C'est plus difficile de distinguer deux chemises masculines l'une de l'autre car elles ont souvent moins de signes distinctifs", expose Charles Thurat, dont la start-up a levé 1,1 million d'euros en janvier.

Pour entraîner ses logiciels, Heuritech utilise différents types de données. Des bases de photos annotées fournies par la communauté scientifique, comme Angus.ai, mais également des clichés extraits de Google Images et de sites d'e-commerce étiquetés à la main par ses salariés.

Pour chaque catégorie de produits (manteau, pantalon, tee-shirt…) l'entreprise constitue une vaste base de clichés. Elle la subdivise ensuite et l'annote en fonction de ses besoins. "Un même jeu peut être annoté des dizaines de fois en fonction de ce que nous cherchons à apprendre à notre logiciel. Nous pouvons légender une photo de sac à main en indiquant que c'est un tote bag, puis réutiliser cette image en précisant qu'il est en tissu", explique l'entrepreneur.

Heuritech a beaucoup investi en R&D pour que ses IA soient rapidement capables de reconnaître un détail particulier sur un vêtement. "Au démarrage, nous avions besoin de plusieurs centaines d'images pour être pertinents sur une caractéristique donnée. Aujourd'hui, pour certains détails, quelques dizaines de clichés suffisent", affirme Charles Thurat.

Une fois que ces clichés légendés ont été analysés par le logiciel, Heuritech fournit à la machine une série d'images non annotées pour la tester. Elle doit par exemple reconnaître dans une photographie un certain modèle de baskets Nike. Et si le test est réussi, l'IA fraîchement diplômée est prête à se lancer sur le marché du travail.