L'IA synthétique : une rampe de lancement pour l'IA traditionnelle et générative
L'IA générative a donné naissance à une nouvelle catégorie de data set d'entrainement : les données synthétiques. Les modèles de fondation permettent en effet de partir d'un petit nombre d'exemples afin d'accroître artificiellement leur volume en vue d'alimenter d'autres modèles qui n'auraient pas pu voir le jour sans ce tour de passe-passe. "Cette notion a été mis en exergue en 2023 par le laboratoire en IA de l'Université de Stanford", rappelle Stéphane Roder, PDG du cabinet de conseil français AI Builders.
L'IA synthétique peut d'abord être utilisée dans le machine learning. Selon le principe de Vapnik, plus un modèle d'IA traditionnel est complexe, plus il aura besoin de données d'entrainement. Sans un volume d'informations suffisant, il ne sera pas capable de généraliser et ses réponses se révèleront dégradées. "Or très souvent, on sera confronté au problème. Et ce pour de multiples raisons. Dans de nombreux cas, on disposera d'un volume très limité de données. Elles pourront être aussi de mauvaise qualité ou trop veilles. Parfois, on n'aura pas l'autorisation de les utiliser, ces informations n'étant pas anonymisées", égraine Didier Gaultier, patron de l'IA chez Orange Business Digital Services.
Un levier pour le deep learning
L'approche de l'IA synthétique se révèle notamment intéressante pour entraîner les modèles de deep learning. Des réseaux de neurones complexes qui se rapprochent d'ailleurs des technologies d'IA générative, même si les data scientists s'accordent pour dire que cette technologie reste rattachée au domaine de l'IA traditionnelle. "Dans le domaine de la reconnaissance d'image par exemple, il sera nécessaire de recourir à des milliers d'images pour entraîner ce type de modèle. Et évidemment, il sera assez rare d'avoir un tel contenu sous le coude", reconnaît Didier Gaultier.
Dans le cadre d'un projet mené pour une ONG ayant pour mission la reforestation des massifs coralliens, Orange a mis en œuvre un réseau de neurones artificiels visant à reconnaître, par le biais d'une caméra sous-marine, des types de poissons particuliers. Objectif : vérifier que la faune est bel est bien en croissance au sein des espèces ciblées. "La première IA mise en place parvenait à compter les poissons, mais pas à les reconnaître, le modèle de deep learning sous-jacent n'étant pas suffisamment entrainé", indique Didier Gaultier.
"On pourra partir de quelques voitures de différentes marques avec leurs spécifications, puis générer un data set de plusieurs milliers d'images"
Comment Orange Business a-t-elle procédé ? L'ESN a eu recours à un générateur d'images en partant de photos des principales espaces visées. Un générateur qui a démultiplié ces photos en déclinant les poissons dans toutes les positions et morphologies possibles. "Nous avons obtenu des dizaines de milliers d'images qui nous ont permis de réentrainer le réseau de neurones. Au final, l'IA était capable de reconnaître toutes les catégories de poisson recherchées", souligne Didier Gaultier.
Parmi ses principaux avantages, l'IA synthétique permet d'éviter le travail de labellisation manuelles des images. Dans le cas de la reconnaissance de voitures, on pourra par exemple partir dans la même logique de quelques voitures de différentes marques avec leurs spécifications, puis générer un data set de plusieurs milliers d'image qui seront correctement taguées à partir des informations de départ. Pour obtenir ce résultat, on fera varier les angles de prise de vue mais aussi les conditions météo. Stéphane Roder pondère : "Il n'est pas possible néanmoins d'atteindre la qualité des données labellisées à la main."
L'IA synthétique pourra également être appliquée à des données tabulaires. Cette méthode implique cependant d'être nettement plus vigilant. "Le recours à une règles mathématique est en effet susceptible d'introduire un biais ou des corrélations qui n'existaient pas dans les données d'origine. Des data scientist confirmés voire des statisticiens devront par conséquent être mis dans la boucle pour vérifier la bonne mise en œuvre du process", prévient Didier Gaultier.
De l'image au son
L'IA synthétique s'applique également au domaine de la vidéo et du son. Elle permettra par exemple de reformuler des données vocales en texte adaptée au format de l'écrit. Et réciproquement. Des conversions qui ne peuvent se faire sans l'intervention d'un grand modèle multimodal. Ce cas d'usage s'avère notamment intéressant pour constituer des data set textuels à partir des enregistrements des centres de contacts, et inversement pour entrainer par exemple un chatbot audio en partant de données textuels glanés au sein d'une base de données client.
"Il est plus que probable qu'OpenAI ait utilisé les données de Youtube pour entrainer GPT4-o, à la fois dans sa version audio et dans sa version textuelle. Pour cette dernière, la piste audio du réseau social vidéo a été préalablement converti en texte. Ce qui a permis d'élargir les données de learning", illustre Didier Gaultier. Et le consultant de conclure : "Avec l'IA synthétique, les entreprises vont se rendre compte qu'elles disposent de mines d'or de data qui ne sont pas exploitables dans leur format d'origine, mais qui grâce à l'IA générative pourront être utilisées au cœur des applications."