L'IA générative ou l'illusion du déjeuner gratuit

Comme souvent avec les technologies de rupture, l'IA Générative arrive avec son lot d'oracles y voyant pour certains la fin du travail, pour d'autres la mère de toutes les bulles.

OpenIA a visé juste en mettant entre les mains du grand public des technologies puissantes et simples d’usage. Depuis, à chaque jour sa nouvelle annonce sur ce que ces IA pourraient faire à notre place ; impressionnant et questionnant.

Sans m’appesantir sur le clin d’œil au No Free Lunch Theorem de Macready et Wolpert, qui démontre qu’aucun algorithme apprenant n’est optimal pour tous les problèmes… on y trouve un lien avec les croyances récemment renouvelées dans l’IA magique générant de la valeur sans effort.

Hélas, comme c’était le cas pour les IA traditionnelles, il n’y aura pas de déjeuner gratuits pour au moins trois raisons.

Des technologies en apparence prêtes à l’usage… mais la vérité est plus compliquée

La course aux démonstrateurs GenAI a démarré : Carrefour et son assistant Hopla, Bouygues Télécom pour des comptes rendus client automatisés, … et l’on peut être impressionné par la rapidité avec laquelle cette technologie transforme, mais les cas d’usages actuellement visibles ne sont pas les plus déformants pour le business et sont peu représentatifs d’impact qu’elle pourrait générer pour les entreprises.

C’est que la plupart des cas d’usages à valeur s’appuieront en grande partie sur des données internes confidentielles ou protégées et ces dernières ont deux défauts majeurs : elles n’ont pas été utilisées pour l’entrainement des modèles éditeurs comme open-source et elles sont bien souvent encore assez peu disciplinées dans les SI des entreprises, rendant plus complexe leur traitement.

Les premiers essais d’adaptation de modèles éditeurs ou open-source à des corpus de données internes montrent qu’il est difficile d’atteindre des résultats aussi bluffant que sur des questions grand public tout simplement parce que ces corpus sont soit insuffisants pour peser sur le modèle de fondation, soit eux-mêmes biaisés.

Sans mettre en cause son potentiel, l’IA Générative ne permettra pas souvent de se passer des nécessaires travaux - engagés mais rarement aboutis - de gouvernance et qualité des données.

Des équations économiques encore très incertaines

La deuxième raison est qu’il est difficile aujourd’hui de prédire les impacts sur les factures Cloud des solutions d’IA générative. Une facturation absconse où des coûts en apparence très faibles peuvent devenir prohibitif avec la généralisation de la solution. Cette facturation insidieuse n’est pas nouvelle pour tous les utilisateurs cloud, et l’on parvient aux prix d’efforts, hélas non remplaçable par des IA génératives, à prédire un peu la facture.

Reste le problème plus sérieux de l’équation économique globale. Comme le montre l’Analytics India Magazine avec un coût de fonctionnement de 700 k$/jour, OpenAI est loin de couvrir les coûts démesurés de stockage et d’entrainement des modèles. Evidement la pub et la valorisation des données grand public vont tôt ou tard compenser en partie. Mais il faudra aussi que les entreprises utilisatrices contribuent à l’effort de guerre de Microsoft dont les 10 Md€ seront consommés dès 2024. Ce problème n’est pas propre à Microsoft et OpenAI, et passée la période d’acquisition de clients et de premières preuves de valeur, il est probable que les factures de l’ensemble de ces solutions grimpent fortement. Et ceci sans prendre la facture règlementaire qui en imposant – à juste titre – des contraintes éthiques à ces IA risquent de justifier des hausses de coûts.

Des impacts écologiques et géostratégiques sous-évalués

Enfin, deux factures indirectes mériteraient d’être plus creusées : la facture écologique et la facture géostratégique.

Ecologique d’abord, si on en croit la plateforme Greenly le bilan carbone de l’usage de GPT3 équivaut à lui seul à 136 aller-retours Paris New-York. Bien sûr des propositions émergent pour des modèles plus frugaux, mais l’appétit des entreprises pour l’IA générative ne leur laissera pas le temps d’attendre ces dernières avant que leurs bilans carbone ne gonflent.

Géostratégique ensuite, car les BigTech deviennent les seuls maitres des intelligences de nombreux processus d’entreprise voire de politiques publiques. Les pays, entreprises et organisations qui n’auront pas pris soin de maitriser ces technologies en profondeur et de bien diversifier leurs fournisseurs, au mieux deviendront captifs de « vendeurs d’intelligence » et le paieront au prix fort, au pire seront des otages idéaux en cas de retournement des relations entre pays et bigtechs, ou quand GPT4 sera aussi indispensable à la France et à LVMH qu’hier le gaz Russe à l’Allemagne et à Volkswagen.

En conclusion, il serait idiot de ne pas prendre ce virage de l’IA Générative qui recèle plus de promesses que de risques, mais il sera clé de faire des choix de solutions éclairés et équilibré (open-source vs éditeurs), de mesurer les risques long terme en acceptant qu’une solution moins performante à court terme sera peut-être plus durable, et surtout de ne pas lésiner sur les compétences et l’expertise nécessaire à l’appropriation en profondeur de ce nouvel outil.