Le Cloud est dans l'AIR : AI Responsable
L'intelligence artificielle sera responsable, ou ne sera pas.
Un jour que j'avais besoin de la liste en français et anglais de 125 participants à une organisation pour laquelle nous travaillons, je me mettais en quête de l'information...
Pas de chance : je trouvais juste des pages en colonne avec des mentions inutiles. Aussitôt je compris que je mettrai 20 minutes à disposer d’une information exploitable pour l'intégrer dans notre soft.
Donc, la mort dans l'âme, je me décidais à avoir recours à une intelligence artificielle…
A la recherche du temps perdu
Premier test avec Google, mais je raccrochais aussitôt, car il fallait agréer des conditions "ad vitam", et franchement je trouvais cela très exagéré.
Second test, un autre US qui se dit parmi les premiers au monde... Mais pataras, en demandant la liste, le "machin" s'arrêta à la lettre L.
Troisième test, je précisais "liste intégrale"... Le bidule s'exécuta mais avec des puces et sans saut de ligne, alors qu'avant il sautait une ligne après chaque nom, à n'y rien comprendre.
Quatrième test, je précisais aussi "sans puce, sans saut de ligne" et là effectivement le résultat attendu (tant attendu) arriva.
Tout ça pour ça
La morale de cette expérience, un rien agaçante, me permis de tirer quelques conclusions :
1. Les résultats étaient différents (saut de ligne) sans explication
2. La compréhension de liste était insuffisante (liste complète)
3. J'avais consommé 3 minutes au lieu d'une...
Projection, par un million de prompts à l'heure, j’entrevoyais des milliers de Giga Watt Heure consommés pour rien, simplement par ce qu'aucune logique ne semblait animer la soit disant « intelligence » à laquelle je tentais d'extirper une malheureuse liste qui tantôt était incomplète et sinon (sans raison, ni raisonnement) pleine de fioritures...
Vous trouvez ça intelligent ?
Cela me confirma bien que : NON l'AI n'était ni raisonnable, ni raisonnée, ni cohérente, ni responsable.
Pourquoi alors ce papier me direz-vous ?
Parce sans prétendre à être Microsoft, Google ou Consorts, nous, petit éditeur français avons réfléchi dès le début de nos travaux à un modèle d'Intelligence Artificielle Responsable, ou si vous préférez d'AI Respectueuse de l'environnement (et de notre portefeuille).
Concevoir autrement
Voilà ce que nous avons fait :
1. Après quelques tests de différentes cartes GPU, nous avons opté pour un modèle qui pour un résultat équivalent consomme 50% de moins.
2. Nous avons aussi travaillé sur les modèles LLM les plus performants mais optimisés en taille, ce qui nous a permis d'économiser 30% de calculs pour un résultat équivalent.
3. Nous avons travaillé sur l'optimisation des requêtes et de la consommation, tant sur nos instructions que sur le modèle hébergé, et là encore nous avons fait une économie de l'ordre de 50%
4. Nous continuons à travailler pour imaginer des modèles hébergés consommant 50% de moins, mais là nous ne vous donnerons pas le truc…
5. Nous travaillons à gérer les contraintes et demandes pour les exécuter dans un temps limité, estimant que nous devrions gagner entre 30 à 50% de consommation.
Mais alors me penserez-vous, 50% +30% +50% +50 +30% cela fait 210% donc une consommation négative !
Non, c'est simplement que sans optimisation, nous aurions un système qui nous coûterait sans doute trois fois plus cher qu'il ne le devrait en réalité.
De la méthode
Notre objectif, déjà atteint avant même le lancement de nos offres IA consommera donc trois fois moins que si nous n'y avions pas prêté attention.
Et comme nous n'avons qu'une ressource à bien gérer (les finances de notre entreprise, la facture de nos clients), et qu'une planète habitable, il nous semble très judicieux de rappeler que l'AI n'a aucun avenir sans un peu d'intelligence à sa conception par les entreprises de logiciel.
Résumé ? Le Cloud est dans l'AIR : AI Responsable.