Les outils de développement d'IA souffrent de l'effet Ikea

Une équipe d'ingénieurs qui conçoit en partant de zéro sa propre plateforme de machine learning, aussi imparfaite soit-elle, lui attribuera plus de valeur que s'ils l'avaient achetée prête à l'emploi. C'est l'effet Ikea.

L'effet IKEA fait référence au phénomène selon lequel on attribue plus de valeur aux produits que l'on a participé à créer. Cet effet qui s'applique d'ailleurs largement à tous types de produits (meubles, jouets... ) est également prédominant dans les sociétés à forte culture d'ingénierie. Une équipe d'ingénieurs qui conçoit en partant de zéro sa propre plateforme de machine learning, aussi imparfaite soit-elle, lui attribuera plus de valeur que s'ils l'avaient achetée prête à l'emploi.

J’aime à décrire la plupart des logiciels de développement d’IA comme des "kits à monter soi-même avec des instructions et 70% des pièces manquantes". Afin d’expliquer comment on en arrive là, et de vous guider vers où il faut aller, je vais me concentrer sur les problématiques courantes des premières étapes du cycle d’innovation technologique. La plus importante est que nous n’avons pas convergé vers un modèle dominant des plateformes de machine learning (ML), ce qui conduit à une multitude de systèmes de portée et de forme différentes avec des interfaces mal définies. Par conséquent, cela s’avère extrêmement difficile de créer des facteurs de forme appropriés aux outils de développement d’IA destinés aux utilisateurs des entreprises. En définitive, c’est là où intervient l’effet Ikea : la manière prédominante selon laquelle les entreprises consomment ces outils souffre terriblement de cet effet.

Une prolifération de modèle différents d’outils de développement d’IA

Il n’y a plus aucun doute que l’IA va transformer de nombreuses industries et crée même de nouveaux business modèles et entreprises AI first. Par conséquent, tous les principaux fournisseurs de cloud (sans compter les start-ups) accumulent les ressources pour mettre les outils de développement d’IA à la portée du plus grand nombre. Ils tentent globalement de répondre aux mêmes besoins des utilisateurs, mais avec des approches et des résultats nettement différents, ce qui entraîne une prolifération de modèles différents.

Lorsqu’on évoque les outils de développement d’IA pour l’entreprise, on considère une catégorie émergente de technologie appelée plateformes de ML. Le manque de modèle dominant de telles plateformes signifie qu’il n’y a pas de définition qui fasse l’unanimité. Je vais donc en donner une très simple : une plateforme de ML est une technologie horizontale (c’est-à-dire qui ne concerne pas un cas d’usage vertical), qui offre toutes les capacités pour couvrir le cycle de vie complet des applications ML. Plusieurs raisons justifient pourquoi nous ne sommes pas parvenus à un modèle dominant. Citons les principales :

1. Des technologies sous-jacentes ne sont pas matures

Bon nombre des technologies exploitées dans une plateforme de ML sont elles-mêmes au début de leur cycle de vie. Il est difficile de construire une plateforme de ML qui fournit des modèles de ML continuellement mis à jour, lorsque le framework de ML utilisé pour ces modèles apporte des modifications incompatibles avec son format de contrôle.

2. Créateurs et consommateurs de plateforme de ML ignorent ce qu'ils ne savent pas

J'ai passé d'innombrables heures à parler avec des équipes d'ingénieurs qui avaient de grands projets pour la construction de la plateforme de ML canonique. Dans la plupart des cas, ils avaient à l’esprit un modèle ne représentant environ que 20% de ce qui était nécessaire, sous-estimant ainsi la difficulté de ce qu'ils entreprenaient.

3. Le problème de facteur de forme des outils de développement d’IA

Si nous n'avons pas convergé vers un modèle dominant, comment pouvons-nous être d'accord sur les facteurs de forme appropriés ? Ce que j'entends par facteur de forme dans ce contexte désigne différentes incarnations de la façon dont la technologie est présentée aux utilisateurs. Par exemple, l'iPhone a défini le facteur de forme prédominant des smartphones. Je détourne ce terme pour résumer tout ce qui serait considéré, lorsqu’on parle de la surface du produit, de l'expérience utilisateur ou de l' expérience développeur.

On pourrait faire valoir qu'il devrait y avoir une séparation des préoccupations, que les ingénieurs data devraient écrire les pipelines de données, les data scientists entraîner des modèles et les ingénieurs informatiques écrire les systèmes de déploiement, et qu'une plateforme de ML ne peut fournir toutes ces capacités. Mais j'ai constaté à maintes reprises dans les entreprises, que cette séparation artificielle des préoccupations entraîne un ralentissement important, des erreurs coûteuses et un taux d'échec globalement plus élevé des projets de ML. Une grande partie de ces difficultés est liée à la vitesse à laquelle les outils de ML évoluent, généralement sous l'impulsion des résultats de recherche et des contributions de l'open source au détriment de principes d'ingénierie stricts.

Les outils de développement d’IA commencent lentement à être utilisés à grande échelle. Pourtant, sans conception dominante ni facteur de forme approprié, il n'est finalement pas surprenant que de nombreuses entreprises aient du mal à adopter des plateformes de ML et à se transformer en un modèle AI first. Celles qui essaient souffrent souvent de l'effet Ikea.

Dans les deux prochaines années, nous devrions converger vers un modèle dominant des plateformes de ML. Il est très probable qu’un produit gagne en popularité et débouche sur une définition de la catégorie. De nombreux fournisseurs quitteront le marché et d'autres se conformeront au modèle dominant. Il y aura quelques facteurs de forme pertinents pour les différentes cibles. Il n'est pas nécessaire de n’en avoir qu’un seul, mais il est souhaitable d'avoir différentes couches d'abstraction. Chaque couche doit être bien définie et les abstractions ne doivent pas fuir entre les couches. Les entreprises réaliseront que concevoir sa propre plateforme de ML n’est pas un avantage comparatif et un modèle dominant en place mettra en évidence que cette initiative est futile. La valeur des entreprises provient des plateformes de ML appliquées à leurs problématiques, et non de la conception et de l'entretien de leurs propres plateformes de ML.