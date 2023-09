Bito, Replit, Sourcegraph... Ils représentent l'une des principales lames de fond de l'IA générative. Ils enregistrent aussi parmi les plus belles levées de fonds de l'année.

92% des développeurs basés aux Etats-Unis ont déjà recours à des outils de codage à base d'IA. C'est là l'un des principaux enseignements d'une étude réalisée par Wakefield Research pour le compte de GitHub. Pour quel apport ? 70% des répondants à cette même étude estiment que ces solutions leur fournissent un réel avantage.

Par le biais de GitHub, Microsoft a investi ce nouveau segment en lançant Copilot en juin 2022. Un marché sur lequel le géant de Redmond est loin d'être isolé. De nombreux pure player se pressent en effet au portillon. Parmi ces acteurs, Tabnine se détache assez nettement.

Comparatif des assistants de codage Entrainement possible sur un code privé Déploiement on-premise possible Support de GPT Data set d'apprentissage contrôlé Plan gratuit Bito X X X GitHub Copilot X Tabnine X X X X Replit X Sourcegraph X X X StableCode* X X

*outil basé sur le projet BigCode.

Copilot : l'offre de Microsoft

Lancé en juin 2022, GitHub Copilot est un assistant intelligent conçu à la fois pour traduire en lignes de code les spécifications d'une application, mais aussi proposer des suggestions au fur et à mesure de la programmation. Pour réaliser ces suggestions, il décrypte le logiciel en cours d'édition et les fichiers associés au projet, puis réalise des prédictions. Ces dernières reposent sur le savoir-faire emmagasiné par un modèle de génération automatique de langage conçu par OpenAI. Baptisé Codex, il s'agit d'une déclinaison de GPT-4. Pour l'occasion, Codex a été entraîné sur des milliards de lignes de code disponibles publiquement sur Internet, en incluant les repositories public de GitHub, mais aussi d'Azure, de React et du Microsoft Developer Network.

Les cas d'usage de GitHub Copilot vont de la génération de tests unitaires et de pull requests jusqu'à la suggestion de correctifs en passant par le pilotage d'IDE. Une tâche qu'on peut si besoin gérer vocalement via GitHub Copilot Voice. Le 20 septembre 2023, Microsoft a par ailleurs lancé en bêta publique GitHub Copilot Chat, l'équivalent d'un ChatGPT taillé pour ses environnements de développement Visual Studio et Visual Studio Code. Un bot qui est conçu pour répondre à toutes les questions des développeurs sur les langages, la structure des programmes, les frameworks. Il couvre aussi la résolution de bugs, de vulnérabilités et autres problèmes de code. Le tout en langage naturel.

Bito s'adosse à ChatGPT

Mi-juin, la start-up californienne Bito levé le voile sur son assistant de codage. Sa particularité ? Motorisé par ChatGPT, il conserve les informations du développeur sur le terminal de ce dernier. En vue de garantir la confidentialité du code, Bito utilise une base de données vectorielle pour indexer et rechercher du code. Seules les requêtes en langage naturel sont transmises à ChatGPT. Baptisée Bito AI, la solution revendique 650 000 utilisateurs actifs mensuels dans 162 pays, et 160 sociétés du Fortune 500 parmi ses clients.

Les développeurs peuvent demander à Bito de réaliser des tâches dans 25 langages. Il pourra s'agir par exemple "d'écrire une fonction Java pour authentifier un utilisateur et lui fournir un message de bienvenue". Au-delà du codage en tant que tel, l'assistant permet de réaliser des tâches variées. Au programme : générer des tests unitaires, ajouter des commentaires à des fonctions, améliorer les performances du code, vérifier les problèmes de sécurité connus, etc. Compatible avec les environnements de développement Visual Studio Code et JetBrains, Bito AI doit accueillir de nouveaux large language model à l'avenir, parmi lesquels Claude d'Anthropic.

Tabnine ingère le code des applications

Fondé en 2012, Tabnine (ex-Codota) est considéré comme l'une des toutes premières solutions d'assistant de codage. Fait intéressant, l'application, disponible en mode cloud, peut être entrainée sur des bases de code propres à l'utilisateur. Aux côtés de la fonction classique d'auto-complétion, Tabnine est également capable de générer du code à partir de commentaires saisies en langage naturel. La solution peut également être hébergée en interne avec tous les avantages que cela comporte en matière de confidentialité des données. C'est un vrai plus comparé à Copilot. Pour bénéficier de cette possibilité, il faudra néanmoins souscrire à la version Entreprise de la solution, dont le prix n'est pas public.

Replit : un assistant intégré à un IDE

Replit articule son offre autour d'un environnement de développement en mode cloud. Supportant les langages de programmation les plus utilisés, la start-up de San Francisco met en avant ses fonctionnalités de travail collaboratif. L'assistant de code est l'une des briques de la plateforme. Gérant évidemment l'auto-complétion de code, il est également doté d'un chatbot conçu pour répondre à des questions. On pourra par exemple lui demander de spécifier le rôle de telle ou telle fonction applicative. En avril 2023, Replit a bouclé une levée de fonds de 97,4 millions de dollars, valorisant l'entreprise à hauteur de 1,16 milliard de dollars. La société, notamment soutenue par Google, revendique 22,5 millions de développeurs utilisateurs.

Sourcegraph : 2,6 milliards de valorisation

En termes de levée de fonds, Sourcegraph fait mieux que Replit. Cette start-up, également californienne, a levé un total de 225 millions de dollars, portant sa valorisation à 2,6 milliards de dollars. A la différence de Replit, Sourcegraph reste cantonné à un assistant de codage. Comme son nom l'indique, il s'adosse à un graph pour analyser les bases de code. Partant de là, l'outil est capable d'expliquer un programme fonction par fonction. Il peut également générer des tests unitaires.

L'une des principales valeurs ajoutées de Sourcegraph réside dans son moteur de recherche. Grâce au graph de la start-up, il permet de dénicher des extraits d'application de manières très granulaire, en analysant toutes les dépendances. Ce qui est très utile en phase de débogage ou pour mettre le doigt sur de potentiels vulnérabilités.