H2O.ai : cette plateforme d'IA automatisée qui défie Google

H2O.ai : cette plateforme d'IA automatisée qui défie Google Dans la logique de Google AutoML, la solution automatise le développement de modèles machine learning. Objectif : démocratiser l'intelligence artificielle.

Fondé en 2012 en Californie, H2O.ai se donne pour mission de démocratiser l'intelligence artificielle en entreprise. Pour répondre à ce défi, la société a mis au point une plateforme qui automatise la création de modèles de machine learning. Son produit se classe ainsi dans la même catégorie que l'offre AutoML de Google (lire l'article : Ces clouds qui automatisent l'IA sont-ils sérieux ?). Comptant 200 salariés, H2O.ai a levé 147 millions de dollars depuis sa création. Bouclé en août 2019, son dernier tour de table s'élève à 72,5 millions de dollars. En Europe, la société a ouvert des bureaux à Munich et Paris.

Pour automatiser la création et le tuning du machine learning, H2O.ai a recours à plusieurs techniques. Face à une problématique donnée, la plateforme va par exemple benchmarker plusieurs modèles qu'elle estime adaptés pour ensuite sélectionner celui dont le niveau d'erreur estimé sera le plus faible. Elle fait également appel au transfer learning. Objectif : capitaliser sur l'apprentissage machine réalisé pour ses clients historiques en vue d'accélérer la création de nouveaux modèles d'IA sur-mesure. En parallèle, H2O.ai combine plusieurs modèles entre eux pour parvenir au résultat le plus adapté. Enfin en fonction du besoin, la solution met en musique différentes méthodes d'apprentissage (supervisée, non-supervisée…)

Un positionnement open source

Pour chaque grand secteur d'activité, H2O.ai met en avant plusieurs scénarios d'usage : recommandation de produits, scoring de lead ou optimisation du pricing dans le retail ; détection de fraudes, scoring de risques, prédiction du churn dans la finance ; optimisation de la supply chain, maintenance et fabrication prédictive dans le manufacturing, etc. "Comparé à Google AutoML, l'un des principaux points forts de notre offre réside dans son positionnement open source mais aussi dans la grande variété des modules que nous proposons. A la différence du service cloud de Google, notre plateforme peut s'installer partout, sur un cloud privé, public, sur un cluster de serveurs dédiés...", analyse Sri Ambati, CEO et cofondateur de H2O.ai.

L'offre d'H2O.ai se décline en deux briques. Disponible en open source, sous licence Apache 2.0, la première s'articule autour d'une couche algorithmique à vocation exploratoire. Couvrant les modèles linéaires généralisés, le gradient boosting ou encore les réseaux de neurones, elle supporte les librairies Pytorch, Scikit-learn, Tensorflow et XGBoost, notamment. Elle est optimisée pour exécuter les phases d'apprentissage sur des clusters de serveurs via des traitements parallèles et en mémoire.

"Nous allons renforcer notre présence en France"

Sous licence commerciale, la seconde brique de l'offre H2O.ai embarque les processus taillés pour automatiser et industrialiser le déploiement des modèles. Elle inclut des modules de natural language processing, d'analyse des données temporelles (time series) et de data visualisation statistique. Sa tarification repose sur une souscription annuelle en fonction du nombre de postes et de processeurs utilisés.

Pour les data scientist, H2O.ai a conçu un environnement de développement de modèles et de manipulation de data sets d'apprentissage. "Python et R sont les langages que nous implémentons pour l'étape d'entrainement. Pour l'exécution des algorithmes une fois déployés sur le terrain, nous supportons Java et C++, ce qui permet d'optimiser leur performance d'exécution, y compris en mode edge", détaille Sri Ambati. En bout de course, les IA pourront être mises en œuvre sur l'infrastructure big data de son choix (Hive, Kafka, Spark, Storm...).

H2O.ai revendique 20 000 organisations utilisant sa plateforme open source dont 135 clients payant. "Il s'agit à la fois de grands groupes du Fortune 100 mais aussi d'entreprises de taille plus modestes ainsi que des start-up", souligne Sri Ambati.

L'IA à la portée des équipes business

La priorité de H2O.ai en termes de R&D ? Faire en sorte que son produit soit toujours plus facile à prendre en main et surtout directement utilisable par les équipes business. "C'est l'objectif de la prochaine génération de notre plateforme", confie le CEO. "D'ici les 9 prochains mois, nous comptons par ailleurs étendre notre offre à la reconnaissance d'images."

Côté commercial, H2O.ai entend renforcer ses positions à l'international. La France fait partie des pays où la société souhaite accroitre sa présence. "Nous estimons que la France a un fort potentiel de développement. L'un de nos principaux clients dans les télécoms n'est autre qu'Orange. C'est aussi un pays avec des compétences reconnues mondialement en mathématique et physique", constate Sri Ambati. "Pour toutes ces raisons, nous allons étendre notre effectif dans l'Hexagone, y compris en matière de R&D." Force est de constater d'ailleurs que le responsable de l'équipe de data science de H2O.ai, Olivier Grellier, est français et basé en France.