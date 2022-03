Alteryx Analytics Cloud regroupe Alteryx Designer Cloud, Alteryx Machine Learning, Alteryx Auto Insights et Trifacta Data Engineering Cloud pour proposer un environnement d'analyse de données unifié.

[Mise à jour le mardi 1er mars 2022 à 7h00] C'est une nouvelle étape dans le développement de l'offre d'analytics no code d'Alteryx. La société américaine commercialise Alteryx Analytics Cloud. Une offre qui regroupe l'ensemble ses briques applicatives au sein d'une plateforme cloud unique activable en quelques minutes et taillée au premier chef pour les citizen data scientists. Objectif affiché : démocratiser l'analytics tout en répondant à la montée en puissance des data warehouses et data lakes en mode cloud. Alteryx Analytics Cloud intègre à la fois l'outil de préparation de données et de data visualisation Alteryx Designer Cloud, l'application d'auto ML Alteryx Machine Learning, la brique d'analytics et de data storytelling automation Alteryx Auto Insights (ex-Hyper Anna) et, enfin, la solution de data engineering et data transformation Trifacta Data Engineering Cloud.

Alteryx, qu'est-ce que c'est ?

Fondée en 1997 aux Etats-Unis, Alteryx est une plateforme de data analytics automation. Orientée no code, elle peut être employée par les entreprises et leurs collaborateurs exploitant des données afin d'en faciliter la lecture et le traitement, puis d'établir des workflows de traitement et tableaux de bord automatisés à partir de ces dernières.

"N'importe quel professionnel de la connaissance peut utiliser Alteryx et ses capacité d'IA pour répondre à ses questions. Il s'agit là de notre principal facteur de différentiation", estime Alan Jacobson, chief data & analytics officer au sein du groupe du même nom. "Un comptable recourant à notre plateforme par exemple n'a pas besoin d'apprendre le Python pour automatiser un processus financier et y appliquer des modèles de machine learning prédictifs. De même pour un commercial qui souhaite connaître les raisons d'une baisse des ventes, ou pour un responsable RH qui veut cerner l'origine d'une hausse du turn over."

Comment fonctionne Alteryx ?

Alteryx se caractérise par un environnement de développement sans code (no code). Une interface graphique qui permet de créer des pipelines automatisant des processus complets de traitement de données via glisser-déposer ou drag and drop : intégration de source de données, data préparation, traitement et / ou analyse prédictive et, enfin, data visualisation (voir la capture ci-dessous).

L'utilisateur d'Alteryx accède à une boîte à outils et dessine le process graphiquement avant de l'exécuter. La plateforme peut se connecter aussi bien en mode lecture qu'en mode écriture à des dizaines de sources : AWS (S3, Aurora, Redshift...), Azure (Data Lake Store, SQL Database...), BigQuery, Cassandra, Databricks, MariaDB, MongoDB, MySQL, Salesforce, SAP Hana, Snowflake, etc. Le JDN a pu tester l'application qui se révèle puissante et très accessible.

Alteryx Designer permet de dessiner des pipelines d'automatisation de données, de l’intégration des data à leur visualisation en passant par leurs traitements, y compris via l’IA, avec à la clé l’envoi de reporting ou de notification (en cas de dépassement de seuil, d’erreur de matching...). © JDN / Capture

Quelles est la feuille de route d'Alteryx ?

Alteryx accélère sa stratégie de croissance externe en 2021 avec le rachat de deux sociétés : Lore IO et Hyper Anna. La première édite une application d'analytics multi-datawarehouse, et la seconde une plateforme SaaS multi-tenant qui automatise la création de data visualisation par l'identification de paterns dans les données. "Elle détecte par exemple une croissance des volumes de vente, du chiffre d'affaires, des bénéfices par période.... Et permet de mettre le doigt sur les origines de ces tendances. Sont-elles dues aux performances réalisées par certaines équipes de vente ? Proviennent-elles de zones géographiques particulières ?", égraine Alan Jacobson chez Alterxyx. En janvier 2022, l'éditeur a annoncé avoir conclu un accord en vue d'acquérir Trifacta pour 400 millions de dollars. Objectif affiché par l'entreprise : bénéficier de l'apport de cette plateforme de data analytics nativement conçue pour AWS, Google Cloud et Microsoft Azure en vue de booster sa stratégie multicloud.

Parmi les dernières évolutions de la plateforme d'Alteryx, on relève Alteryx Machine Learning. Lancée en mars 2020, cette technologie cerne automatiquement les corrélations existantes au sein des données. En partant d'un historique de ventes par exemple, elle peut identifier que certains types de produits ont plus de succès au sein d'un profil de population et sur une zone précise. "Partant de là, on pourra définir un indicateur de prédiction des ventes basé sur un modèle de classification qu'il sera ensuite possible d'optimiser via du feature engineering automatisé", poursuit Alan Jacobson.

Alteryx Machine Learning intègre une brique d’auto ML. En fonction d’un traitement d’IA à réaliser, une prédiction sur les ventes par exemple, elle mesure le degré de précision de centaines de modèles pour identifier le plus adéquat en termes d’algorithmes et d’optimisation. © JDN / Capture

Alteryx entend éviter l'effet boîte noire. La solution donne accès en permanence à des explications pour décrypter la manière dont elle génère ses tableaux de bord. Comment tel ou tel graphique a-t-il été généré ? Quid du calcul permettant d'aboutir à tel ou tel indicateur ? Un panneau s'ouvre sur la gauche de l'interface pour analyser le processus de traitement.

Pour la suite, d'Alteryx compte continuer à fluidifier, encore et toujours, l'accès aux traitements de données. "Alteryx est déjà capable d'extraire des données au sein d'images en recourant à la vision par ordinateur, ou encore de décrypter la teneur d'un article par le biais de technologies de text minig ou d'analyse de sentiments. Nous allons poursuivre dans ce sens", confie Alan Jacobson.

Qui utilise Alteryx ?

"Nous estimons à 47 millions le nombre d'utilisateurs avancés de feuilles de calcul à travers le monde qui peuvent monter en compétences pour évoluer vers Alteryx", souligne Alan Jacobson. "Alteryx leur permet non seulement d'automatiser des processus chronophages, d'intégration de données, avec de nombreux copier-coller... Mais aussi de réaliser des analyses avancées. Sachant que leurs questions restent relativement simples pour la plupart, notre plateforme pourra de facto répondre à la majorité d'entre elles." En France, la société californienne compte BNP Paribas, Monoprix ou encore Renaud parmi ses références.

Grâce à Alteryx, les data scientist pourront ainsi se concentrer sur des problématiques plus poussées. D'ailleurs, la solution ne les laisse pas au bord de la route. Elle traduit à la volée la logique applicative de ses modèles en langages Python ou R. Un code auquel les data scientists peuvent accéder par le biais de notebooks. "Ce qui leur permet de collaborer avec les data analysts dans un même environnement", insiste le chief data & analytics officer d'Alteyx.

Quelles sont les fonctionnalités d'Alteryx ?

Comme indiqué ci-dessus, Alteryx facilite l'extraction, la lecture, le tri, l'analyse et l'exploitation des données. Il permet, à titre d'exemple :

L'extraction des données à partir de sources différentes et / ou multiples,

La préparation des données afin de les rendre exploitables,

L'analyse prédictive et automatisée des données,

La création de modèle de machine learning automatisée,

L'établissement de rapports sous forme de dashboards ou d'exports PDF / Excel,

L'analyse avancée des données dans différents langages.

Qu'est-ce qu'Alteryx Designer ?

Alteryx présente Alteryx Designer comme "son vaisseau amiral". Il s'agit du point d'accès à sa plateforme. Il s'installe sur le poste de travail de l'utilisateur.

Alteryx Designer affiche une interface graphique complète et des fonctionnalités nombreuses pour extraire, segmenter, trier, clarifier la donnée, établir des pipelines d'automatisation, des modèles de machine learning prédictif, des rapports, des dashboards, etc.

Via une colonne s'affichant à droite de l'écran, Alteryx décrypte en permanence la manière dont il calcule ses indicateurs, comme ici pour une corrélation. © JDN / Capture

Alteryx Server, c'est quoi ?

Alteryx Server est l'architecture qui permet de déployer à grande échelle les processus et traitements conçus via Alteryx Designer. C'est un environnement serveur qui tourne à la fois sur desktop, sur serveur en local (on premise), ainsi qu'en mode cloud, sur AWS ou Microsoft Azure par exemple.

En amont, Alteryx Server se connecte aux sources de données, puis son moteur exécute en mémoire (ou in-memory) celles dont il a besoin le temps de réaliser l'analyse. Il ne stocke pas directement les données, ce qui se révèle très pratique pour gérer des données personnelles en conformité avec le RGPD. "Alteryx peut aussi recourir à un moteur tiers, par exemple celui de Snowflake ou de Microsoft SQL Server. Nous laissons au client cette liberté hormis pour les traitements particuliers de type machine learning ou text mining qui seront forcément pris en charge par la plateforme", indique Alan Jacobson.

Alteryx intègre-t-il un ETL ?

Oui, Alteryx comprend un ETL (pour extract, transform, load). Une fonctionnalité qui permet d'extraire et de combiner en une seule interface les données provenant de sources et de formats multiples.

La plateforme Alteryx est disponible en téléchargement sur le site officiel de l'éditeur éponyme. Il est utilisable gratuitement pendant une durée de trente jours. Au-delà, il faut souscrire à une offre d'abonnement annuel, dont le prix varie en fonction des usages.

Alteryx vs Dataiku

Alteryx et Dataiku se présentent tous deux comme des plateformes d'IA. Mais là où le premier a pour ambition de s'ouvrir à tout expert métier, le second se concentre avant tout sur les data scientists et autres professionnels de la donnée. Ce n'est pas pour rien que Dataiku se classe lui-même dans la catégorie des studios de data science. D'où son nom de baptême : Dataiku DSS pour Dataiku Data Science Studio.

Alteryx : certification et formation

Alteryx propose une certification. Son obtention passe par un examen validant l'aptitude à utiliser les logiciels de la suite Alteryx. Afin d'accompagner les utilisateurs et les entreprises dans leur utilisation, il existe différents forums officiels, dont l'un pour la communauté d'Europe, du Moyen-Orient et de l'Afrique.

Alteryx Community (ex-Alteryx Galery), tutoriel et documentation : quelques liens

Alteryx propose sur son site web un espace communautaire (Alteryx Community), ainsi qu'une documentation complète en français pour prendre en main sa plateforme d'IA. Parmi les tutoriels les plus populaires disponibles dans cet espace figurent les suivants :