Comparatif AIOps : Splunk challengé par AppDynamics et Datadog

Comparatif AIOps : Splunk challengé par AppDynamics et Datadog Devo, Dynatrace, New Relic, ScienceLogic... Tour d'horizon des points forts des outils d'IA taillés pour fluidifier les opérations informatiques.

"L'AIOps marie big data, machine learning et autres techniques logicielles en vue d'améliorer les fonctions d'opération IT : monitoring, automatisation informatique et service desk". C'est ainsi que le Gartner conceptualise l'artificial intelligence operations. Cette définition est édictée par le cabinet d'étude américain en 2017. Depuis, les solutions d'AIOps n'ont cessé de se multiplier. Il s'agit pour la plupart de logiciels de monitoring et d'observabilité informatique qui ont évolué en intégrant le machine learning.

Parmi les outils d'AIOps les plus populaires, on compte AppDynamics, Dynatrace et New Relic. Tous trois sont issus du segment de l'application performance monitoring (AMP). A ce groupe viennent se greffer Datadog et Devo qui se spécialisent dans l'observabilité orientée cloud. Mais aussi Splunk dont la plateforme est taillée notamment pour superviser des clusters et parcs massifs de serveurs. Enfin, s'ajoutent des pures player parmi lesquels ScienceLogic ou Moogsoft. Au jeu du comparatif fonctionnel, Splunk se détache, devant AppDynamics (Cisco) et Datadog.

Comparatif des plateformes d'AIOps
  App Dynamics Data dog Devo Dyna trace New Relic Science Logic Splunk
Observabilité x x x x x   x
Automated Anomaly Detection (AD) x x x x x x x
Automated Root Cause Analysis (RCA)  x x x x x x x
Automated Transaction Diagnostics (ATD)  x x         x
IT workflow automation   x x     x x
Big data x           x
Aux côtés des éditeurs ci-dessus, de nombreux autres acteurs se positionnent dans l'AIOps. C'est le cas de BigPanda, IBM Watson AIOps, LogicMonitor, Moogsoft ou PagerDuty.

Splunk est l'acteur de ce comparatif qui totalise le plus gros volume de fonds levés. Lors de son introduction en bourse en avril 2021, l'éditeur de San Francisco a glané pas moins de 1 milliard de dollars. Par comparaison, les IPO de Datadog, Dynatrace et New Relic leur ont rapporté respectivement 648, 620 et 115 millions de dollars. Les deux premiers sont entrés en bourse en 2019, et le troisième en 2014. En amont de son IPO, Datadog totalisait déjà 148 millions de dollars levés depuis sa création en 2010. Quant à AppDynamics, ses différents tours de table totalisaient 356 millions de dollars, avant son acquisition par Cisco en 2017 pour 3,4 milliards de dollars. Quant à Devo et ScienceLogic, pour l'heure non cotés, ils peuvent revendiquer des montants d'investissement de 381 millions de dollars pour le premier et 214 pour le second.

En termes de chiffre d'affaires, Splunk surplombe ses concurrents. Au troisième trimestre 2021, son revenu s'élève à 665 millions de dollars, en hausse de 19% sur un an. Datadog arrive loin derrière avec un CA de 270 millions de dollars sur la même période. Mais la société new-yorkaise d'Olivier Pomel et Alexis Lê-Quôc (deux Français) affiche une croissance bien supérieure, de +75% sur un an. Sur leur dernier trimestre fiscal, Dynatrace et New Relic enregistrent des chiffres d'affaires plus modérés, respectivement de 226 (+34%) et 196 millions de dollars (+18%). On notera que tous ces acteurs affichent des pertes, à des degrés divers. Un constat loin d'être étonnant. Dynatrace, New Relic et Splunk sont en phase de forte croissance, avec la nécessité de réaliser des investissements importants.

Critères de choix

Au-delà des critères de robustesse financière, une plateforme d'AIOps à l'état de l'art se doit de proposer six fonctionnalité clés :

  1. L'observabilité. Elle consiste à mesurer l'état d'un système informatique en fédérant et analysant l'ensemble de ses données de production (logs, traces et métriques), depuis la couche applicatives jusqu' aux moindres composants d'infrastructure IT.
  2. La détection automatique d'anomalie ou automated anomaly detection (AD). En faisant appel au machine learning, elle consiste à historiser l'état normal d'un système en vue de détecter ensuite les signaux faibles annonciateurs d'éventuelles dérives pouvant avoir un impact sur son fonctionnement, voire son utilisation.
  3. L'analyse automatisée des causes premières ou automated root cause analysis (RCA). Intervenant après l'AD, elle permet de naviguer au sein d'arbres de dépendances pour identifier les infrastructures IT liées aux applications et les impacts business correspondant. L'objectif étant de cerner rapidement les causes d'un problème (calcul, réseau, stockage…) et d'accélérer le temps de résolution.
  4. Le diagnostic de transaction automatisé ou automated transaction diagnostics (ATD). Il capitalise sur le machine learning pour repérer les anomalies qui ne sont pas assez graves pour déclencher une alerte, mais suffisamment importantes pour provoquer un incident à venir.
  5. AIOps Workflow. L'IT workflow automation est taillé pour dessiner et exécuter des workflows (en low code) automatisant le routage des tickets d'incident, ainsi que leur enrichissement à partir des données d'auto-diagnostique et de remédiation.

L'AIOps promet de réduire significativement le temps de détection d'un incident IT ou mean time to detect (MTTD) ainsi que le temps de résolution ou mean time to repair (MTR). Dans ses prédictions pour 2022, le Gartner anticipe une adoption massive du concept. "D'ici 2023, 40% des équipes de produits et plateformes IT vont recourir à l'AIOps pour l'analyse automatisée des risques de changement dans les pipelines DevOps, ce qui réduira les temps d'arrêt imprévu de 20%", projette le cabinet.