Les 5 grandes étapes de la mise en place de l'AIOps

Les équipes informatiques sont confrontées à des défis de plus en plus considérables à mesure que leur transformation digitale leur impose l'adoption de technologies hybrides complexifiant ainsi la gestion de leurs opérations.

À elle seule, la gestion des incidents peut faire peser une pression écrasante sur les équipes IT, qui doivent passer au crible le bruit ambiant, ce qui peut mobiliser des ressources considérables. Mais heureusement, les solutions de gestion des opérations ont évolué au fil de ces défis.

Aujourd'hui, l’AIOps (intelligence artificielle appliquée aux opérations) aide les grandes entreprises à gérer leur parc informatique et à rationaliser les efforts de leurs équipes opérationnelles. Avec cette maturité du marché, des déploiements plus techniques ont pu émerger comme "l'AIOps multi-domaine", la différenciation entre les solutions agnostiques et spécifiques à un domaine, et le concept d'une superposition d'AIOps aux outils existants.

Cependant, dans ses principes de base, l'AIOps comprend toujours trois éléments : la capacité d'observer la disponibilité et la performance des applications, de s'engager avec les services informatiques et d'agir grâce à des capacités d'automatisation et de réparation. Grâce à ces capacités, des environnements vastes, complexes et hybrides peuvent être gérés relativement simplement.

Pourtant, alors que la demande augmente, l'adoption de solutions AIOps ressemble toujours à une usine à gaz. Ce n'est pas le cas. Avec un fournisseur et un partenaire adéquat, elle devrait être adoptée aisément. En effet, tout ce dont les équipes informatiques ont besoin, c'est du savoir-faire opérationnel et des compétences en matière de gestion que l'on trouve si souvent au sein du département. Voici donc comment commencer :

1. Adopter de manière ciblée

Il est essentiel de se mettre en phase avec les objectifs de l'entreprise et de s'attaquer aux points sensibles connus. Une étude de l'EMA a révélé que, en moyenne, les solutions AIOps matures prennent en charge 8 rôles différents spécifiques à un domaine, et 11 rôles inter-domaines. En d'autres termes, le système peut rapidement sembler complexe à gérer. De ce fait, il pourrait s'avérer extrêmement difficile de convaincre les responsables financiers. Cependant, l'identification de points de friction facilement abordables dans le cadre de projets expérimentaux peut faciliter l'adhésion des dirigeants. Avec ces éléments en main, les équipes peuvent déterminer à l'avance les critères de réussite et fournir des chiffres ou un retour sur investissement quantifiable et projeté.

La réduction du bruit des événements est également un élément qui peut avoir un impact significatif sur le service. En effet, les grandes entreprises sont assaillies d’événements informatiques. L'utilisation de l'AIOps pour les aider à filtrer, gérer et éventuellement corriger les incidents peut constituer une solution relativement simple, mais très efficace.

2. Permettre l'observation

L'idéal serait que l'AIOps soit intégrée à l'ensemble du parc informatique. En effet, chaque système, sous-système et même chaque nœud final doit être connecté et intégré dans le processus d'analyse et de remédiation automatisée.

Il y a trois raisons à cela. Premièrement, plus les données sont nombreuses, plus le système peut en apprendre. Il doit être capable de lire et comprendre des modèles, ce qui lui permet de devenir plus proactif et indépendant de l'équipe de gestion des opérations - afin que celle-ci puisse se consacrer en priorité aux problèmes complexes qui requièrent son attention. Deuxièmement, les défauts ou les problèmes peuvent se trouver hors de portée du système. Les erreurs informatiques provoquent généralement une succession d'événements, et le fait qu’un système ne connaisse qu’une partie de l’ensemble du tableau n'apporte qu'une valeur limitée. Enfin, comme pour le point précédent, les problèmes causés par les systèmes fondamentaux peuvent n'apparaître qu'à un stade plus avancé de la chaîne de valeur technologique - pour y remédier, il faut atteindre l'ensemble du système afin de trouver la cause principale.

3. Une IA agnostique par domaine

De nos jours, il est courant que les outils de gestion de domaine soient dotés de capacités intelligentes intégrées. S’ils ont leur utilité immédiate, ils fonctionnent généralement en silo. Ils ne sont pas à la hauteur d'une véritable démarche AIOps. Comme mentionné précédemment, les événements symptomatiques ont souvent des causes fondamentales qui sont très éloignées. En bref, l'IA à domaine unique, ou spécifique à un domaine, présente des contraintes relativement importantes par rapport à ses homologues totalement agnostiques.

Avec les systèmes agnostiques, vous pouvez obtenir ce que l'on appelle une réparation immédiate. C’est-à-dire que le système d'IA va orienter les équipes de gestion des opérations directement vers la cause principale ou, idéalement, va entièrement remédier au problème lui-même. Cela se traduit par d'énormes économies de temps et de ressources.

4. Centraliser la donnée

Une méthode fréquemment utilisée pour permettre l'observabilité et accélérer les processus de mise en œuvre consiste à créer un data lake. L'AIOps nécessite des ensembles de données divers et variés pour pouvoir fonctionner efficacement. Il s'agit à la fois de données historiques, qui vont former le système, en lui permettant de savoir ce qui est normal et ce qui ne l'est pas au travers d’analyse de tendances, ou encore comment réagir ou non, et de données actuelles collectées en temps réel pour réagir, remédier et même anticiper les problèmes.

Si de nombreuses entreprises sont équipées d'une forme ou d'une autre de système intelligent pour leurs actifs, ces systèmes sont le plus souvent cloisonnés. Les data lake permettent d’éviter cela tout en offrant des avantages supplémentaires. Tout d'abord, il est facile de développer des tableaux de bord à volet unique qui donnent aux équipes ITOps le même niveau d'observabilité que le système. Ensuite, ils permettent de simplifier les processus de lancement et de déploiement ; les nouveaux projets et programmes pilotes sont plus simples à déployer et la scalabilité est plus facile à atteindre.

5. De l’observation à l’action

L'AIOps est souvent décrite avec des termes passifs, elle est donc réduite à ce qu'elle peut voir et vous dire. Or, elle est bien plus que cela. La dernière étape pour l’exploiter pleinement consiste à ajouter une dernière caractéristique, celle de l'action. C'est en intégrant l'AIOps dans les flux de travail pour automatiser et remédier aux problèmes que l'on obtient la véritable valeur ajoutée.

Le point de départ de tout processus AIOps varie selon les entreprises, de même que l'ordre dans lequel ces étapes sont abordées, mais quoi qu’il arrive, ce sont les cases que vous devrez cocher.