Utiliser l'AIOps pour répondre aux trois grands défis opérationnels de l'IT

Comment utiliser l'intelligence artificielle pour piloter la résolution d'incidents réseau en déchargeant les équipes informatiques des tâches chronophages ? Le point.

Jusqu’à récemment, le traitement des incidents réseau consistait principalement à dépanner les utilisateurs en face à face ou à se réunir dans une salle de conférence pour planifier les prochaines étapes. Aujourd’hui, la plupart des équipes informatiques travaillent à distance, et essayent de résoudre les problèmes des autres télétravailleurs en ayant très peu d’informations sur les pannes et d’interaction avec leurs collègues. Les projets de retour au bureau s’avèrent également difficiles car, faute vraies données, il faut souvent faire des estimations que ce soit pour planifier une meilleure couverture réseaux ou mettre en place les nouveaux programmes de santé et de sécurité qui intègrent l’analyse de la recherche des contacts et le contrôle d’accès.

Par conséquent, il reste peu de temps et de ressources pour traiter les problèmes intermittents, répondre à chaque utilisateur et passer d’un outil de gestion à un outil opérationnel.

Dans ces scénarios, l’adoption de l’intelligence artificielle pour les opérations informatiques (AIOps) peut aider les équipes surchargées à gérer les problèmes quotidiens tout en travaillant sur des projets critiques de retour au bureau. Ce concept combine l’utilisation de l’analyse des données, de l’apprentissage machine et de l’automatisation pour améliorer la capacité de l’informatique à résoudre des incidents et, dans de nombreux cas, à améliorer l’efficacité.

Problème n° 1 : résoudre les incidents réseau de manière proactive

De nos jours, la résolution des problèmes nécessite des données et des informations que les utilisateurs ou les appareils IoT ne peuvent souvent pas transmettre par eux-mêmes. Par exemple, si un utilisateur se plaint que les appels vidéo ne cessent de décrocher, l’équipe support a un point de départ, mais ce renseignement seul ne suffit pas à résoudre le problème. Souvent, il faut davantage de recherche, par exemple en organisant une visioconférence avec l’utilisateur pour voir ce qui se passe ou, pour l’IoT, en se plongeant dans un outil de gestion pour repérer les anomalies. Autant d’actions qui demandent du temps et du personnel.

C’est là que l’AIOps peut aider. Grâce à un AIOps efficace, les équipes peuvent identifier et anticiper ce type de problèmes, avant que les utilisateurs ne soient touchés. Cela nécessite que les données soient collectées à partir de tous les dispositifs sans fil, des commutateurs et des passerelles SD-WAN pour créer une base opérationnelle pour l’ensemble de l’écosystème, y compris certains scénarios de télétravail. Si les performances du réseau ou d’une application s’écartent de la norme, le service informatique peut prendre des mesures proactives pour résoudre le problème avant même que les utilisateurs finaux ne s’en rendent compte. L’AIOps doit également inclure des fonctions de recherche faciles à utiliser, basées sur le langage naturel, qui permettent au personnel informatique de localiser rapidement l’utilisateur, le périphérique réseau ou les problèmes spécifiques au site en cas d’incident.

Problème n° 2 : réduire les efforts de dépannage

Essayer d’identifier et de résoudre un problème simple prend du temps, et cela peut occuper des ressources qui pourraient être utilisées ailleurs. La plupart des équipes informatiques ne savent plus quel pourcentage de temps est consacré au dépannage, à la consultation des logs ou à la résolution d’un problème avec un utilisateur. Les équipes étant plus sollicitées que jamais par un réseau à qui ont demande d’en faire plus, réduire les efforts de dépannage est essentiel.

Comme l’AIOps surveille en permanence les niveaux de service clés pour détecter les incidents, les informations fournies par l’IA peuvent indiquer à l’équipe informatique les causes réelles des problèmes afin de les traiter, comme par exemple des réglages de puissance de 2,4 GHz et 5 GHz incorrects sur les points d’accès. Cela peut se traduire par la résolution d’un problème en quelques minutes au lieu de plusieurs heures, en sachant simplement par où commencer et quoi modifier. C’est la clé pour résoudre les problèmes intermittents.

Problème n°3 : Renforcer la visibilité

Tout aussi important pour résoudre un problème, l’AIOps doit apprendre en permanence, à mesure que l’environnement évolue, et ajuster dynamiquement les bases de référence critiques. S’il est utile de saisir les informations fournies pour des problèmes similaires susceptibles de se poser à nouveau à l’avenir, l’objectif est avant tout de rester au courant des changements sans fixer de seuils statiques ou d’attentes en matière de niveau de service (SLE).

Cela permet d’éliminer la nécessité de procéder à des tests sur la base d’hypothèses obsolètes. Effectuer un changement de configuration et attendre de voir si le changement entraîne une augmentation des appels au service d’assistance ou une résolution n’aide pas vraiment si d’autres variables ont changé. C’est là que la connaissance du réseau acquise par l’AIOps devient un avantage : ce contexte supplémentaire peut être essentiel pour une résolution rapide ou un effort d’optimisation.

Ces informations doivent indiquer aux équipes les raisons pour lesquelles les problèmes avec le Wi-Fi, les commutateurs, le WAN et les applications peuvent se produire, ainsi que des recommandations sur ce qu’il faut modifier dans une configuration. L’élimination des questions inutiles dès le départ peut ainsi réduire considérablement le temps de résolution et offrir une meilleure expérience à tous.

Gagner du temps pour l’innovation

La résolution de ces trois questions essentielles permettra d’améliorer l’efficacité de l’IT : il faut du temps pour trouver des moyens de tirer le meilleur parti d’une infrastructure existante, du temps pour s’attaquer à des projets futurs qui amélioreront encore le réseau et du temps pour effectuer un travail plus gratifiant qui apportera une valeur ajoutée à l’entreprise à plus long terme.

Grâce à la détection automatisée des anomalies, aux conseils de dépannage et aux recommandations d’optimisation fiables de l’AIOps, cette efficacité accrue permettra aux équipes d’être plus heureuses et plus productives, que ce soit en télétravail, au bureau ou sur la route.