Les solutions aux 10 principaux problèmes de réseau

La journée d’un administrateur système est rythmée par les questions qu’il se pose ainsi que celles qui lui sont posées par ses responsables, collègues et clients. Voici les solutions aux problèmes de réseau les plus fréquemment rencontrés.

La journée d’un administrateur système est rythmée par les questions qu’il se pose ainsi que celles qui lui sont posées par ses responsables, collègues et clients. Voici les solutions aux problèmes de réseau les plus fréquemment rencontrés.

1.Comment garantir le bon fonctionnement du système informatique ?

Tout administrateur souhaiterait être averti lorsqu’un événement anormal se produit : pannes du serveur, valeurs atteignant un seuil critique… mais aussi être informé des anomalies concernant par exemple la surcharge de composants, la température de serveurs, les redémarrages intempestifs de serveurs Windows pendant la nuit ; de même lorsque la mémoire est manquante ou en cas de mise à jour de la connexion Internet lors d’un usage accru de la bande passante. En recevant ces données d’analyse détaillées sur l’ensemble des composants réseau, il est désormais possible pour l’administrateur de réagir avant que la situation n’empire mais également de savoir précisément lorsqu’il convient d’investir dans de nouvelles ressources matérielles.   

2. Comment garantir une surveillance sans défaillance ?     

Différentes causes peuvent être à l’origine de pannes Internet : défaillance du matériel, mise à jour logicielle provoquant un temps mort du système d’exploitation, intervalles dans la surveillance des données… Il est opportun de se doter d’un clustering par basculement avec un nœud principal et un ou plusieurs nœuds de basculement. Chaque nœud peut assurer lui-même la surveillance complète et donner l’alerte. Dans une configuration de basculement simple, un nœud peut assurer le rôle d’un autre nœud si ce dernier subit une panne. Ainsi les temps morts de surveillance sont évités. Il devient alors possible de garantir une surveillance sans interruption et une alerte indépendante depuis un site unique, un centre de données ou une connexion réseau.

3. Comment réagir si un service ou un serveur est en panne ?        

En cas d’erreur du serveur, l’une des méthodes de récupération les plus courantes, consiste à le redémarrer. En cas d’interruption de service pendant la surveillance, une notification par SMS ou courrier électronique est envoyée. Dans certains cas, le redémarrage automatique peut s'avérer utile. Un système de notification permet d'effectuer aisément un redémarrage automatique : il suffit de créer un script qui redémarre les services ou le système global et de recourir à une notification « exécuter programme ». Le script est alors exécuté et le redémarrage s’effectue sans aucune intervention. La surveillance de services Windows spécifiques permet même de choisir une option de redémarrage automatique lorsqu’ un service est en panne.

4. Comment limiter et planifier la surveillance ?      

Il est parfois nécessaire de mettre les appareils hors service, par exemple, pour des raisons de maintenance, le week-end ou la nuit. Lors de ces temps d’arrêts prévus, il est inutile de recevoir des notifications. Mettre en pause manuellement la surveillance de certains capteurs d’un vaste réseau est une tâche fastidieuse. On peut alors implémenter une fonction dédiée à la maintenance et à d’autres temps d’arrêts planifiés et définir pour chaque groupe, appareil ou tout autre objet, des calendriers qui limitent automatiquement le temps de surveillance. Ainsi, cela permet de ne pas être notifié inutilement en cas de temps d’arrêt planifiés.

5. Comment optimiser les performances de la base de données ?   

Pour optimiser les performances d’une base de données dont l’exécution est médiocre, il convient de savoir quelle partie doit être analysée. Toutefois l’examen de motifs, par exemple, de la mauvaise exécution des serveurs SQL, peut être une tâche fastidieuse. Le nombre excessif de connexions utilisateurs simultané peut provoquer des performances réduites. Il suffira de s’équiper de capteurs en mesure d’indiquer le nombre de connexions utilisateurs. Ces capteurs peuvent également afficher le pourcentage de pages trouvées dans le cache des tampons, sans avoir à procéder à une lecture depuis le disque. Si ce nombre est trop faible et si une notification est adressée, il devient possible d’augmenter la quantité de mémoire disponible du serveur SQL. Il est également possible de mesurer le temps de réponse des requêtes et de vérifier si la valeur de la réponse est bien la valeur attendue.

6. Comment ne plus se soucier du statut des imprimantes ?

La vérification quotidienne et manuelle du statut des imprimantes de l’infrastructure IT demande beaucoup temps. Solution : surveiller toutes les tâches sur un serveur d’impression. En cas d’insuffisance de papier un message permet de réagir instantanément. Il est possible non seulement de surveiller les paramètres matériels des imprimantes à l’aide d’un capteur disponible en mode natif mais aussi d’obtenir une notification lorsque le toner est faible, ou d’adresser automatiquement un courrier électronique au fournisseur pour procéder à la livraison de toners neufs et à l’échange des anciens.      

7. Quelles sont les raisons à l’origine des fréquents blocages de la machine virtuelle ?      

Plusieurs raisons peuvent être la cause de blocages survenant avec les machines virtuelles. Un contrôle des différentes valeurs mesurées peut aider à prévenir et résoudre bon nombre de problèmes. Pour contrôler une machine virtuelle VMware il convient de surveiller l’UC et l’utilisation de la mémoire des machines virtuelles via SOAP, ainsi que la vitesse du réseau d’une seule machine virtuelle.
Si toutefois la vitesse est trop lente ou si la mémoire est surchargée sur une MV ; il est utile de pouvoir surveiller également le matériel hôte. Cela permet de comprendre si l’origine des problèmes survenant sur les machines virtuelles est une panne du matériel hôte. Si le statut général du VMware hôte est autre que « normal », alors le problème sera signalé dans le message du capteur.

8. Comment garantir la sécurité de son réseau ?     

Il est important de garantir le fonctionnement et la mise à jour des scanneurs antivirus de tous les ordinateurs. La dernière version de Windows doit être exécutée pour les mises à jour en matière de sécurité. Une solution de contrôle de réseau peut détecter des comportements inhabituels et alerter l’administrateur. On peut également contrôler manuellement les connexions du réseau : vérifier par exemple si des connexions via le firewall proviennent d’adresses inconnues…
Par sécurité il est préférable d’analyser le trafic à travers des fonctions spéciales de contrôle comme par exemple demander des rapports sur les ports les plus fréquemment utilisés ou une liste des requêtes les plus consultées…
Autre point utile : analyser quels systèmes ou mesures montrent des résultats de contrôles similaires, ce qui peut permettre de reconnaitre les interconnexions anormales entre des systèmes et le réseau. De plus des solutions de surveillance contrôlent l’ensemble du réseau comme la date limite d’un logiciel antivirus d’un ordinateur sous Windows.

9. Comment régler la qualité audio des appels téléphoniques et les flux vidéo ?     

Si la qualité audio des appels de Voix sur IP (VoIP) chute considérablement ou si le flux vidéo présente de fréquentes anomalies, il faudra analyser les différents paramètres tels que l’instabilité, la perte de paquets ou la variation du retard de paquets de la connexion réseau. En effet, les services VoIP et le flux vidéo dépendent largement du flux constant des paquets de données.
Par exemple, la qualité du service chute lorsque les paquets UDP ne sont pas reçus à temps ou si les paquets sont perdus ou hors service. Une solution de surveillance de réseau est un bon outil de mesure de la qualité des connexions. Par exemple en envoyant des paquets UDP et en analysant la variation des paramètres réseau. On peut aussi surveiller les paramètres pertinents de VoIP grâce à l’analyse des résultats des SLAs liés au matériel Cisco.

10. Comment prévenir des problèmes sur ses pages Web ?  

La disponibilité et les temps de chargement des pages Web sont un point crucial non seulement pour les magasins en ligne mais aussi pour toute entreprise. Une solution de surveillance intelligente permet d’éviter toute perte de revenus en alertant immédiatement l’administrateur en cas de problème sur le site web de l’entreprise, ou bien en cas de comportement inhabituel tel qu’une vitesse de téléchargement trop faible.
L’administrateur a la possibilité de surveiller le temps de chargement de la page web, de mesurer le délai de finalisation d’un achat en ligne, ou bien de surveiller le nombre de demandes et le volume de données transférées à des moments différents. Ce dernier permet d’identifier les pics de trafic à des moments spécifiques afin de déterminer lorsqu’il est nécessaire d’accroître la bande passante.   
Apporter les solutions permettant de garantir le fonctionnement de systèmes de base et d’améliorer la qualité, la sécurité et les performances du réseau, voilà le défi relevé !