Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document décrit la cause des dépassements du délai de surveillance sur les routeurs Cisco et explique comment les dépanner.
Les lecteurs de ce document devraient avoir connaissance des sujets suivants :
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
Tous les routeurs Cisco
Toutes les versions du logiciel Cisco IOS®
Remarque : Ce document ne s'applique pas aux commutateurs Cisco Catalyst ou aux plates-formes MGX, mais uniquement aux routeurs Cisco.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
For more information on document conventions, refer to the Cisco Technical Tips Conventions.
Les processeurs de Cisco ont des temporisateurs qui assurent une protection contre certains types de figeages système. La CPU réinitialise périodiquement un temporisateur de chien de garde. Le temporisateur du chien de garde contrôle la durée de chaque processus. Si le temporisateur n'est pas réinitialisé, le programme est interrompu. Si un processus est plus long qu'il ne doit l'être, le minuteur de surveillance est utilisé pour échapper à ce processus.
Cela ne se produit que si quelque chose ne va pas. En fonction de la situation, le routeur peut se réinitialiser lui-même ou se remettre de la défaillance et générer un message d'erreur dans les journaux de console, qui ressemble à ceci :
*** Watch Dog Timeout *** PC = 0x6022536C, SP = 0x00000000
ou
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec *** System received a Software forced crash *** signal = 0x17, code = 0x24, context= 0x60ceca60
Si vous n'éteignez pas le routeur ou ne le rechargez pas manuellement, la sortie de la commande show version ressemble à ceci :
Router#show version ... Router uptime is 1 hour, 47 minutes System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000 System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash ...
Si vous disposez de la sortie d'une commande show version de votre périphérique Cisco, vous pouvez utiliser Cisco CLI Analyzer pour afficher les problèmes potentiels et les correctifs. Pour utiliser Cisco CLI Analyzer, vous devez être un client inscrit, être connecté et avoir activé JavaScript.
La cause première du délai d'attente du chien de garde peut être liée au matériel ou au logiciel. Voici les symptômes courants qui vous permettent d'identifier la source du problème :
Si un routeur qui fonctionne correctement depuis des mois commence soudainement à recharger toutes les 20 minutes, ou s'il redémarre continuellement et que vous ne pouvez plus y accéder, le problème est probablement lié au matériel. C'est également le cas si un nouveau module a été installé récemment et que le routeur tombe en panne par le dépassement du délai d'attente du chien de garde par la suite.
Si le routeur commence à s’écraser après une modification de configuration ou de la version du logiciel Cisco IOS, il s’agit probablement d’un problème lié au logiciel.
La première étape du dépannage de ce type de problème consiste à identifier le type de délai d'attente de chien de garde que vous rencontrez. Il existe deux types de temporisation Watchdog :
Le délai d'attente de Software Watchdog, qui, malgré son nom, est souvent lié au matériel
Le délai de surveillance des processus, souvent lié aux logiciels
Ce délai d'attente est dû à une boucle infinie au niveau d'interruption ou à un problème matériel. Voici quelques indications de ce type de délai d'attente :
Les journaux de console contiennent les lignes suivantes :
*** Délai d'attente des chiens de surveillance ***
PC = 0x6022536C, SP = 0x0000000
La sortie show version indique le motif de rechargement comme un « temporisateur de chien de garde expiré » :
Router#show version ... Router uptime is 1 hour, 47 minutes System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000 System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
Aucun fichier crashinfo n'est généré. Voir Récupération d'informations à partir du fichier Crashinfo pour plus de détails.
La plupart du temps, ces messages indiquent un problème matériel, soit avec la carte processeur principale, soit avec l'un des modules.
Après avoir identifié un délai d'attente de surveillance logicielle, l'étape suivante consiste à vérifier le résumé des avis de champs de produit pour votre plate-forme et tous les composants installés dans ce système pour détecter les problèmes matériels critiques connus. Par exemple, il existe un avis de champ pour les routeurs de la gamme Cisco 3600 : Délais d'attente du module de surveillance PRI Cisco 3600 T1/E1. Assurez-vous de consulter les avis de champ avant de procéder à un dépannage plus approfondi.
Si un nouveau module a été récemment installé, vous devez d'abord essayer de le supprimer pour vérifier si c'est la raison du dépassement du délai de surveillance. Si le délai d'attente du chien de garde persiste, essayez de réinstaller tous les composants amovibles.
Si le délai d'attente du chien de garde se poursuit à ce stade, il n'y a aucun avis de champ pour votre matériel et si aucun nouveau module n'a été installé récemment, allez-y et remplacez la carte processeur principale. Sur les plates-formes haut de gamme, la carte processeur est une carte séparée (comme le NPE-400 ou le RSP8). Sur les plates-formes bas de gamme (Cisco 1700, 2500, 4000, 2600, 3600, etc.), la carte mère ne peut pas être livrée séparément. Dans ce cas, vous devez remplacer le châssis lui-même.
Ce délai d'attente est dû à une boucle infinie au niveau du processus. Voici quelques indications de ce délai :
Les journaux de console contiennent les lignes suivantes :
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec *** System received a Software forced crash *** signal = 0x17, code = 0x24, context= 0x60ceca60
La sortie de la commande show version signale le crash comme un « crash forcé par logiciel » :
Router#show version ... Router uptime is 2 days, 21 hours, 30 minutes System restarted by error - Software-forced crash, PC 0x316EF90 at 20:22:37 edt System image file is "flash:c2500-is-l.112-15a.bin", booted via flash
Un fichier crashinfo est généré pour les plates-formes qui le prennent en charge.
Ce problème est probablement un bogue du logiciel Cisco IOS.
Si vous disposez de la sortie d'une commande show stacks de votre périphérique Cisco, vous pouvez utiliser Cisco CLI Analyzer pour afficher les problèmes potentiels et les correctifs. Pour utiliser Cisco CLI Analyzer, vous devez être un client inscrit, être connecté et avoir activé JavaScript.
Cependant, le système était coincé dans une boucle avant le rechargement. Par conséquent, la trace de la pile n'a pas nécessairement besoin d'être pertinente. Vous pouvez effectuer une mise à niveau vers la dernière version du logiciel Cisco IOS de votre série de versions afin d'éliminer tous les problèmes connus de Process Watchdog. Si une panne survient après la mise à niveau, collectez autant d'informations que possible (voir Dépannage des pannes de routeur) et contactez votre représentant du support technique.
Il existe d'autres messages d'erreur de console liés aux minuteurs de surveillance. Ne confondez pas ces messages avec un plantage du compteur de surveillance. Assurez-vous de vérifier la signification de ces messages d'erreur à l'aide du décodeur de messages d'erreur (clients enregistrés uniquement). Cet outil vous donne une explication détaillée de nombreux messages d'erreur et vous recommande des actions pour les résoudre.
Considérez ce message :
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = [chars]
Ce message indique que le processus spécifié est exécuté depuis trop longtemps et que le processeur n'a pas été abandonné. Le système a arrêté le processus indiqué. En fonction de votre configuration, cela peut entraîner une panne du système. Si le message ne se produit qu'une seule fois, vous n'avez pas besoin d'agir. Cependant, si cela se produit à nouveau, vous devez le traiter comme un délai de surveillance du processus, et prendre les mesures nécessaires.
Si vous avez encore besoin d'assistance après avoir suivi les étapes de dépannage ci-dessus et que vous souhaitez ouvrir une demande de service (clients enregistrés uniquement) auprès du TAC Cisco, veillez à inclure les informations suivantes : |
---|
Veuillez joindre les données rassemblées à votre demande de service en format non compressé et texte clair (.txt). Vous pouvez joindre des informations à votre demande de service en les téléchargeant à l'aide de l'outil TAC Service Request (clients enregistrés uniquement). Si vous ne pouvez pas accéder à l'outil de demande de service, vous pouvez envoyer les informations dans une pièce jointe d'un e-mail à attach@cisco.com avec votre numéro de demande de service dans la ligne d'objet de votre message. Remarque : Ne redémarrez pas manuellement le routeur ou ne le mettez pas hors tension avant de collecter les informations ci-dessus, sauf si cela est nécessaire pour résoudre un problème de carte de ligne sur le routeur Internet de la gamme Cisco 12000, car cela peut entraîner la perte d'informations importantes nécessaires pour déterminer la cause première du problème. |