Ce document répertorie les causes des messages d'erreur %SYS-3-CPUHOG et explique comment les résoudre.
Aucune exigence spécifique n'est associée à ce document.
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Pour plus d'informations sur les conventions utilisées dans ce document, reportez-vous à Conventions relatives aux conseils techniques Cisco.
Pour réduire l'impact des processus inactifs, la plate-forme logicielle Cisco IOS® utilise un compteur de surveillance des processus qui permet au planificateur d'interroger périodiquement le processus actif. Cette fonction n'est pas la même que la préemption. Au lieu de cela, il s'agit d'un mécanisme de sécurité intégrée, qui garantit que le système ne devient pas insensible ou complètement verrouillé en raison de la consommation totale du processeur par n'importe quel processus.
Si un processus semble se bloquer (par exemple, s'il continue à s'exécuter pendant une longue période), le planificateur peut forcer l'arrêt du processus.
Chaque fois que le planificateur autorise l'exécution d'un processus sur le processeur, il démarre un minuteur de surveillance pour ce processus. Après une période prédéfinie, si le processus continue à s'exécuter, le processus de surveillance génère une interruption et provoque un redémarrage du routeur par un « plantage logiciel forcé » (la trace de la pile montre un processus de surveillance comme déclencheur du plantage).
La première fois que le chien de garde expire, le planificateur imprime un message d'avertissement tel que :
%SYS-3-CPUHOG: Task ran for 2148 msec (20/13), Process = IP Input, PC = 3199482 -Traceback= 314B5E6 319948A
Ce message indique qu'un processus a bloqué le processeur. Ici, il s'agit du processus « IP Input ». Ce message apparaît généralement dans des circonstances transitoires, telles qu'une insertion et un retrait en ligne (OIR) lorsque le routeur démarre, ou dans des conditions de trafic intense. Les messages « %SYS-3-CPUHOG » ne doivent pas apparaître pendant le fonctionnement normal du routeur.
Si le routeur est occupé au niveau d'interruption après la planification de l'exécution d'un processus, la comptabilisation de la durée d'exécution du processus peut être inexacte. En effet, le CPUHOG ne suit que les tâches de niveau processus. Il ne suit pas les tâches de niveau d'interruption qui sont autorisées à interrompre et à prendre le contrôle du processeur.
Le processus typique à exécuter au niveau d'interruption est la commutation de paquets.
Cette section explique comment dépanner les messages CPUHOG dans différents scénarios.
Les messages CPUHOG au moment de la séquence de démarrage sont assez courants. Le message d'erreur lui-même signifie que le processus d'amorçage a maintenu le processeur juste un peu plus longtemps que ce que le système voulait qu'il tienne, puis a envoyé un message à la sortie de la console pour vous en informer. Dans ce cas, le processus est « Boot Load », ce qui indique où le CPUHOG s'est produit :
System Bootstrap, Version 11.1(12)XA, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Copyright (c) 1997 by cisco Systems, Inc. C1600 processor with 16384 Kbytes of main memory program load complete, entry point: 0x4018060, size: 0x108968 %SYS-3-CPUHOG: Task ran for 2040 msec (6/6), Process = Boot Load, PC =40B513A -Traceback= 407EB6E 407F628 407D118 40180E0 40005B0 4015C3E 40152B2 4014ED4 40025B8 4003086 4015636 40021A8 400C616program load complete, entry point: 0x2005000, size: 0x4195b9 Self decompressing the image : ############################################################################ ############################################################################ ################################################################## [OK]
Vous pouvez ignorer ce message d'erreur en toute sécurité. Au moment du processus de démarrage, le chargeur de démarrage utilise le processeur pendant 2 à 4 secondes et ne le libère pas. Ce n'est pas un problème au démarrage, car le processeur n'a besoin d'exécuter que le chargeur de démarrage à ce stade. Les ROM de démarrage plus récentes suppriment l'impression de ce message particulier.
Vous pouvez également rencontrer un message CPUHOG de l'image d'aide au démarrage chaque fois que le routeur charge une image volumineuse, par exemple, lorsque vous utilisez les routeurs de la gamme Cisco 1600. Ces routeurs sont configurés avec plus de 16 Mo de DRAM.
Ce message apparaît uniquement lorsque l'image est en cours de chargement et n'a aucun effet sur le fonctionnement du système ou le processus de chargement. En tout état de cause, il s'agit d'un problème cosmétique car il n'a pas d'incidence sur le fonctionnement normal du système.
Les messages CPUHOG sont courants au moment d’une OIR, car le routeur doit effectuer un ensemble de tâches complexes et relativement longues. Il n'est pas nécessaire de s'inquiéter des messages CPUHOG qui se produisent pendant les OIR, tant que la carte qui a été insérée s'affiche correctement.
Un message CPUHOG peut s'afficher lorsque vous tentez d'accéder à un périphérique Flash (comme une carte Flash ou un module SIMM) lorsque le périphérique est défectueux ou ne répond pas. Si le problème se reproduit, contactez votre représentant TAC.
Remarque : si vous avez un Catalyst 6500 qui exécute le logiciel Cisco IOS intégré (mode natif) ou le mode hybride, et qui a des messages CPUHOG lorsque vous formatez le bootflash MSFC (RP) : , il peut s'agir du problème mentionné dans l'ID de bogue Cisco CSCdw53175 (clients enregistrés uniquement) , qui est résolu dans les versions du logiciel Cisco IOS 12.1.11b, 12.1(12c)E5, ou 12.1(13)E, et ultérieures.
Sur les routeurs Internet de la gamme Cisco 12000, la base d'informations de transmission (FIB) est conservée sur chaque carte de ligne pour une utilisation dans la commutation de paquets. En raison de la structure de l'arborescence FIB, les modifications de routage avec des masques de sous-réseau courts (entre /1 et /4) peuvent provoquer des messages comme celui-ci dans le journal de la console :
SLOT 1: %SYS-3-CPUHOG: Task ran for 4024 msec (690/0), process = CEF IPC Background, PC = 400B8908. -Traceback= 400B8910 408FF588 408FF6F4 408FFE8C 400A404C 400A4038
Lorsqu'un processus dans le logiciel Cisco IOS s'exécute pendant plus de 2 000 ms (2 secondes), un message CPUHOG s'affiche. Dans le cas des mises à jour CEF (Cisco Express Forwarding) pour les masques de sous-réseau très courts, le traitement requis peut dépasser 2 000 ms, ce qui peut déclencher ces messages. Le processus « CEF IPC Background » est le processus parent qui contrôle l'ajout et la suppression de préfixes dans l'arborescence de transfert.
En outre, si le processeur est verrouillé pendant une période prolongée, la carte de ligne peut se bloquer en raison d'une défaillance de la commande ping de fabric, ou ce FIB peut être désactivé en raison de délais de communication IPC perdus. Si vous avez besoin de dépanner ces problèmes, consultez Dépannage des délais et des pannes de ping de fabric sur le routeur Internet de la gamme Cisco 12000.
En général, les mises à jour de routage avec des masques inférieurs à /7 sont erronées ou malveillantes. Cisco recommande à tous les clients de configurer un filtrage de route adéquat pour empêcher le traitement et la propagation de ces mises à jour. Si vous avez besoin d'aide pour configurer les filtres de routage, contactez votre représentant du support technique.
Un message CPUHOG peut également être déclenché en raison du processus « CEF IPC Background » lorsque vous effacez le protocole BGP (Border Gateway Protocol) ou la table de routage.
La plupart du temps, ces messages d'erreur sont dus à un bogue logiciel interne dans le logiciel Cisco IOS.
La première étape pour dépanner ce type de message d'erreur consiste à rechercher un bogue connu. Vous pouvez utiliser la boîte à outils des bogues (clients enregistrés seulement) pour trouver un bogue qui correspond à l'erreur. Dans la page Bug Toolkit, cliquez sur Launch Bug Toolkit, et sélectionnez Search for Cisco IOS-related bugs. Pour affiner votre recherche, vous pouvez sélectionner la version de votre logiciel Cisco IOS sous le numéro 1. Sous le numéro 3, vous pouvez effectuer une recherche par mot clé pour "CPUHOG, <process>" où process est le processus correspondant, tel que Virtual Exec ou IP Input.
Vous pouvez effectuer une mise à niveau vers la dernière image du logiciel Cisco IOS dans votre catégorie de version pour éliminer tous les bogues CPUHOG corrigés.
Si vous avez toujours besoin d'aide après avoir suivi les étapes de dépannage ci-dessus et que vous souhaitez ouvrir une demande de service (pour les clients enregistrés uniquement) auprès du TAC Cisco, veillez à inclure les informations suivantes : |
---|
Remarque : veuillez ne pas recharger ou mettre hors tension puis sous tension manuellement le routeur avant de collecter les informations ci-dessus, sauf si cela est nécessaire pour dépanner une panne de carte de ligne sur le routeur Internet de la gamme Cisco 12000, car cela peut entraîner la perte d'informations importantes nécessaires pour déterminer la cause première du problème. |
Révision | Date de publication | Commentaires |
---|---|---|
1.0 |
24-Jun-2008 |
Première publication |