Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Du temps et des ressources précieuses sont souvent perdus à remplacer du matériel qui fonctionne en fait correctement. Ce document aide à résoudre les problèmes matériels courants avec les routeurs Internet de la gamme Cisco 12000 et fournit des pointeurs permettant d'identifier si la défaillance se trouve ou non dans le matériel.
Remarque : Ce document ne couvre pas les pannes liées aux logiciels, sauf celles qui sont souvent considérées comme des problèmes matériels.
Remarque : En outre, ce document ne couvre pas les étapes de dépannage matériel des cartes de ligne Cisco 12000. Dépannage matériel pour les défaillances des cartes de ligne de routeur Internet de la gamme Cisco 12000 détaille les étapes à suivre pour résoudre un problème matériel avec une carte de ligne et/ou identifier un problème avec une carte de ligne qui pourrait être mal interprétée comme une défaillance matérielle.
Les lecteurs de ce document doivent avoir une bonne connaissance de ce qui suit :
Architecture de routeur Internet de la gamme Cisco 12000 : ce document vous aide à comprendre l'architecture spécifique de cette plate-forme distribuée afin de mieux résoudre tous les problèmes matériels que vous pourriez rencontrer.
Routeur Internet de la gamme Cisco 12000 : Forum aux questions
Problèmes matériels connus pour les routeurs Internet de la gamme Cisco 12000 dans les routeurs Internet de la gamme Cisco 12000 Problèmes connus.
Si vous pensez que le problème peut être lié à une défaillance matérielle, ce document peut vous aider à identifier la cause de la défaillance.
Les informations dans ce document sont basées sur les versions de logiciel et de matériel ci-dessous.
Tous les routeurs Internet de la gamme Cisco 12000, y compris les modèles 12008, 12012, 12016, 12404, 12406, 12410 et 12416.
Toutes les versions du logiciel Cisco IOS® qui prennent en charge le routeur Internet de la gamme Cisco 12000.
Les informations présentées dans ce document ont été créées à partir de périphériques dans un environnement de laboratoire spécifique. All of the devices used in this document started with a cleared (default) configuration. Si vous travaillez dans un réseau opérationnel, assurez-vous de bien comprendre l'impact potentiel de toute commande avant de l'utiliser.
Lorsque vous installez une nouvelle carte de ligne, un nouveau module ou une nouvelle image logicielle Cisco IOS®, il est important de vérifier que le routeur dispose de suffisamment de mémoire et que le matériel et le logiciel sont compatibles avec les fonctionnalités que vous souhaitez utiliser.
Procédez comme suit pour vérifier la compatibilité matérielle-logicielle et les besoins en mémoire :
Utilisez l'outil Software Research (clients enregistrés uniquement) pour choisir un logiciel pour votre périphérique réseau.
Conseils :
La section Software Support for Hardware (Assistance logicielle pour le matériel) vous aide à vérifier si les modules et les cartes installés sur le routeur sont pris en charge par la version logicielle Cisco IOS souhaitée.
La section Software Support for Features (Assistance logicielle pour les fonctionnalités) vous aide à déterminer l'image logicielle Cisco IOS requise en choisissant les types de fonctionnalités que vous souhaitez implémenter.
Utilisez la zone du logiciel de téléchargement pour vérifier la quantité minimale de mémoire (RAM et Flash) requise par le logiciel Cisco IOS et/ou télécharger l'image du logiciel Cisco IOS. Pour déterminer la quantité de mémoire (mémoire vive et mémoire Flash) installée sur votre routeur, reportez-vous à la section Mémoire requise de Comment choisir une version du logiciel Cisco IOS.
Conseils :
Si vous souhaitez conserver les mêmes fonctionnalités que la version actuellement en cours d'exécution sur votre routeur, mais que vous ne savez pas quel jeu de fonctionnalités vous utilisez, entrez la commande show version à partir de votre périphérique Cisco, puis collez-la dans l'analyseur CLI Cisco. Vous pouvez utiliser Cisco CLI Analyzer pour afficher les problèmes potentiels et les correctifs. Pour utiliser Cisco CLI Analyzer, vous devez être un client inscrit, être connecté et avoir activé JavaScript. Il est important de vérifier la prise en charge de fonctionnalité, surtout si vous prévoyez d'utiliser des fonctionnalités logicielles récentes.
Si vous déterminez qu'une mise à niveau du logiciel Cisco IOS est requise, suivez la Procédure d'installation et de mise à niveau du logiciel pour le routeur de la gamme Cisco 12000.
Conseil : Pour plus d'informations sur la récupération d'un routeur de la gamme Cisco 12000 coincé dans ROMmon (invite rommon # >), consultez Procédure de récupération ROMmon pour le Cisco 12000.
Pour plus d'informations sur les conventions des documents, référez-vous aux Conventions utilisées pour les conseils techniques de Cisco.
Les composants du châssis de routeur Internet de la gamme Cisco 12000 sont les suivants :
Châssis
Cartes de matrice de commutation (SFC)
Cartes du planificateur d'horloge (CSC)
BUS de maintenance (MBUS)
Alimentations électriques
Souffleurs - ensemble ventilateur
Cartes d'alarme
Le châssis lui-même ne comporte pas de composants électroniques. Il est donc très rare qu'il soit à l'origine de problèmes matériels, sauf si certains des connecteurs du fond de panier sont tordus ou cassés. Les modules d'alimentation, les SFC, les CSC, les cartes d'alarme et les ventilateurs sont tous équipés de composants électroniques qui peuvent être affectés par des problèmes matériels. En règle générale, les problèmes matériels liés à ces composants provoquent des messages d'erreur ou le routeur ne fonctionne pas. Pour une explication détaillée de tous ces composants et de leur interaction, consultez Architecture de routeur Internet de la gamme Cisco 12000.
En lisant les informations ci-dessous et en suivant les étapes de dépannage, vous pouvez déterminer si les problèmes que vous rencontrez avec votre routeur sont liés au matériel.
La première chose à faire est d'identifier la cause des erreurs de panne du routeur ou de console que vous voyez. Pour savoir quelle partie est peut-être défectueuse, il est essentiel de collecter les résultats des commandes suivantes :
show context summary
show logging
En plus de ces commandes show spécifiques, vous devez également recueillir les informations suivantes :
Journaux de console et/ou informations Syslog : Ces facteurs peuvent être essentiels pour déterminer le problème d'origine si plusieurs symptômes surviennent. Si le routeur est configuré pour envoyer des journaux à un serveur syslog, vous pouvez voir des informations sur ce qui s'est passé. Pour les journaux de console, il est préférable d'être directement connecté au routeur sur le port de console en utilisant la journalisation activée.
Afficher le support technique : La commande show technical-support est une compilation de plusieurs commandes différentes, notamment show version, show running-config et show stacks. Lorsqu'un routeur rencontre des problèmes, l'ingénieur du centre d'assistance technique Cisco (TAC) demande généralement ces informations. Il est important de collecter le show technical-support avant d'effectuer un rechargement ou un cycle d'alimentation, car ces actions peuvent entraîner la perte de toutes les informations sur le problème.
Il y a quelques problèmes qui peuvent être mal interprétés comme des problèmes matériels, alors qu'en fait ils ne le sont pas. Certains des problèmes les plus courants sont lorsque le routeur cesse de répondre ou lorsqu'il est suspendu. Une autre est une défaillance suite à une nouvelle installation matérielle. Il est très rare que l'un de ces symptômes soit causé par un composant du châssis. Le tableau ci-dessous répertorie les symptômes, les explications et les étapes de dépannage pour ces problèmes fréquemment mal interprétés :
Symptôme | Explication/Dépannage |
---|---|
Le Cisco 12000 se bloque en fonctionnement normal | Cela est généralement dû à des problèmes logiciels, mais peut également être dû au matériel. Voir Dépannage des blocages de routeur pour ce problème. |
Une nouvelle carte de ligne n'est pas reconnue | Utilisez l'outil Software Research (clients enregistrés uniquement) pour déterminer si la nouvelle carte est prise en charge dans votre version actuelle du logiciel Cisco IOS. Si le LC est pris en charge, configurez la mise à niveau du service all, enregistrez la configuration avec la commande copy run start et mettez le routeur hors tension. Parfois, un rechargement n'est pas suffisant, mais un cycle d'alimentation résout le problème. Si la nouvelle carte n'est pas prise en charge dans votre version actuelle du logiciel Cisco IOS, vérifiez que vous disposez d'une mémoire de route suffisante installée sur la carte de ligne avant de mettre à niveau la version du logiciel Cisco IOS. Pour la version 12.0(21)S, 256 Mo de mémoire de route sont requis, en particulier si le protocole BGP (Border Gateway Protocol) est configuré avec de nombreux homologues et de nombreuses routes. |
L'utilisation du processeur est très élevée | Bien que des problèmes matériels puissent en être la cause, il est beaucoup plus probable que le routeur soit mal configuré ou que quelque chose sur le réseau soit à l'origine du problème. Reportez-vous à Dépannage de l'utilisation élevée du CPU sur un routeur Cisco pour résoudre ce problème. |
Les erreurs d'allocation de mémoire ne sont presque jamais causées par des problèmes matériels. | |
Un nombre croissant de pertes d'entrée est visible dans le résultat de la commande show interfaces | Cela n'est jamais dû à un problème matériel avec le routeur. Reportez-vous à Dépannage des pertes d'entrée sur le routeur Internet de la gamme Cisco 12000 pour résoudre ce problème. |
Un nombre croissant de messages ignorés apparaît dans la sortie de la commande show interfaces | L'une des cartes de ligne est probablement surchargée. Suivez les étapes décrites dans Dépannage des erreurs ignorées et des pertes de mémoire sur le routeur Internet de la gamme Cisco 12000. |
Les messages d'erreur FIB (Forwarding Information Base) sont affichés sur le protocole GRP | Utilisez l'outil Cisco Error Message Decoder (clients enregistrés uniquement) pour trouver des informations sur la signification de ce message d'erreur. Certains signalent un problème matériel sur la carte de ligne ou sur une carte de matrice de commutation (SFC ou CSC); d'autres indiquent un bogue logiciel Cisco IOS ou un problème matériel sur une autre partie du routeur. Certains messages FIB et CEF sont expliqués dans Dépannage des messages d'erreur CEF. |
Les messages relatifs à la communication interprocessus (IPC) sont affichés sur le protocole GRP. | Vous pouvez utiliser l'outil Cisco Error Message Decoder (clients enregistrés uniquement) pour trouver des informations sur la signification de ce message d'erreur. Certains signalent un problème matériel sur la carte de ligne ou sur une carte de matrice de commutation (SFC ou CSC); d'autres indiquent un bogue logiciel Cisco IOS ou un problème matériel sur une autre partie du routeur. Certains messages liés à IPC sont expliqués dans les routeurs des gammes Cisco 12000, 10000, 7600 et 7500 : Dépannage des messages IPC-3-NOBUFF. |
Les messages d'erreur suivants sont affichés sur le protocole GRP : %GRP-3-FABRIC_UNI: Unicast send timed out (1) %GRP-3-COREDUMP: Core dump incident on slot 1, error: Fabric ping failure |
Les échecs de ping de fabric se produisent lorsqu'une carte de ligne ou le GRP secondaire ne répond pas à une requête ping de fabric provenant du GRP principal sur le fabric de commutation. De telles défaillances sont un symptôme problématique qui doit être étudié. Pour plus d'informations sur ce problème, reportez-vous à la section Dépannage des pannes et des délais d'attente des requêtes ping de fabric sur le routeur Internet de la gamme Cisco 12000. |
Le message d'erreur suivant apparaît sur le protocole GRP : %GRP-3-UCODEFAIL: Download failed to slot 5 |
L'image téléchargée sur la carte de ligne a été rejetée par la carte de ligne. Vous pouvez essayer de recharger le microcode à l'aide de la commande de configuration microcode reload. Si le message d'erreur se reproduit, essayez de mettre à niveau la mémoire ROM de l'agent MBUS, la mémoire RAM de l'agent MBUS, le chargeur de fabric à l'aide de la commande upgrade all slot comme expliqué dans Mise à niveau du micrologiciel de la carte de ligne sur un routeur Internet de la gamme Cisco 12000. Vous pouvez également faire référence au symptôme « Une nouvelle carte de ligne n'est pas reconnue » dans ce tableau. |
Le GRP et les cartes de ligne se connectent via une matrice de commutation à barres croisées, qui fournit un chemin physique à haut débit pour la plupart des communications entre cartes. Parmi les messages transmis entre le protocole GRP et les cartes de ligne sur le fabric de commutation figurent les paquets réels acheminés et reçus, les informations de transfert, les statistiques de trafic et la plupart des informations de gestion et de contrôle. Par conséquent, il est important que le protocole GRP s’assure que ce chemin fonctionne correctement.
Vous devez toujours suspecter le fabric de commutation si vous voyez des messages d'erreur similaires liés au fabric dans les journaux :
%FABRIC-3-CRC: Switch card 18
ou
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1
Les messages suivants peuvent ou non être dus à un problème matériel avec le fabric de commutation :
05:21:11: %GRP-3-FABRIC_UNI: Unicast send timed out (2) 05:21:16: %GRP-3-FABRIC_UNI: Unicast send timed out (2)
De telles défaillances sont un symptôme problématique qui doit être étudié. Pour plus d'informations sur ce problème, reportez-vous à la section Dépannage des pannes et des délais d'attente des requêtes ping de fabric sur le routeur Internet de la gamme Cisco 12000.
Si vous soupçonnez une défaillance de la matrice de commutation, procédez comme suit :
Collecter les données.
N'oubliez pas que lorsque vous vous connectez au LC, vous devez le faire via le MBUS à l'aide de la commande attachement. La commande execute-on dépend de l'IPC (Inter-Process Communication) qui passe par le fabric de commutation. Si vous rencontrez des problèmes avec IPC (problèmes de fabric, bogues logiciels, etc.), les commandes qui s'exécutent à distance via le fabric de commutation peuvent expirer. Normalement, pour les commandes qui génèrent une quantité suffisante de sortie, il est recommandé de se connecter au LC pour exécuter la commande. La commande attachement <slot #> passe toujours par le MBUS.
show controllers fia (sur le GRP)
joignez <slot #>, puis show controllers fia, puis tapez exit (répétez pour chaque LC et le GRP secondaire)
show controllers clock (sur le GRP)
show log (rechercher les événements OIR (Online Insertion and Removal) pour expliquer le changement de maître CSC ; rechercher les erreurs liées au fabric)
show log summary (rechercher les erreurs liées au fabric)
show log slot <slot #>
Analyser les données
Des problèmes de fabric peuvent survenir en raison de défaillances dans l'un des composants suivants :
Plan de contrôle - GRP
Plan de données
Matériel Tofab LC
Fond de panier
CSC/SFC
Matériel Frfab LC
Lors du dépannage des erreurs de fabric, commencez par rechercher des modèles concernant les composants qui signalent des erreurs. Par exemple, combinez la sortie show controllers fia de tous les GRP et LC pour voir s'il y a un modèle.
Note : Pour le reste de ce document, lorsque nous disons LC, cela fait référence à n'importe quel LC ou GRP.
Si vous voyez crc16s dans la sortie de la commande show controllers fia, il est important de vérifier si ce nombre est incrémenté. Il est très important de corréler les données du GRP principal et des autres GRP/LC. Si une carte de matrice de commutation (CSC et/ou SFC) a été exécutée à chaud, vous pouvez vous attendre à voir des messages d'erreur de matrice et des crc16. Cependant, ce nombre ne devrait pas augmenter après. Si le nombre augmente, vous devez remplacer certaines pièces en raison d'un matériel défectueux.
Dans le résultat ci-dessous, vous pouvez voir l'état du GRP principal et du LC dans le logement 2 :
Router#show controllers fia Fabric configuration: Full bandwidth, redundant fabric Master Scheduler: Slot 17 Backup Scheduler: Slot 16 From Fabric FIA Errors ----------------------- redund fifo parity 0 redund overflow 0 cell drops 0 crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- los 0 0 0 0 0 state Off Off Off Off Off crc16 0 0 0 1345 0 To Fabric FIA Errors ----------------------- sca not pres 0 req error 0 uni FIFO overflow 0 grant parity 0 multi req 0 uni FIFO undrflow 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi FIFO 0 empty dst req 0 handshake error 0 cell parity 0 Router#attach 2 Entering Console for 4 port ATM Over SONET OC-3c/STM-1 in Slot: 2 Type "exit" to end this session Press RETURN to get started! LC-Slot2> LC-Slot2>enable LC-Slot2#show controllers fia From Fabric FIA Errors ----------------------- redund FIFO parity 0 redund overflow 0 cell drops 0 crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- Los 0 0 0 0 0 state Off Off Off Off Off crc16 0 0 0 1345 0 To Fabric FIA Errors ----------------------- sca not pres 0 req error 0 uni fifo overflow 0 grant parity 0 multi req 0 uni fifo undrflow 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi fifo 0 empty DST req 0 handshake error 0 cell parity 0 LC-Slot2#exit Disconnecting from slot 2. Connection Duration: 00:00:21 Router# ...
Une fois que vous avez analysé toutes les commandes show, vous pouvez écrire un tableau similaire :
Ce tableau indique que plusieurs cartes de ligne signalent des erreurs provenant de SFC1. Par conséquent, la première étape consisterait à modifier cette SFC. Les modèles d'échec courants et les actions recommandées sont les suivants (une étape à la fois jusqu'à ce que le problème disparaisse) :
Conseil : chaque fois qu'un remplacement est recommandé, vérifiez d'abord que la carte est correctement positionnée (voir ci-dessous). Vous devez TOUJOURS réinstaller la carte correspondante pour vous assurer qu'elle est correctement positionnée. Si, après avoir réinstallé la lame, les CRC sont toujours en cours d'incrémentation, poursuivez et remplacez la pièce.
Erreurs de trame sur plusieurs LC à partir de la même carte de fabric :
Remplacer la carte de matrice dans le logement correspondant aux erreurs
Remplacer toutes les cartes de matrice
Remplacer le fond de panier
Erreurs de trame sur un LC provenant de plusieurs cartes de fabric :
Remplacer le LC
Si des erreurs sont incrémentées, remplacez le CSC maître actuel
Si les erreurs ne sont pas incrémentées et que le maître actuel est CSC0, remplacez CSC1
Les cartes de matrice de commutation des modèles 12016 et 12416 ne sont pas faciles à insérer et peuvent nécessiter un peu de force. Si l'un des CSC n'est pas correctement installé, le message d'erreur suivant peut s'afficher :
%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 %MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure
Vous pouvez également recevoir ce message d'erreur s'il n'y a que suffisamment de CSC et de SFC installés pour les configurations de bande passante du trimestre. Dans ce cas, aucun des LC basés sur le moteur 1 ou supérieur ne démarre.
Une façon sûre de savoir si les cartes sont correctement positionnées est que, sur le CSC/SFC, vous devriez voir quatre voyants « allumés ». Si ce n'est pas le cas, la carte n'est pas correctement positionnée.
Lorsque vous traitez de problèmes liés au fabric et aux LC qui ne démarrent pas, il est important de vérifier que tous les CSC et SFC nécessaires sont correctement installés et sous tension. Par exemple, trois SFC et deux CSC sont nécessaires sur un 12016 pour obtenir un système redondant à bande passante complète. Trois SFC et un seul CSC sont nécessaires pour obtenir un système non redondant à bande passante totale.
Le résultat des commandes show version et show controllers fia vous indique la configuration matérielle actuellement en cours d'exécution dans la zone.
Router#show version Cisco Internetwork Operating System Software IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551) Copyright (c) 1986-2001 by cisco Systems, Inc. Compiled Mon 14-May-01 19:25 by tmcclure Image text-base: 0x60010950, data-base: 0x61BE6000 ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE Router uptime is 17 hours, 53 minutes System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 System restarted at 00:01:30 MET Tue Jul 3 2001 System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001" cisco 12016/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache Last reset from power-on 2 Route Processor Cards 1 Clock Scheduler Card 3 Switch Fabric Cards 1 8-port OC3 POS controller (8 POs). 1 OC12 POS controller (1 POs). 1 OC48 POS E.D. controller (1 POs). 7 OC48 POS controllers (7 POs). 1 Ethernet/IEEE 802.3 interface(s) 17 Packet over SONET network interface(s) 507K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ... Router#show controller fia Fabric configuration: Full bandwidth nonredundant Master Scheduler: Slot 17 ...
Nous vous recommandons de lire Architecture de routeur Internet de la gamme Cisco 12000 : Fabric de commutation pour plus d'informations.
Vous pouvez rencontrer les types d'erreurs suivants :
À partir des journaux de console ou de la sortie de la commande show log :
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1
À partir de la sortie de la commande show controllers fia :
Router#show controllers fia Fabric configuration: Full bandwidth, redundant fabric Master Scheduler: Slot 17 Backup Scheduler: Slot 16 !-- Here you can see which CSC is the master CSC. By default CSC1 in slot 17 is the master From Fabric FIA Errors ----------------------- redund FIFO parity 0 redund overflow 0 cell drops 76 !-- You may see some cell drops as well crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x001F Slots 16 17 18 19 20 Switch cards monitored 0x001F Slots 16 17 18 19 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 -------- -------- -------- -------- -------- Los 0 0 0 0 0 state Off Off Off Off Off crc16 876 257 876 876 876 !-- You will see some crc16 To Fabric FIA Errors ----------------------- sca not pres 0 req error 1 uni fifo overflow 0 grant parity 1 multi req 0 uni fifo undrflow 0 !-- Grant parity and/or Request error counter not 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi fifo 0 empty DST req 0 handshake error 0 cell parity 0
L'interface de fabric ASIC (FIA) réside à la fois sur le processeur de routage Gigabit (GRP) et sur les cartes de ligne (LC). Il fournit une interface entre le GRP/LC et les cartes de matrice de commutation (CSC/SFC), tandis que le contrôleur ASIC (SCA) Scheduler Control réside uniquement sur le CSC. Il prend en charge les demandes de transmission des cartes de ligne et émet des subventions pour accéder au fabric.
erreur de requête : le SCA a détecté une erreur de parité sur les lignes de requête
parité de subvention - La FIA a détecté une erreur de parité sur les lignes de subvention
La sortie de la commande show controllers fia peut être utilisée pour déterminer si plusieurs cartes de ligne signalent ces erreurs et si une commutation CSC a eu lieu. Afin d'obtenir ce résultat à partir d'une carte de ligne spécifique, tapez attachement <slot #>, puis exécutez la commande show controller fia après l'invite LC-Slot.
Remarque : Comme expliqué ci-dessus, la commande execute-on slot <slot #> show controllers fia ne doit pas être utilisée, car si le logiciel Cisco IOS ne peut pas gérer cette erreur, cette commande échouera.
Octroi d'erreurs sur plusieurs LC
Remplacer le CSC (voir la note ci-dessous pour savoir lequel doit être remplacé)
Remplacer le fond de panier
Octroyer des erreurs sur un LC
Remplacer le LC
Remplacer le CSC (voir la note ci-dessous pour savoir lequel doit être remplacé)
Remplacer le fond de panier
Remarque : Si plusieurs cartes de ligne signalent des erreurs de parité de subvention ou de demande et que la boîte fonctionne toujours, un basculement CSC s'est produit. Le CSC défaillant est celui qui est actuellement le CSC de sauvegarde (pas celui qui est indiqué comme « maître planificateur » dans la sortie show controller fia). Si « Halted » se trouve à côté de la rubrique « From Fabric FIA Errors » ou « To Fabric FIA Errors », ou si le routeur ne transfère plus le trafic, alors un basculement CSC n'a pas eu lieu et le CSC défaillant est celui qui est indiqué comme « Master Scheduler ». Par défaut, le CSC dans le logement 17 est le principal et le CSC dans le logement 16 est la sauvegarde.
Sur les routeurs exécutant une version du logiciel Cisco IOS sans correction du bogue logiciel CSCdw10748 (clients enregistrés uniquement) , les erreurs de parité de subvention peuvent entraîner une défaillance au niveau du système. Avec le correctif pour CSCdw10748 , un routeur avec CSC redondants ne connaîtra pas de perturbation au niveau du système en cas de panne matérielle. Un basculement vers le CSC de sauvegarde (s'il en existe un) sera effectué.
La correction apportée à CSCdw10748 a été mise en oeuvre dans le logiciel Cisco IOS versions 12.0(17)ST4, 12.0(21)S, 12.0(21)ST, 12.0(19)ST02, 12.0(19)S0000000220 , 12.0(17)S04, 12.0(18)S04 et 12.0(16)S07.
Il y a d'autres erreurs qui sont moins fréquentes et peuvent être vues dans la sortie de la commande show controllers fia :
Erreurs FIFO (First In First Out) : Erreur de débordement de données redondantes. Ceci est causé si la contre-pression est cassée, c'est-à-dire que le From Fab exerce une contre-pression et que le Scheduler Control ASIC (SCA) continue à lui donner plus de données. Cela peut être un problème avec la carte CSC (Clock Scheduler Card). Essayez de réinstaller la carte ; si cela ne fonctionne pas, essayez de l'échanger.
Erreurs de liaison série : Ceci est dû à la perte de synchronisation de From Fab FIA avec l'une des cartes de matrice de commutation (SFC) ou des cartes CSC (Clock Scheduler Cards) (cette erreur n'est pas générée pour une carte sortie). La FIA dispose d'un mécanisme intégré pour attendre avant d'arrêter la FIA pour un certain nombre de périodes cellulaires. Il y a un compteur de pertes pour chaque carte. En fonction des informations collectées auprès de tous les GRP/LC, vous devez être en mesure de déterminer quelle pièce est défectueuse.
Erreurs FIFO
Débordement FIFO uni - Débordement FIFO unicast causé par un problème entre le BMA (Buffer Management ASIC)/CSAR (Cisco Cell Segmentation and Reassembly) et le FIA.
unicast FIFO underflow - unicast FIFO underflow causé par l'octroi de la SCA sans avoir obtenu une demande de la FIA.
Pour les erreurs FIFO, il est difficile de déterminer si c'est la carte de ligne ou la carte de planificateur (CSC) qui est cassée. Si de nombreuses cartes montrent des erreurs, le CSC devrait être suspecté.
Erreur de fabric : sca not pre - Le SCA principal (Scheduler Control ASIC) est perdu. La solution à cette erreur est de ne rien faire et d'attendre que les couches supérieures détectent un problème. La raison pour laquelle vous ne basculez pas automatiquement vers le CSC redondant est qu'à ce niveau, vous ne savez pas si les deux SCA sont synchronisés. Si une carte CSC a été branchée après la mise sous tension initiale, les puces SCA ne seront pas synchronisées. L'interface de fabric ASIC (FIA) réside à la fois sur le processeur de routage Gigabit (GRP) et sur les cartes de ligne (LC). Il fournit une interface entre le GRP/LC et les cartes de matrice de commutation (CSC/SFC), tandis que le contrôleur ASIC (SCA) Scheduler Control réside uniquement sur le CSC. Il prend en charge les demandes de transmission des cartes de ligne et émet des subventions pour accéder au fabric.
ou
%FIA-3-PARITYERR: To Fabric parity error was detected. %FIA-3-HALT: To Fabric Request parity error interrupt = 0x4
La sortie de la commande show controllers fia peut être utilisée pour déterminer si plusieurs cartes de ligne signalent ces erreurs et si une commutation CSC a eu lieu. Afin d'obtenir cette sortie d'une carte de ligne spécifique, tapez attachement slot no : , et exécutez la commande show controller fia après l'affichage de l'invite LC-Slot.
Erreur de connexion BMA/CSAR : cette erreur doit être accompagnée d'une erreur de parité qui doit indiquer la raison du problème.
Erreurs de demande logicielle : Il y a d'autres erreurs sur la FIA qui ne le font pas arrêter ou causer une interruption. Ils sont sondés une fois par seconde et comptés. Du côté To Fabric, ces erreurs sont des erreurs de demande logicielle. Les erreurs suivantes sont détectées :
multi-req : destination unique dans une requête multicast. La FIA envoie cette cellule à destination. Vous devez être conscient du bogue CSCdw05067 - show controller fia montre des requêtes multiples sur les LC ATM avec la multidiffusion. Les cartes de ligne ATM Engine 0 (1xOC12 et 4x0C3) peuvent enregistrer quelques erreurs de requêtes multiples dans la sortie de la commande show controller fia des cartes de ligne concernées exécutant le trafic de multidiffusion distribué. Cela se produit pour chaque paquet de multidiffusion distribué commuté à une seule carte de ligne de destination. C'est purement cosmétique, et il n'y a pas de goutte. La solution de contournement consiste à désactiver la commutation de multidiffusion distribuée.
unicast req - multidestination dans une requête de monodiffusion. La FIA abandonne cette cellule.
demande DST vide - demande de destination vide. La FIA abandonne cette cellule.
Au démarrage initial, le GRP principal utilise le MBUS pour indiquer aux modules MBUS des cartes de ligne et des cartes de commutation de mettre sous tension leurs cartes. Une image d'amorçage est ensuite téléchargée sur les cartes de ligne à travers le MBUS. Le MBUS est également utilisé pour recueillir les numéros de révision, les informations environnementales et les informations générales de maintenance. En outre, les GRP échangent des messages de redondance sur le MBUS, qui rendent compte des résultats de l'arbitrage du GRP.
Les messages suivants sont inoffensifs et attendus dans des conditions normales de routeur. Si vous voyez ces messages non exhaustifs, aucune action n'est requise :
%MBUS-6-GRP_STATUS: GRP in Slot 0 Mode = MBUS Secondary
%MBUS-6-FIA_CONFIG: Switch Cards 0x1F (bit mask); Primary Clock CSC_1
Utilisez l'outil Error Message Decoder (clients enregistrés uniquement) pour déterminer si un message est attendu ou non et si vous devez prendre des mesures.
Si vous voyez un message d'avertissement de mise à niveau qui ressemble à ceci :
%MBUS-0-DOWNREV: Fabric Downloader in slot 2; use "upgrade fabric-downloader" command to update the image
Assurez-vous que la version de Fabric Downloader de la carte de ligne est synchronisée avec celle de la version actuelle du logiciel Cisco IOS exécutée sur le protocole GRP principal. Vous pouvez configurer la mise à niveau du service en entier, enregistrer la configuration et recharger le routeur pour synchroniser la mémoire vive de l'agent MBUS, le téléchargeur de fichiers, etc. Parfois, un rechargement n'est pas suffisant, mais un cycle d'alimentation fonctionne toujours. Assurez-vous que vous disposez de suffisamment de mémoire de route sur la carte de ligne pour prendre en charge votre version du logiciel Cisco IOS.
Pour plus d'informations, consultez Mise à niveau du micrologiciel de la carte de ligne sur un routeur de la gamme Cisco 12000.
Pour plus d'explications sur l'objectif du MBUS et sur certains messages d'erreur liés au MBUS, consultez Architecture de routeur Internet de la gamme Cisco 12000 : Bus de maintenance, alimentation et ventilateurs, et cartes d'alarme.
Le routeur de la gamme Cisco 12000 est disponible en configuration CA ou CC. Toutes les alimentations sont échangeables à chaud et à partage de charge.
Il y a des bogues logiciels où la basse tension est signalée et ne devrait pas l'être. Veillez à exécuter la dernière image de version du logiciel Cisco IOS disponible dans la zone du logiciel de téléchargement pour éliminer tous les bogues logiciels liés à la tension connus qui ont été corrigés entre-temps.
Vous trouverez des liens intéressants pour les différents types de châssis sur l'architecture de routeur Internet de la gamme Cisco 12000 : Bus de maintenance, alimentation et ventilateurs, et cartes d'alarme.
Il existe différents types de cartes d'alarme selon le type de châssis 12000. Sur les modèles Cisco 12008 et 12016/12416, les cartes d’alarme alimentent les LC. Vérifiez donc qu’au moins une carte d’alarme est présente. Le 12008 a besoin d'une carte d'alarme car celle-ci est intégrée au programmateur et à l'horloge de la carte (CSC). Les modèles 12016 et 12416 disposent de logements pour deux cartes d'alarme (redondance). Les deux cartes d'alarme ne comportent pas de zones de service segmentées, comme le module d'alimentation CC sur un 12016.
Le Cisco 12404 prend en charge une carte de matrice de commutation consolidée qui inclut les fonctions de matrice de commutation, d'alarme, d'horloge et de planification sur une seule carte.
Vous trouverez des liens intéressants pour les différents types de châssis sur le routeur Internet de la gamme Cisco 12000 : Cartes d'alarme.
Le document Dépannage matériel des pannes de cartes de ligne de routeur Internet de la gamme Cisco 12000 explique les étapes à suivre pour identifier et dépanner les pannes de cartes de ligne. Le dépannage des pannes de cartes de ligne sur le routeur Internet de la gamme Cisco 12000 fournit des informations de dépannage pour les pannes de cartes de ligne.
Le document Arborescence des erreurs de parité des routeurs Internet de la gamme Cisco 12000 explique les étapes à suivre pour dépanner et isoler une partie ou un composant défectueux du routeur Internet de la gamme Cisco 12000 après avoir rencontré divers messages d'erreur de parité.
Si vous avez encore besoin d'assistance après avoir suivi les étapes de dépannage ci-dessus et que vous souhaitez ouvrir une demande de service (clients enregistrés uniquement) auprès du TAC Cisco, veillez à inclure les informations suivantes pour résoudre les problèmes matériels sur le routeur Internet de la gamme Cisco 12000 : |
---|
Veuillez attacher les données rassemblées à votre cas en format texte décompressé (.txt). Vous pouvez joindre des informations à votre dossier en les téléchargeant à l'aide du Gestionnaire de dossiers d'assistance (clients enregistrés uniquement). Si vous ne pouvez pas accéder à Service Request Tool, vous pouvez envoyer les informations en pièce jointe dans un e-mail à attach@cisco.com avec votre numéro de cas dans le sujet du message pour joindre les informations pertinentes à votre cas. Remarque : Ne redémarrez pas manuellement le routeur ou ne le mettez pas hors tension avant de collecter les informations ci-dessus, sauf si nécessaire, car cela peut entraîner la perte d'informations importantes nécessaires pour déterminer la cause première du problème. |