Dans de rares cas, le processeur principal des cartes de ports ATM PA-A3 peut se bloquer et imprimer sur la console un « crashdump » avec une sortie similaire à celle-ci :
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: %ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC %ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010 %ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000 %ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 %ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 %ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530 %ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968 %ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540 %ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000 %ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4 %ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4 %ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440 %ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000 %ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000 %ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000 %ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000
Ce document explique comment dépanner les pannes de segmentation et de réassemblage (SAR) sur le PA-A3.
Aucune spécification déterminée n'est requise pour ce document.
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
For more information on document conventions, refer to the Cisco Technical Tips Conventions.
Le PA-A3 utilise une puce appelée LSI ATMizer II pour fournir SAR ainsi que d'autres fonctions clés. Le nom de la SAR est affiché dans le résultat de la commande show controllers atm.
router# show controller atm 3/0 Interface ATM3/0 is up Hardware is ENHANCED ATM PA - DS3 (45Mbps) Lane client mac address is 0030.7b1e.9054 Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 !--- Output suppressed.
Le microcode ATMizer (micrologiciel) est une image qui fournit des instructions logicielles spécifiques à SAR. Le processeur VIP (Versatile Interface Processor) IOS® sur la plate-forme Cisco 7500 et l'IOS système sur la plate-forme 7200 contiennent le micrologiciel SAR, qui est téléchargé vers le SAR lorsqu'il sort de la réinitialisation. Utilisez les commandes suivantes en fonction de la plate-forme utilisée pour afficher la version de microcode actuellement chargée et en cours d'exécution pour votre interface ATM :
série 7200 - show controller atm (voir exemple de sortie ci-dessus)
Gamme 7500 - show controller vip slot# tech
Le PA-A3 utilise deux SAR pour fournir la puissance de traitement nécessaire pour manipuler et transmettre simultanément une liaison OC-3 et OC-12 à haut débit.
Nota : Un seul SAR suffit pour un DS-3/E-3, mais le PA-A3-T3 utilise également deux SAR pour assurer la cohérence.
Le vidage SAR indique la SAR qui rencontre le problème.
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: SAR0 = receive SAR1 = transmit
Le PA-A3 est pris en charge par les routeurs de la gamme 7xxx. Les routeurs 7200 et 7500 utilisent des bus PCI (PeriphComponent Interconnect) comme chemin de données entre les cartes de ports et la mémoire « hôte ». La mémoire hôte est la mémoire SRAM locale sur le VIP ou la mémoire SRAM sur le NPE (Network Processing Engine) du 7200.
Ce schéma illustre l'architecture du VIP2 et l'emplacement des bus PCI :
Le SAR fournit la connectivité au bus PCI pour les transferts en mémoire de paquets. Il fournit également des fonctionnalités SAR pour le traitement de cellules ATM et une interface physique ou PHY avec le câble externe.
Nous pouvons classer les accidents SAR en plusieurs catégories en fonction de la cause de l'accident. Chaque fois qu'une erreur non récupérable est détectée, la SAR tombe en panne. Ces erreurs peuvent être le résultat d'un logiciel ou d'un matériel. Pour déterminer la cause, consultez le registre des causes qui apparaît dans la deuxième ligne de la sortie crashdump. Le code d'exception est enregistré dans les bits deux à six de la valeur du registre de cause. Commencez par le bit le plus à droite en tant que bit zéro. Exemple :
%ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68
Traduisez la valeur hexadécimale 0x00004018 en binaire. Notez que chaque valeur hexadécimale représente quatre bits. L'équivalent binaire dans notre exemple est 4 = 0100, 0 = 0000, 1 = 0001 et 8 = 10000, puis 0x00004018 = 0100 000 00010 00.
Localisez les bits deux à six en comptant de droite à gauche. Dans notre exemple, les bits 2 à 6 correspondent à 00110
Convertissez ces cinq bits en bits hexadécimaux. Dans notre exemple, 00110 convertit en 0x06.
Consultez la table des codes d'exception. Dans l'exemple, le SAR s'est écrasé en réponse à une exception d'erreur de bus secondaire.
Code exception | Description | Cause probable |
0x00 | Interrompre | Condition d'interruption affirmée. |
0x01 | Exception de modification TLB | |
0x02 | Exception TLB (chargement/extraction) | |
0x03 | Exception TLB (magasin) | |
0x04 | Erreur d'adresse (chargement/extraction) | Adresse non alignée (logiciel). |
0x05 | Erreur d'adresse (magasin) | Adresse non alignée (logiciel). |
0x06 | Erreur de bus | Délai d'attente du bus, erreurs de parité, etc. (matériel). |
0x07 | Réservé | |
0x08 | Système | Tentative d'exécution de l'instruction SYSCALL. |
0x09 | Point d'arrêt | Tentative d'exécution de l'instruction BREAK. |
0x0a | Instruction réservée | Tentative d'exécution d'une instruction non valide. |
0x0b | Coprocesseur inutilisable | Tentative d'exécution sur un coprocesseur inutilisable. |
0x0c | Débordement arithmétique | |
0x0d | Alerte | |
0x0e | Réservé | |
0x0f | Point flottant | Tentative d'accès au FPU inexistant. |
0x10-1f | Réservé |
Lorsque le bit 15 du registre de causes de valeur est défini sur 1, la cause du crash SAR est un abandon PCI ou une erreur de parité due au matériel. Plus précisément, le registre des causes apparaîtra dans le vidage de crashdump comme suit :
cause 0x00008000
Dépannez cette valeur de cause en remplaçant la carte de port ATM. Si le problème persiste, remplacez le processeur d'interface polyvalent (VIP) si vous utilisez un routeur de la gamme 7500 ou le moteur de traitement de réseau (NPE)/NSE (Network Services Engine) si vous utilisez un routeur de la gamme 7200 ou 7400.
L'ID de bogue Cisco CSCdr09895 empêche l'impression de vidages répétés sur la console, car seul le premier vidange de panne est pertinent pour le dépannage. Les ID de bogue suivants résolvent des conditions rares qui provoquent des plantages SAR. Veuillez utiliser le Bug Toolkit (clients enregistrés uniquement) pour déterminer si votre version du logiciel Cisco IOS est affectée par ces ID de bogues.
ID de débogage Cisco | Explication |
CSCdp62791 | Empêche les pannes de SAR1 en n'envoyant pas de paquets à SAR sur un circuit virtuel non configuré ou en envoyant des paquets à SAR avec une encapsulation non valide. Remarque : Bien qu'il signale un symptôme différent, CSCdp01166 dupe vers et est corrigé via CSCdp62791. |
CSCdp42529 | Empêche les plantages SAR1 causés par la réception d’une cellule sur une paire VPI/VCI qui n’existe pas sur la SAR de transmission. Ce problème peut se produire lorsqu'un grand nombre de circuits virtuels commutés sont créés ou démontés, de sorte que la SAR de transmission ne peut pas exécuter une interruption de commande du processeur hôte sur le VIP ou le NPE. Dans ce cas, un circuit virtuel est défini sur la SAR de réception uniquement et la SAR de transmission se bloque si une boucle OAM ou une cellule de gestion des ressources est reçue sur la paire VPI/VCI non définie. |
CSCdr09895 | Empêche les plantages de SAR0 lorsque, avec un trafic de transit important, la SAR tente d'accéder à une adresse illégale dans la mémoire secondaire, où sont stockés les paquets en attente de segmentation et de réassemblage. Cette condition est appelée erreur de bus. |
CSCdp64588 | Empêche une panne de routeur en raison de pannes répétées de SAR (0 ou 1). Lorsque le SAR tombe en panne, le pilote hôte PCI (qui fournit une interface entre le PA-A3 et le bus PCI du routeur) tente de redémarrer le PA. En cas de panne SAR répétée et si le PA ne répond pas au pilote hôte, le pilote hôte tente d'arrêter le PA (hors tension) et le PA est éteint. Dans certains cas, si le SAR s'est écrasé et que le pilote hôte a déjà effacé la mémoire associée à ce PA, le routeur tombe en panne en raison d'une erreur de bus. |
Les points suivants résument comment dépanner les pannes SAR sur une carte de port ATM PA-A3 :
Déterminez si SAR0 (réception SAR) ou SAR1 (transmission SAR) s’est écrasé. La première ligne du crashdump vous le dira.
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump
Utilisez la table de codes d'exception pour décoder la valeur du registre de cause dans la sortie crashdump.
Si le registre de cause est une valeur avec le bit 15 défini sur 1, remplacez le matériel.
Si le registre des causes est une autre valeur, collectez les informations suivantes pour l'assistance technique Cisco :
crashdump output
show controller atm (série 7200)
show controller vip slot# tech (série 7500)
show tech-support
Envisagez sérieusement d'installer la dernière version de maintenance du logiciel Cisco IOS que vous utilisez actuellement.
Révision | Date de publication | Commentaires |
---|---|---|
1.0 |
10-Sep-2018 |
Première publication |