La documentazione per questo prodotto è stata redatta cercando di utilizzare un linguaggio senza pregiudizi. Ai fini di questa documentazione, per linguaggio senza di pregiudizi si intende un linguaggio che non implica discriminazioni basate su età, disabilità, genere, identità razziale, identità etnica, orientamento sessuale, status socioeconomico e intersezionalità. Le eventuali eccezioni possono dipendere dal linguaggio codificato nelle interfacce utente del software del prodotto, dal linguaggio utilizzato nella documentazione RFP o dal linguaggio utilizzato in prodotti di terze parti a cui si fa riferimento. Scopri di più sul modo in cui Cisco utilizza il linguaggio inclusivo.
Cisco ha tradotto questo documento utilizzando una combinazione di tecnologie automatiche e umane per offrire ai nostri utenti in tutto il mondo contenuti di supporto nella propria lingua. Si noti che anche la migliore traduzione automatica non sarà mai accurata come quella fornita da un traduttore professionista. Cisco Systems, Inc. non si assume alcuna responsabilità per l’accuratezza di queste traduzioni e consiglia di consultare sempre il documento originale in inglese (disponibile al link fornito).
In questo documento viene descritto come risolvere i problemi di arresto anomalo del processore di switching Supervisor Engine (SP) dello switch Cisco Catalyst serie 6000/6500 e del processore di routing (RP) Multilayer Switch Feature Card (MSFC).
Nessun requisito specifico previsto per questo documento.
Per la stesura del documento, sono stati usati Cisco Catalyst serie 6000/6500 Switch Supervisor e moduli MSFC.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Per ulteriori informazioni sulle convenzioni usate, consultare il documento Cisco sulle convenzioni nei suggerimenti tecnici.
Un Catalyst 6500/6000 con un registro di configurazione SP che consente l'interruzione, ad esempio 0x2, e che riceve un segnale di interruzione della console entra in modalità diagnostica ROMmon. Il sistema sembra bloccarsi.
Questo esempio di output dello switch indica che lo switch è entrato in modalità diagnostica ROMmon da un segnale di interruzione della console del processore dello switch.
Nota: Il registro di configurazione RP è 0x2102.
6500_IOS#show version Cisco Internetwork Operating System Software IOS (tm) c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Technical Support: http://www.cisco.com/techsupport Copyright (c) 1986-2004 by Cisco Systems, Inc. Compiled Tue 30-Mar-04 01:56 by pwade Image text-base: 0x40008C00, data-base: 0x417A6000 ROM: System Bootstrap, Version 12.1(4r)E, RELEASE SOFTWARE (fc1) BOOTLDR: c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 6500_IOS uptime is 31 minutes Time since 6500_IOS switched to active is 31 minutes System returned to ROM by power-on (SP by abort at PC 0x601061A8) System image file is "slot0:c6sup12-ps-mz.121-13.E14" cisco Catalyst 6000 (R7000) processor with 227328K/34816K bytes of memory. Processor board ID SAD053701CF R7000 CPU at 300Mhz, Implementation 39, Rev 2.1, 256KB L2, 1024KB L3 Cache Last reset from power-on X.25 software, Version 3.0.0. Bridging software. 1 Virtual Ethernet/IEEE 802.3 interface(s) 192 FastEthernet/IEEE 802.3 interface(s) 18 Gigabit Ethernet/IEEE 802.3 interface(s) 381K bytes of non-volatile configuration memory. 16384K bytes of Flash internal SIMM (Sector size 512K). Configuration register is 0x2102
La soluzione è riconfigurare il registro di configurazione e ricaricare il sistema. Attenersi alla seguente procedura:
6500_IOS#config terminal
Enter configuration commands, one per line. End with CNTL/Z.
6500_IOS(config)#config-register 0x2102
6500_IOS(config)#end
6500_IOS#show bootvar BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1 CONFIG_FILE variable = BOOTLDR variable = Configuration register is 0x2102
6500_IOS#remote command switch show bootvar
6500_IOS-sp#
BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1
CONFIG_FILE variable =
BOOTLDR variable =
Configuration register is 0x2 (will be 0x2102 at next reload)
6500_IOS#reload
Nota: A questo punto, è possibile usare il comando copy running-config startup-config per salvare la configurazione. Tuttavia, questo passaggio non è necessario perché l'impostazione del registro di configurazione non fa parte della configurazione di avvio o di esecuzione.
Mentre si esegue una procedura di recupero della password su Supervisor Engine 720, lo switch può bloccarsi durante l'interruzione per poter accedere alla console dell'RP.
*** System received a Software forced crash *** signal= 0x17, code= 0x24, context= 0x4269f6f4 PC = 0x401370d8, Cause = 0x3020, Status Reg = 0x34008002
Utilizzare questa procedura di soluzione alternativa del recupero della password per evitare che il Supervisor si arresti in modo anomalo quando si esegue un recupero della password:
00:00:03: %OIR-6-CONSOLE: Changing console ownership to route processor
Suggerimento: Per ulteriori informazioni sulle combinazioni di tasti, consultare il documento sulle combinazioni di sequenze di Break Key standard durante il recupero della password.
Questo problema è documentato nell'ID bug Cisco CSCec36997 (solo utenti registrati).
Gli switch Cisco Catalyst 6000/6500 possono essere ricaricati inaspettatamente per una causa sconosciuta. L'output del comando show version visualizza un messaggio di errore simile:
System returned to ROM by unknown reload cause - suspect boot_data[BOOT_COUNT] 0x0, BOOT_COUNT 0, BOOTDATA 19 (SP by power-on)
Questo problema è documentato nell'ID bug Cisco CSCef80423 (solo utenti registrati). Per risolvere il problema, aggiornare lo switch all'ultima versione del software Cisco IOS non interessata dal bug.
Questo messaggio indica che il firmware del modulo specificato ha rilevato un errore di parità. Il sistema reimposta automaticamente il modulo per correggere l'errore. In questo modulo viene visualizzato anche un file crashinfo. Il messaggio di errore può essere dovuto a un errore temporaneo o hardware. Se il messaggio di errore viene visualizzato una volta, si tratta di un problema transitorio. Questo viene recuperato automaticamente dal sistema. Il sintomo della parità può essere identificato dal CPO_ECC nella memoria cache. L'ECC che rappresenta l'errore di parità è stato corretto dal sistema stesso.
Questi sono i due tipi di errori di parità:
Mar 9 12:12:24.427 GMT: %PM_SCP-SP-1-LCP_FW_ERR: Module 6 is experiencing the following error: Pinnacle #0 PB parity error. Tx path. Status=0x0042Gli studi hanno dimostrato che gli errori di parità soft sono da 10 a 100 volte più frequenti degli errori di parità hard. Pertanto, Cisco consiglia di attendere un errore di parità hardware prima di sostituire qualsiasi elemento. Ciò riduce notevolmente l'impatto sulla rete.
Il messaggio indica che il controller di sistema ha rilevato un errore. Riavviare il dispositivo. Se il problema persiste, sostituire la memoria difettosa o la scheda MSFC.
%SYSTEM_CONTROLLER-3-FATAL: An unrecoverable error has been detected. The system is being reset. %Software-forced reload
Se un alloggiamento ventola si guasta o l'alimentatore è spento, gli switch Cisco Catalyst con software Cisco IOS versione 12.1(19)E1 potrebbero bloccarsi sui moduli Supervisor. Il problema è documentato nell'ID bug Cisco CSCeb51698 (solo utenti registrati). Aggiornare lo switch alla versione Cisco IOS non interessata da questo difetto.
Se si sospetta che lo switch sia stato reimpostato da solo, usare il comando show version per verificare il tempo di attività dello switch, ossia il tempo trascorso dall'ultima reimpostazione. Utilizzare il comando show log per verificare la cronologia del riavvio, come mostrato nell'esempio. Visualizzare questo output del comando per verificare se sono state registrate eccezioni.
sup2a> (enable)show version WS-C6506 Software, Version NmpSW: 6.3(10) !--- Output is suppressed. Uptime is 7 days, 4 hours, 27 minutes
sup2a> (enable)show log Network Management Processor (ACTIVE NMP) Log: Reset count: 1 Re-boot History: Jan 06 2003 10:35:56 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 0 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 0 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 0 Loaded NMP version: 6.3(10) Software version: slot0:cat6000-sup2.6-3-10.bin Reload same NMP version count: 1 Last software reset by user: 1/6/2003,10:35:35 EOBC Exceptions/Hang: 0 Heap Memory Log: Corrupted Block = none
Questo output del comando show log non visualizza eccezioni software. L'ultimo riavvio dello switch è previsto per il 6 gennaio 2003. L'ora di riavvio corrisponde a quella specificata nel campo Ultima reimpostazione software.
Questo output del comando show log visualizza un'eccezione registrata al momento dell'ultimo riavvio.
esc-cat5500-b (enable)show log Network Management Processor (STANDBY NMP) Log: Reset count: 38 Re-boot History: Oct 14 2001 05:48:53 0, Jul 30 2001 06:51:38 0 Jul 28 2001 20:31:40 0, May 16 2001 21:15:39 0 May 02 2001 01:02:53 0, Apr 26 2001 21:42:24 0 Apr 07 2001 05:23:42 0, Mar 25 2001 02:48:03 0 Jan 05 2001 00:21:39 0, Jan 04 2001 4:54:52 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 4 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 3 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 1 Loaded NMP version: 5.5(7) Reload same NMP version count: 3 Last software reset by user: 7/28/2001,20:30:38 Last Exception occurred on Oct 14 2001 05:47:29 ... Software version = 5.5(7) Error Msg: PID = 86 telnet87 EPC: 80269C44 !--- Output is suppressed.
Se lo switch mostra un'eccezione software di questo tipo, usare il comando dir bootflash: , in cui vengono visualizzati il dispositivo bootflash MSFC (Route Processor [RP]) e la directory slavebootflash: per verificare la presenza di un arresto anomalo del software. L'output in questa sezione mostra che crashinfo è stato registrato nel bootflash RP. Assicurarsi che le informazioni relative al crash visualizzate siano quelle più recenti.
cat6knative#dir bootflash: Directory of bootflash:/ 1 -rw- 1693168 Jul 24 2002 15:48:22 c6msfc2-boot-mz.121-8a.EX 2 -rw- 183086 Aug 29 2002 11:23:40 crashinfo_20020829-112340 3 -rw- 20174748 Jan 30 2003 11:59:18 c6sup22-jsv-mz.121-8b.E9 4 -rw- 7146 Feb 03 2003 06:50:39 test.cfg 5 -rw- 31288 Feb 03 2003 07:36:36 01_config.txt 6 -rw- 30963 Feb 03 2003 07:36:44 02_config.txt 31981568 bytes total (9860396 bytes free)
Il comando dir sup-bootflash: viene visualizzato il dispositivo bootflash Supervisor Engine. Inoltre, è possibile usare il comando dir slavesup-bootflash: per visualizzare il dispositivo bootflash del Supervisor Engine di standby. Questo output mostra le informazioni di arresto anomalo registrate nel dispositivo bootflash del Supervisor Engine.
cat6knative11#dir sup-bootflash: Directory of sup-bootflash:/ 1 -rw- 14849280 May 23 2001 12:35:09 c6sup12-jsv-mz.121-5c.E10 2 -rw- 20176 Aug 02 2001 18:42:05 crashinfo_20010802-234205 !--- Output is suppressed.
Se l'output del comando indica che si è verificato un arresto anomalo del software nel momento in cui si è sospettato il riavvio dello switch, contattare il supporto tecnico Cisco. Fornire l'output del comando show tech-support e del comando show log, nonché l'output del file crashinfo.
Se un modulo DFC (Distributed Forwarding Card) è stato reimpostato senza ricaricamento da parte dell'utente, è possibile controllare il bootflash della scheda DFC per verificare se si è bloccato. Se è disponibile un file di informazioni sull'arresto anomalo del sistema, è possibile individuare la causa dell'arresto anomalo. Utilizzare il comando dir dfc#module#-bootflash: per verificare la presenza di un file di informazioni sull'arresto anomalo del sistema e la data di scrittura. Se il reset DFC corrisponde al timestamp crashinfo, eseguire il comando more dfc#module#-bootflash:filename. In alternativa, usare il comando copy dfc#module#-bootflash:filename tftp per trasferire il file tramite TFTP su un server TFTP.
cat6knative#dir dfc#6-bootflash: Directory of dfc#6-bootflash:/ -#- ED ----type---- --crc--- -seek-- nlen -length- -----date/time------ name 1 .. crashinfo 2B745A9A C24D0 25 271437 Jan 27 2003 20:39:43 crashinfo_ 20030127-203943
Dopo aver ottenuto il file crashinfo disponibile, catturare l'output del comando show logging e del comando show tech e contattare il supporto tecnico Cisco per ulteriore assistenza.
Quando si esegue l'avvio da un dispositivo non presente nella tabella dei dispositivi, il modulo Supervisor si blocca. Aggiornare lo switch al software Cisco IOS versione 12.2(18r)SX05 o successive.
Messaggi di errore:
%CONST_DIAG-2-HM_SUP_CRSH: Supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing %CONST_DIAG-2-HM_SUP_CRSH: Standby supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing
Cause e soluzioni:
Gli switch Cisco Catalyst 6500/6000 possono essere ricaricati inaspettatamente durante il processo di avvio. Il registro di arresto anomalo può visualizzare messaggi di sistema simili ai seguenti:
Dal modulo Supervisor attivo:
%SYS-SP-2-MALLOCFAIL: Memory allocation of 320000 bytes failed from 0x40BCF26C, alignment 8 Pool: Processor Free: 75448 Cause: Not enough free memory Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF process", ipl= 0, pid= 240 -Traceback= 40280AB4 40288058 40BCF274 40BE5660 40BE5730 4029A764 4029A750 %L2-SP-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 SP: EARL Driver:lyra_purge_search:process_push_event_list failed %SCHED-SP-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 402C202C 4058775C 4058511C 40587CB8
Dal modulo Supervisor di standby:
%SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 2920 bytes failed from 0x40174088, alignment 8 Pool: Processor Free: 9544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "DiagCard2/-1", ipl= 0, pid= 154 -Traceback= 4016F7CC 40172984 40174090 4063601C 40636584 4062D194 4062ABD8 4062A9EC 4017E0B0 4017E09C %L2-SP-STDBY-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 %SCHED-SP-STDBY-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 4018A300 403F0400 403EDD7C 403F0A48 SP-STDBY: EARL Driver:lyra_purge_search:process_push_event_list failed %SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 1400 bytes failed from 0x409928B4, alignment 8 Pool: Processor Free: 7544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF LC Stats", ipl= 0, pid= 138 -Traceback= 4016F7CC 40172984 409928BC 409C5EEC 4098A5EC
Dal software Cisco IOS versione 12.2(17d)SXB, Supervisor Engine 2 richiede una DRAM minima di 256 MB. Se il modulo Supervisor ha una DRAM di 128 MB, per risolvere il problema aggiornare la memoria a 256 MB o più. Per ulteriori informazioni, fare riferimento alle note di versione per Cisco IOS versione 12.2SX su Supervisor Engine 720, Supervisor Engine 32 e Supervisor Engine 2.
Gli switch Cisco Catalyst 6000/6500 possono essere ricaricati inaspettatamente a causa di un'eccezione imprevista.
01:22:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:40: ROMMON image upgrade in progress 01:23:40: Erasing flash Unexpected exception, CPU signal 5, PC = 0x402F3DC4
Durante l'aggiornamento di ROMMon, se il sistema riceve una query SNMP, lo switch può ricaricarsi.
Completare questa procedura per evitare il blocco dello switch quando si esegue l'aggiornamento di ROMMon:
no snmp-server
redundancy force-switchover
Questo messaggio viene visualizzato come porta dell'output del comando show stack (anch'esso parte del comando show tech-support). Il messaggio completo è simile al seguente:
*************************************************** ******* Information of Last System Crash ********** *************************************************** Using bootflash:crashinfo. %Error opening bootflash:crashinfo (File not found) *************************************************** ****** Information of Last System Crash - SP ****** *************************************************** The last crashinfo failed to be written. Please verify the exception crashinfo configuration the filesytem devices, and the free space on the filesystem devices. Using crashinfo_FAILED. %Error opening crashinfo_FAILED (File not found)
Un messaggio di questo tipo può essere visualizzato in due condizioni:
L'MSFC può bloccarsi a causa di un errore del bus, che potrebbe essere causato da un problema software o hardware. Questi messaggi di errore potrebbero visualizzare:
*** System received a Bus Error exception *** signal= 0xa, code= 0x10, context= 0x60ef02f0 PC = 0x601d22f8, Cause = 0x2420, Status Reg = 0x34008002
!--- Output is suppressed. System was restarted by bus error at PC 0x0, address 0x0 at 15:31:54 EST Wed Mar 29 2000 !--- Output is suppressed.
Se l'indirizzo indicato non è valido e non è compreso nell'intervallo di memoria, si tratta di un bug del software. Se l'indirizzo è compreso nell'intervallo valido, la causa del problema è probabilmente un guasto hardware della memoria del processore.
Per ulteriori informazioni su questi tipi di arresti anomali del bus, consultare il documento sulla risoluzione dei problemi relativi agli errori del bus. Per ulteriori informazioni, fare riferimento all'ID bug Cisco CSCdx92013 (solo utenti registrati).
Il modulo MSFC non contiene la protezione della memoria ECC. L'MSFC si blocca pertanto quando viene rilevato un errore di parità. Di seguito sono riportati alcuni degli errori che è possibile visualizzare quando si verifica questa condizione:
*** System received a Cache Parity Exception *** signal= 0x14, code= 0xa405c428, context= 0x60dd1ee0 PC = 0x6025b2a8, Cause = 0x6420, Status Reg = 0x34008002
!--- Output is suppressed. System returned to ROM by processor memory parity error at PC 0x6020F4D0, address 0x0 at 18:18:31 UTC Wed Aug 22 2001 !--- Output is suppressed.
Nel file crashinfo, registrato in bootflash o sulla console, viene visualizzato:
Error: primary data cache, fields: data, SysAD virtual addr 0x4B288202, physical addr(21:3) 0x288200, vAddr(14:12) 0x0000 virtual address corresponds to pcimem, cache word 0 Address: 0x4B288200 not in L1 Cache Address: 0x4B288202 Can not be loaded into L1 Cache
Se l'errore si verifica più di una volta, è necessario sostituire l'MSFC. Se l'errore si verifica una sola volta, è possibile che si sia verificato un singolo evento di disturbo. In questo caso, monitorare l'MSFC. Per ulteriori informazioni sugli errori di parità, fare riferimento a Errori di parità della memoria del processore (PMPE).
Il modulo MSFC2 contiene la protezione della memoria ECC. Tuttavia, esistono posizioni di memoria in cui viene controllata la parità ma non è possibile correggere gli errori a bit singolo. Di seguito sono riportati alcuni messaggi di errore che è possibile visualizzare nel file crashinfo a indicare un errore di parità:
Se questi messaggi di errore vengono registrati una sola volta, è possibile che si sia verificato un singolo evento di disturbo. Monitorare l'MSFC2. Se gli errori si verificano più frequentemente, sostituire l'MSFC2. Per ulteriori informazioni sugli errori di parità, fare riferimento agli errori di parità della memoria del processore (PMPE).
Se l'MSFC2 si blocca e il dispositivo bootflash contiene un file crashinfo, usare il comando more bootflash:crashinfo_filename. Il comando visualizza le informazioni del file crashinfo. Se viene visualizzato il messaggio MISTRAL-3-ERROR nella sezione iniziale del log di crashinfo, fare riferimento ai messaggi MSFC2 Crashed con Mistral-3-Error nel file Crashinfo per determinare se si è verificato uno dei motivi più comuni.
Il comando show system sanity esegue una serie di controlli predeterminati sulla configurazione con una possibile combinazione di alcuni stati del sistema per compilare un elenco di condizioni di avviso. I controlli sono progettati per cercare qualsiasi cosa sembri fuori luogo. I controlli consentono di mantenere la configurazione e la funzionalità del sistema desiderate e corrette. Questo comando è supportato in CatOS versione 8.3x o successive.
Per un elenco completo dei controlli eseguiti e un esempio dell'output del comando, consultare il documento sul controllo di integrità per i problemi di configurazione e lo stato del sistema.
Per il ripristino di Cisco Catalyst 6000/6500 con Supervisor Engine I o II, consultare il documento.
Per il ripristino di Cisco Catalyst 6000/6500 con Supervisor Engine 720 o Supervisor Engine 32, fare riferimento a Ripristino di Cisco Catalyst 6000/6500 con Supervisor Engine 720 o 32.
Il file crashinfo è una raccolta di informazioni utili relative all'arresto anomalo corrente memorizzate nella memoria bootflash o flash. Quando un router si blocca a causa di un danneggiamento dei dati o dello stack, sono necessarie più informazioni di ricaricamento per eseguire il debug di questo tipo di arresto anomalo che l'output del normale comando show stack.
Il file crashinfo contiene le seguenti informazioni:
Fare riferimento a Recupero di informazioni dal file Crashinfo per ulteriori informazioni e per la procedura di recupero del file crashinfo.
Fare riferimento a Creazione di core dump per ulteriori informazioni e per la procedura di raccolta dei core dump dal dispositivo.
Per gli switch Cisco Catalyst 6000/6500 con software IOS nativo, fare riferimento ai messaggi di errore comuni sugli switch Catalyst serie 6500/6000 con software Cisco IOS. Se viene visualizzato un messaggio di errore che non è incluso in uno dei messaggi di errore comuni, fare riferimento a:
Per gli switch Cisco Catalyst 6000/6500 con sistema operativo ibrido, fare riferimento ai messaggi di errore CatOS comuni sugli switch Catalyst serie 6500/6000. Se viene visualizzato un messaggio di errore diverso da uno dei comuni, consultare Messaggi e procedure di recupero - Catalyst serie 6500 System Message Guide, 8.4.
Usare Cisco CLI Analyzer (solo utenti registrati) per ricevere immediatamente l'analisi della risoluzione dei problemi e un'azione da eseguire sul router, sullo switch o sul dispositivo PIX in uso tramite l'output del comando show raccolto.