O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.
A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.
Este documento discute como resolver problemas de travamentos do processador de switches (SP) do Supervisor Engine do Cisco Catalyst 6000/6500 Series Switch e do processador de rotas (RP) do Multilayer Switch Feature Card (MSFC).
Não existem requisitos específicos para este documento.
As informações neste documento são baseadas nos módulos Cisco Catalyst 6000/6500 Series Switch Supervisors e MSFC.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
Um Catalyst 6500/6000 com um registro de configuração de SP que permite quebra, por exemplo 0x2, e que recebe um sinal de interrupção de console entra no modo de diagnóstico ROMmon. O sistema parece travar.
Este exemplo de saída do switch indica que o switch entrou no modo de diagnóstico ROMmon a partir de um sinal de interrupção do console do processador do switch.
Note: O registro de configuração do RP é 0x2102.
6500_IOS#show version Cisco Internetwork Operating System Software IOS (tm) c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Technical Support: http://www.cisco.com/techsupport Copyright (c) 1986-2004 by Cisco Systems, Inc. Compiled Tue 30-Mar-04 01:56 by pwade Image text-base: 0x40008C00, data-base: 0x417A6000 ROM: System Bootstrap, Version 12.1(4r)E, RELEASE SOFTWARE (fc1) BOOTLDR: c6sup2_rp Software (c6sup2_rp-PS-M), Version 12.1(13)E14, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) 6500_IOS uptime is 31 minutes Time since 6500_IOS switched to active is 31 minutes System returned to ROM by power-on (SP by abort at PC 0x601061A8) System image file is "slot0:c6sup12-ps-mz.121-13.E14" cisco Catalyst 6000 (R7000) processor with 227328K/34816K bytes of memory. Processor board ID SAD053701CF R7000 CPU at 300Mhz, Implementation 39, Rev 2.1, 256KB L2, 1024KB L3 Cache Last reset from power-on X.25 software, Version 3.0.0. Bridging software. 1 Virtual Ethernet/IEEE 802.3 interface(s) 192 FastEthernet/IEEE 802.3 interface(s) 18 Gigabit Ethernet/IEEE 802.3 interface(s) 381K bytes of non-volatile configuration memory. 16384K bytes of Flash internal SIMM (Sector size 512K). Configuration register is 0x2102
A solução é reconfigurar o registro de configuração e recarregar o sistema. Conclua estes passos:
6500_IOS#config terminal
Enter configuration commands, one per line. End with CNTL/Z.
6500_IOS(config)#config-register 0x2102
6500_IOS(config)#end
6500_IOS#show bootvar BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1 CONFIG_FILE variable = BOOTLDR variable = Configuration register is 0x2102
6500_IOS#remote command switch show bootvar
6500_IOS-sp#
BOOT variable = slot0:c6sup12-ps-mz.121-13.E14,1
CONFIG_FILE variable =
BOOTLDR variable =
Configuration register is 0x2 (will be 0x2102 at next reload)
6500_IOS#reload
Note: Você pode executar o comando copy running-config startup-config neste ponto para salvar a configuração. No entanto, essa etapa não é necessária porque a definição do registro de configuração não faz parte da configuração de inicialização ou de execução.
Enquanto um procedimento de recuperação de senha em um Supervisor Engine 720 é executado, o switch pode travar enquanto você quebra para obter acesso ao console do RP.
*** System received a Software forced crash *** signal= 0x17, code= 0x24, context= 0x4269f6f4 PC = 0x401370d8, Cause = 0x3020, Status Reg = 0x34008002
Use este procedimento alternativo de recuperação de senha para evitar que o Supervisor falhe ao executar uma recuperação de senha:
00:00:03: %OIR-6-CONSOLE: Changing console ownership to route processor
Tip: Consulte as Combinações de Sequência de Teclas de Interrupção Padrão Durante a Recuperação de Senha para obter as combinações de teclas.
Esse problema está documentado na ID de bug da Cisco CSCec36997 (somente clientes registrados).
Os switches Cisco Catalyst 6000/6500 podem recarregar inesperadamente devido a uma causa desconhecida. A saída do comando show version exibe uma mensagem de erro semelhante:
System returned to ROM by unknown reload cause - suspect boot_data[BOOT_COUNT] 0x0, BOOT_COUNT 0, BOOTDATA 19 (SP by power-on)
Esse problema está documentado na ID de bug da Cisco CSCef80423 (somente clientes registrados). Atualize o switch para a versão mais recente do Cisco IOS Software não afetada pelo bug para resolver esse problema.
Essa mensagem indica que o firmware do módulo especificado detectou um erro de paridade. O sistema redefine automaticamente o módulo para recuperar do erro. Um arquivo crashinfo também é exibido neste módulo. A mensagem de erro pode ser devido a uma falha transitória ou de hardware. Se a mensagem de erro ocorrer uma vez, então é um problema transitório. Isso é recuperado automaticamente pelo sistema. O sintoma da paridade pode ser identificado pelo CPO_ECC na memória do cache. O ECC que representa o erro de paridade foi corrigido pelo próprio sistema.
Estes são os dois tipos de erros de paridade:
Mar 9 12:12:24.427 GMT: %PM_SCP-SP-1-LCP_FW_ERR: Module 6 is experiencing the following error: Pinnacle #0 PB parity error. Tx path. Status=0x0042Estudos mostram que os erros de paridade suave são de 10 a 100 vezes mais freqüentes que os erros de paridade difícil. Portanto, a Cisco recomenda que você aguarde um erro de paridade difícil antes de substituir qualquer coisa. Isso reduz muito o impacto na sua rede.
A mensagem indica que o controlador do sistema detectou um erro. Recarregue o dispositivo. Se essa mensagem ocorrer novamente, substitua a memória com falha ou a placa MSFC.
%SYSTEM_CONTROLLER-3-FATAL: An unrecoverable error has been detected. The system is being reset. %Software-forced reload
Quando uma bandeja de ventoinha falha ou uma fonte de alimentação é desligada, os Cisco Catalyst Switches que executam o Cisco IOS Software Release 12.1(19)E1 podem travar os módulos do Supervisor. O problema está documentado na ID de bug da Cisco CSCeb51698 (somente clientes registrados). Atualize o switch para a versão do Cisco IOS não afetada por esse defeito.
Se você suspeitar que o switch foi redefinido sozinho, execute o comando show version para verificar o tempo de atividade do switch, que é o tempo desde a última reinicialização. Execute o comando show log para examinar o histórico de reinicialização, como mostrado neste exemplo. Veja esta saída de comando para ver se há exceções registradas.
sup2a> (enable)show version WS-C6506 Software, Version NmpSW: 6.3(10) !--- Output is suppressed. Uptime is 7 days, 4 hours, 27 minutes
sup2a> (enable)show log Network Management Processor (ACTIVE NMP) Log: Reset count: 1 Re-boot History: Jan 06 2003 10:35:56 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 0 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 0 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 0 Loaded NMP version: 6.3(10) Software version: slot0:cat6000-sup2.6-3-10.bin Reload same NMP version count: 1 Last software reset by user: 1/6/2003,10:35:35 EOBC Exceptions/Hang: 0 Heap Memory Log: Corrupted Block = none
Esta saída do comando show log não exibe exceções de software. A última reinicialização do switch é em 06 de janeiro de 2003. O tempo de reinicialização corresponde no campo Última redefinição de software.
Esta saída do comando show log mostra uma exceção que foi gravada no momento da última reinicialização.
esc-cat5500-b (enable)show log Network Management Processor (STANDBY NMP) Log: Reset count: 38 Re-boot History: Oct 14 2001 05:48:53 0, Jul 30 2001 06:51:38 0 Jul 28 2001 20:31:40 0, May 16 2001 21:15:39 0 May 02 2001 01:02:53 0, Apr 26 2001 21:42:24 0 Apr 07 2001 05:23:42 0, Mar 25 2001 02:48:03 0 Jan 05 2001 00:21:39 0, Jan 04 2001 4:54:52 0 Bootrom Checksum Failures: 0 UART Failures: 0 Flash Checksum Failures: 0 Flash Program Failures: 0 Power Supply 1 Failures: 4 Power Supply 2 Failures: 0 Swapped to CLKA: 0 Swapped to CLKB: 0 Swapped to Processor 1: 3 Swapped to Processor 2: 0 DRAM Failures: 0 Exceptions: 1 Loaded NMP version: 5.5(7) Reload same NMP version count: 3 Last software reset by user: 7/28/2001,20:30:38 Last Exception occurred on Oct 14 2001 05:47:29 ... Software version = 5.5(7) Error Msg: PID = 86 telnet87 EPC: 80269C44 !--- Output is suppressed.
Se o seu switch mostrar uma exceção de software, execute o comando dir bootflash: que exibe o dispositivo bootflash MSFC (route processor [RP]) e o dir slavebootflash: para verificar se há uma falha de software. A saída nesta seção mostra que crashinfo foi gravado no flash de inicialização RP. Certifique-se de que as informações de travamento que você vê sejam do travamento mais recente.
cat6knative#dir bootflash: Directory of bootflash:/ 1 -rw- 1693168 Jul 24 2002 15:48:22 c6msfc2-boot-mz.121-8a.EX 2 -rw- 183086 Aug 29 2002 11:23:40 crashinfo_20020829-112340 3 -rw- 20174748 Jan 30 2003 11:59:18 c6sup22-jsv-mz.121-8b.E9 4 -rw- 7146 Feb 03 2003 06:50:39 test.cfg 5 -rw- 31288 Feb 03 2003 07:36:36 01_config.txt 6 -rw- 30963 Feb 03 2003 07:36:44 02_config.txt 31981568 bytes total (9860396 bytes free)
O comando dir sup-bootflash: exibe o dispositivo bootflash do Supervisor Engine. Você também pode executar o comando dir slavesup-bootflash: para exibir o dispositivo flash de inicialização do Supervisor Engine de standby. Esta saída mostra informações de travamento registradas no dispositivo flash de inicialização do Supervisor Engine.
cat6knative11#dir sup-bootflash: Directory of sup-bootflash:/ 1 -rw- 14849280 May 23 2001 12:35:09 c6sup12-jsv-mz.121-5c.E10 2 -rw- 20176 Aug 02 2001 18:42:05 crashinfo_20010802-234205 !--- Output is suppressed.
Se a saída do comando indicar que ocorreu um travamento do software no momento em que você suspeitou que o switch foi reinicializado, entre em contato com o Suporte Técnico da Cisco. Forneça a saída do comando show tech-support e do comando show logging, bem como a saída do arquivo crashinfo.
Se um módulo equipado com uma placa de encaminhamento distribuído (DFC - Distributed Forwarding Card) tiver redefinido por si mesmo sem recarregar o usuário, você poderá verificar o flash de inicialização da placa DFC para ver se ele travou. Se um arquivo de informações de travamento estiver disponível, você poderá encontrar a causa do travamento. Execute o comando dir dfc#module#-bootflash: para verificar se há um arquivo de informações de travamento e quando ele foi escrito. Se a redefinição de DFC corresponder ao carimbo de data e hora da informação de travamento, emita o comando more dfc#module#-bootflash:filename. Ou execute o comando copy dfc#module #-bootflash:filename tftp para transferir o arquivo via TFTP para um servidor TFTP.
cat6knative#dir dfc#6-bootflash: Directory of dfc#6-bootflash:/ -#- ED ----type---- --crc--- -seek-- nlen -length- -----date/time------ name 1 .. crashinfo 2B745A9A C24D0 25 271437 Jan 27 2003 20:39:43 crashinfo_ 20030127-203943
Depois de ter o arquivo crashinfo disponível, reúna a saída do comando show logging e do comando show tech e entre em contato com o Suporte Técnico da Cisco para obter assistência adicional.
Quando você inicializa a partir de um dispositivo não listado na tabela de dispositivos, isso causa um travamento com o módulo Supervisor. Atualize o switch para o Cisco IOS Software Release 12.2(18r)SX05 ou posterior.
Mensagens de erro:
%CONST_DIAG-2-HM_SUP_CRSH: Supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing %CONST_DIAG-2-HM_SUP_CRSH: Standby supervisor crashed due to unrecoverable errors, Reason: Failed TestSPRPInbandPing
Causas e resoluções:
Os switches Cisco Catalyst 6500/6000 podem recarregar inesperadamente durante o processo de inicialização. O registro de travamento pode exibir mensagens do sistema semelhantes a estas:
No módulo Supervisor ativo:
%SYS-SP-2-MALLOCFAIL: Memory allocation of 320000 bytes failed from 0x40BCF26C, alignment 8 Pool: Processor Free: 75448 Cause: Not enough free memory Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF process", ipl= 0, pid= 240 -Traceback= 40280AB4 40288058 40BCF274 40BE5660 40BE5730 4029A764 4029A750 %L2-SP-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 SP: EARL Driver:lyra_purge_search:process_push_event_list failed %SCHED-SP-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 402C202C 4058775C 4058511C 40587CB8
No módulo Supervisor em standby:
%SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 2920 bytes failed from 0x40174088, alignment 8 Pool: Processor Free: 9544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "DiagCard2/-1", ipl= 0, pid= 154 -Traceback= 4016F7CC 40172984 40174090 4063601C 40636584 4062D194 4062ABD8 4062A9EC 4017E0B0 4017E09C %L2-SP-STDBY-4-NOMEM: Malloc failed: L2-API Purge/Search failed. size req. 512 %SCHED-SP-STDBY-2-SEMNOTLOCKED: L2 bad entry (7fff/0) purge proc attempted to unlock an unlocked semaphore -Traceback= 4018A300 403F0400 403EDD7C 403F0A48 SP-STDBY: EARL Driver:lyra_purge_search:process_push_event_list failed %SYS-SP-STDBY-2-MALLOCFAIL: Memory allocation of 1400 bytes failed from 0x409928B4, alignment 8 Pool: Processor Free: 7544 Cause: Memory fragmentation Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "CEF LC Stats", ipl= 0, pid= 138 -Traceback= 4016F7CC 40172984 409928BC 409C5EEC 4098A5EC
No Cisco IOS Software Release 12.2(17d)SXB, o Supervisor Engine 2 precisa de uma DRAM mínima de 256 MB. Se o seu módulo Supervisor tiver DRAM de 128 MB, atualize a memória para 256 MB ou mais para resolver esse problema. Consulte as Release Notes do Cisco IOS Release 12.2SX no Supervisor Engine 720, Supervisor Engine 32 e Supervisor Engine 2 para obter mais informações.
Os switches Cisco Catalyst 6000/6500 podem recarregar inesperadamente devido a uma exceção inesperada.
01:22:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:25: %SNMP-3-AUTHFAIL: Authentication failure for SNMP req from host 10.1.2.2 01:23:40: ROMMON image upgrade in progress 01:23:40: Erasing flash Unexpected exception, CPU signal 5, PC = 0x402F3DC4
Enquanto a atualização do ROMMon está em andamento, se o sistema receber uma consulta SNMP, ele pode fazer com que o switch seja recarregado.
Conclua este procedimento para evitar que o switch falhe ao executar a atualização do ROMMon:
no snmp-server
redundancy force-switchover
Essa mensagem aparece como porta da saída do comando show stacks (também parte do comando show tech-support). A mensagem completa é semelhante a esta:
*************************************************** ******* Information of Last System Crash ********** *************************************************** Using bootflash:crashinfo. %Error opening bootflash:crashinfo (File not found) *************************************************** ****** Information of Last System Crash - SP ****** *************************************************** The last crashinfo failed to be written. Please verify the exception crashinfo configuration the filesytem devices, and the free space on the filesystem devices. Using crashinfo_FAILED. %Error opening crashinfo_FAILED (File not found)
Há duas condições em que essa mensagem é exibida:
O MSFC pode travar com uma exceção de erro de barramento, que pode ser causada por um problema de software ou hardware. Essas mensagens de erro podem ser exibidas:
*** System received a Bus Error exception *** signal= 0xa, code= 0x10, context= 0x60ef02f0 PC = 0x601d22f8, Cause = 0x2420, Status Reg = 0x34008002
!--- Output is suppressed. System was restarted by bus error at PC 0x0, address 0x0 at 15:31:54 EST Wed Mar 29 2000 !--- Output is suppressed.
Se o endereço indicado for um endereço inválido fora do intervalo de memória, é um bug de software. Se o endereço estiver no intervalo válido, a causa do problema é provavelmente uma falha de hardware na memória do processador.
Para obter mais informações sobre esses tipos de travamentos de erro de barramento, consulte Troubleshooting de Travamentos de Erro de Barramento. Consulte o bug da Cisco ID CSCdx92013 (somente clientes registrados) para obter mais informações.
O MSFC não contém proteção de memória ECC. Portanto, o MSFC trava na detecção de um erro de paridade. Estes são alguns dos erros que você pode ver quando isso ocorre:
*** System received a Cache Parity Exception *** signal= 0x14, code= 0xa405c428, context= 0x60dd1ee0 PC = 0x6025b2a8, Cause = 0x6420, Status Reg = 0x34008002
!--- Output is suppressed. System returned to ROM by processor memory parity error at PC 0x6020F4D0, address 0x0 at 18:18:31 UTC Wed Aug 22 2001 !--- Output is suppressed.
No arquivo crashinfo, gravado no flash de inicialização ou no console, você vê:
Error: primary data cache, fields: data, SysAD virtual addr 0x4B288202, physical addr(21:3) 0x288200, vAddr(14:12) 0x0000 virtual address corresponds to pcimem, cache word 0 Address: 0x4B288200 not in L1 Cache Address: 0x4B288202 Can not be loaded into L1 Cache
Se o erro ocorrer mais de uma vez, substitua o MSFC. Se o erro ocorrer apenas uma vez, você pode ter experimentado um único evento abortado. Nesse caso, monitore o MSFC. Consulte PMPEs (Processor Memory Parity Errors) para obter mais informações sobre erros de paridade.
O MSFC2 contém proteção de memória ECC. No entanto, há locais de memória nos quais a paridade é verificada, mas os erros de bit único não podem ser corrigidos. Estas são algumas mensagens de erro que você pode ver no arquivo crashinfo que indicam um erro de paridade:
Se essas mensagens de erro forem registradas apenas uma vez, você pode ter sofrido um único evento aborrecido. Monitore o MSFC2. Se os erros ocorrerem com mais frequência, substitua o MSFC2. Consulte PMPEs (Processor Memory Parity Errors) para obter mais informações sobre erros de paridade.
Se o MSFC2 travar e você tiver um arquivo crashinfo no dispositivo bootflash, emita o comando more bootflash: crashinfo_filename. O comando exibe as informações do arquivo crashinfo. Se você vir a mensagem MISTRAL-3-ERROR na seção de log inicial do registro de informações de travamento, consulte Travamentos de MSFC2 com Mensagens de Erro Mistral-3 no Arquivo Crashinfo para determinar se você encontrou um dos motivos comuns.
O comando show system sanity executa um conjunto de verificações predeterminadas da configuração com uma possível combinação de determinados estados do sistema para compilar uma lista de condições de aviso. As verificações são projetadas para procurar qualquer coisa que parece fora do lugar. As verificações destinam-se a ajudá-lo a manter a configuração e funcionalidade desejadas e corretas do sistema. Esse comando é suportado no CatOS versão 8.3x ou posterior.
Consulte Verificação de integridade para problemas de configuração e integridade do sistema para saber a lista de verificações executadas e ver a saída de exemplo do comando.
Consulte Recuperação do Catalyst 6500/6000 com Supervisor Engine I ou II para recuperar o Cisco Catalyst 6000/6500 com Supervisor Engine 1 ou 2.
Consulte Recuperação do Catalyst 6500/6000 com Supervisor Engine 720 ou Supervisor Engine 32 para recuperar o Cisco Catalyst 6000/6500 com Supervisor Engine 720 ou 32.
O arquivo crashinfo é uma coleção de informações úteis relacionadas ao travamento atual armazenado na memória flash ou bootflash. Quando um roteador trava devido a dados ou pilhas corrompidos, são necessárias mais informações sobre recarregamento para depurar esse tipo de travamento do que apenas a saída do comando show stacks normal.
O arquivo crashinfo contém estas informações:
Consulte Recuperando informações do arquivo Crashinfo para obter mais informações e para obter o procedimento para recuperar o arquivo crashinfo.
Consulte Criação de Core Dumps para obter mais informações e para obter o procedimento de coleta do dump central do dispositivo.
Para os Switches Cisco Catalyst 6000/6500 que executam o IOS nativo, consulte Mensagens de Erro Comuns nos Switches Catalyst 6500/6000 Series que Executam o Software Cisco IOS. Se você vir uma mensagem de erro que não esteja em uma das mensagens de erro comuns, consulte:
Para os Switches Cisco Catalyst 6000/6500 que executam o sistema operacional híbrido, consulte Mensagens de Erro CatOS Comuns nos Switches Catalyst 6500/6000 Series. Se você vir uma mensagem de erro que não esteja em uma das mensagens de erro comuns, consulte Messages and Recovery Procedures - Catalyst 6500 Series System Message Guide, 8.4.
Use o Cisco CLI Analyzer (somente clientes registrados) para receber análise instantânea de solução de problemas e um curso de ação para seu roteador, switch ou dispositivo PIX usando a saída do comando show.