Este documento fornece diretrizes gerais para determinar se há falha de hardware em um switch Catalyst. A lista de verificação abaixo aplica-se aos switches das séries Catalyst 4500/4000 e 5500/5000 que executam o software Cisco Catalyst OS (CatOS). O objetivo é ajudar os clientes da Cisco a identificar problemas básicos de hardware ou executar um troubleshooting mais abrangente antes de entrar em contato com o Suporte Técnico de Cisco.
Você pode igualmente referir estes documentos de Troubleshooting relacionados para a assistência adicional:
Troubleshooting de Hardware dos Catalyst 5500/5000/2926G/2926 Series Switches
Hardware de Troubleshooting para Catalyst 4000/4912G/2980G/2948G Series Switches
Para obter mais informações sobre convenções de documento, consulte as Convenções de dicas técnicas Cisco.
Não existem requisitos específicos para este documento.
A informação neste documento é baseada nos comandos disponíveis em todas as versões de software para o catalizador 4500/4000, 5500/5000, e 6500/6000 do Switches.
A única exceção a esta é o comando set test diaglevel, que foi introduzido na CatOS Software release 5.4(1).
Se você executa o Cisco IOS ® Software no Switches do Catalyst 6500/6000 ou Catalyst 4500/4000 Series, os comandos show and set usados em CatOS não trabalham. Contudo, as etapas usadas neste documento aplicam-se para comutar o hardware e podem-se ser aplicadas usando o comando do Cisco IOS Software comparável.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se você estiver trabalhando em uma rede ativa, certifique-se de que entende o impacto potencial de qualquer comando antes de utilizá-lo.
A seguir, um processo de Troubleshooting ordenado que auxiliará na coleta as informações necessárias para resolver o problema. Refinar o espaço do problema ganhará o tempo valioso de cliente em encontrar uma solução e depois das etapas assegurar-se-á de que os dados importantes não estejam perdidos.
Na saída do comando show system, verifique se existem falhas. Os campos de status estão relacionados a vários LEDs nos componentes do sistema. Todos os LEDs do sistema devem estar verdes. Se os LEDs não estiverem verdes, isso pode indicar uma falha. É importante compreender os componentes da família de Catalyst Switch e o que os diodos emissores de luz o estão dizendo para determinar se um componente está falhando. O LED de status no Supervisor Engine indica se o Supervisor Engine passou em todos os testes de diagnóstico. O Supervisor Engine contém o software do sistema operacional. Verifique o Supervisor Engine caso tenha problemas com o software do sistema. Tenha uma sessão de console aberta e determine se o Supervisor Engine reage da bota ou o modo do monitor de rom (ROMMON). Se o interruptor é colado na bota ou no modo ROMMON, siga os passos de Troubleshooting nos Catalyst Switch em recuperação que executam CatOS do documento das falhas na inicialização.
O comando show system fornecerá informações valiosas sobre o ambiente e o sistema para o Catalyst Switch. O comando output igualmente indica o uptime, que é a quantidade de tempo que o interruptor foi em serviço. Essas informações são úteis para determinar o momento em que uma falha de switching pode ter ocorrido.
Se você tem a saída de um comando show system de seu dispositivo Cisco, você pode usar o Output Interpreter (clientes registrados somente) para indicar problemas potenciais e reparos.
Saída de exemplo
Console (enable) show systemPS1-Status PS2-Status ---------- ---------- ok none Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout---------- ---------- ---------- -------------- ---------faulty off faulty 18,22:37:24 20 minPS1-Type PS2-Type ------------ ------------ WS-CAC-1300W none Modem Baud Traffic Peak Peak-Time------- ----- ------- ---- -------------------------disable 9600 0% 0% Fri May 24 2002, 07:04:29PS1 Capacity: 1153.32 Watts (27.46 Amps @42V)System Name System Location System Contact CC------------------------ ------------------------ ------------------------ --- Console (enable)
Nota: Se alguma falha ocorrer, como Fan-Status defeituoso acima, inspecione o conjunto do ventilador e as fontes de alimentação em busca de problemas.
PS -Status : indica o status das fontes de alimentação no chassi. Um failing PS ou um PS que não tivesse a potência fornecida pôde indicar uma falha no módulo de Supervisor Engine (status de sistema defeituoso). Se o interruptor tem um diodo emissor de luz do sistema laranja e um PS#-estado de defeituoso este não significa necessariamente que a fonte de alimentação ou o interruptor são defeituosa. Esta é uma possível indicação que uma das fontes de alimentação não esteve introduzido corretamente ou não pode ser obstruída dentro.
Nota: O Catalyst 4006 exige duas fontes de alimentação instaladas para operar o interruptor, e uma fonte de alimentação adicional para a Redundância. Para obter mais informações, analise a seção Equipamento padrão do documento Recursos-chave dos Switches da família Catalyst 4000.
Status do ventilador: se isto indica um problema, o sistema pôde tornar-se superaquecido e consequentemente para causar problemas com o funcionamento do interruptor.
Sys-Status: indica se alguma falha foi detectada no sistema.
Tráfego & pico: dá uma indicação da carga no painel traseiro do Catalyst. Monitore essa utilização quando a rede estiver em execução normal, sem problemas. Mais tarde, quando um problema pôde ocorrer na rede, os resultados da operação normal puderam ser usados para comparar se, por exemplo, os laços do Spanning Tree Protocol (STP), as tempestades de transmissão, ou outros tipos de eventos que geram muito tráfego podem fazer com que os outros dispositivos experimentem um desempenho mais lento.
Visualize a saída do módulo com suspeita de falha, emitindo o comando show test mod.
Nota: O comando show test pode mostrar-lhe uma entrada de nível de diálogo. Se esse diaglevel estiver definido como desvio ou mínimo, você poderá alterar isso emitindo o comando set test diaglevel complete e redefinindo o módulo para que o autoteste ocorra. O comando definir conclusão de teste diaglevel executa todos os autotestes disponíveis, enquanto as opções mínima e de desvio ignoram alguns ou todos os testes.
Se você visualizar um F no resultado do comando show test, isso indica que essa parte pode apresentar uma falha de hardware.
Exemplo 1: Catalyst 4000
Galaxy> (enable) show test 1 Diagnostic mode (mode at next reset: complete) Module 1 : 2-port 1000BaseX Supervisor POST Results Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) Galaxy Supervisor Status : . CPU Components Status Processor : . DRAM : . RTC : . EEPROM : . FLASH : . NVRAM : . Temperature Sensor : . Uplink Port 1 : . Uplink Port 2 : . Me1 Status : . EOBC Status : . SCX1000 - 0 Register : . Switch Sram : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 1 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 2 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . Galaxy> (enable) show test 5 Diagnostic mode (mode at next reset: complete) Module 5 : 14-port 1000 Ethernet Status: (. = Pass, F = Fail, U = Unknown) Eeprom: . NICE Regs: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . NICE SRAM: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . 1000Base Loopback Status: Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ----------------------------------------- . . . . . . . . . . . . . .
Amostra 2: Catalyst 5000
Sacal> show test 1 Module 1 : 2-port 100BaseFX MM Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . MCP Comm: . EARL Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . MonitorTest . DontLearn: . FlushPacket: . ConditionalLearn: . EarlLearnDiscard: . EarlTrapTest: . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) CPU : . Sprom : . Bootcsum : . Archsum : N RAM : . LTL : . CBL : . DPRAM : . SAMBA : . Saints : . Pkt Bufs : . Repeater : N FLASH : N MII Status: Ports 1 2 ----------- N N SAINT/SAGE Status : Ports 1 2 3 -------------- . . . Packet Buffer Status : Ports 1 2 3 -------------- . . . Loopback Status [Reported by Module 1] : Ports 1 2 3 -------------- . . . Channel Status : Ports 1 2 ----------- . .
Amostra 3: Catalyst 6500
tamer>(enable) show test 1 Diagnostic mode: complete (mode at next reset: minimal) Module 1 : 2-port 1000BaseX Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . EOBC Comm: . Line Card Status for Module 1 : PASS Port Status : Ports 1 2 ----------- . . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) Module 1 Earl V Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . DontLearnTest: . ConditionalLearnTest: . BadBpduTest: . TrapTest: . MatchTest: . SpanTest: . CaptureTest: . ProtocolMatchTest: . IpHardwareScTest: . IpxHardwareScTest: . MultipleRoutersScTest: . L3DontScTest: . L3RedirectTest: . L3Capture2Test: . L3VlanMetTest: . AclPermitTest: . AclDenyTest: . Loopback Status [Reported by Module 1] : Ports 1 2 ----------- . . Channel Status : Ports 1 2 ----------- . . InlineRewrite Status : Ports 1 2 ----------- . . tamer>(enable) show test 3 Diagnostic mode: complete (mode at next reset: minimal) Module 3 : 48-port 10/100BaseTX Ethernet Line Card Status for Module 3 : PASS Port Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ------------------------------------------------------------------------ . . . . . . . . . . . . . . . . . . . . . . . . Line Card Diag Status for Module 3 (. = Pass, F = Fail, N = N/A) Loopback Status [Reported by Module 1] : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Channel Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . InlineRewrite Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . .
Veja a saída do comando show logging buffer para todos os Mensagens de Erro indicados em torno do tempo onde você encontrou a falha no switch.
O Catalyst Switch pode indicar uma mensagem que indica todos os eventos que ocorrerem no interruptor. Olhe esta saída e verifique o significado de todas as mensagens indicadas no documento da mensagem e dos procedimentos de recuperação. Isso pode lhe fornecer uma indicação do que exatamente ocorreu no momento da falha e permitir que você verifique se o problema está relacionado a hardware ou software. Use a ferramenta do decodificador do mensagem de erro (clientes registrados somente) para ajudar a decifrar a saída de todas as mensagens.
Saída de exemplo
O syslog pode exibir as seguintes mensagens de erro:
SYS-2-FAN_FAIL: Fan failedSYS-2-MOD_TEMPMINORFAIL: Module 2 minor temperature threshold exceeded
Se nós olhamos acima as mensagens na mensagem e nos procedimentos de recuperação, nós vemos que a primeira mensagem indica uma falha de uns ou vários fãs no sistema. Isso é seguido por uma mensagem informando que o módulo 2 detectou uma elevação em sua temperatura. Nesse caso, você precisa examinar o módulo do ventilador para resolver o problema.
Além do que a revisão dos Mensagens de Erro, é um bom uso da ideia o Bug Toolkit (clientes registrados somente) ver se há alguma edição com o software release. O comando show version fornecerá informações sobre a versão do software a ser usada em uma pesquisa de depuração.
Por exemplo, se você identifica uma exceção na saída do comando show log, use o Bug Toolkit (clientes registrados somente) para procurar por erros em sua plataforma do Catalyst, em versão de software, e na exceção do log da mostra.
Verifique o número do modelo do módulo que apresenta problemas e a versão do software que está utilizando, emitindo o comando show version. Determine o total de DRAM (Memória de Acesso Aleatório Dinâmico) e de Flash. Use o Software Advisor (clientes registrados somente) ou a visão geral de produto para a plataforma particular para determinar se o hardware é compatível com o software.
Esse comando verifica a versão do software que está sendo executado. Este comando também tem informações sobre o tamanho de Flash e DRAM. Essas informações são úteis caso você precise atualizar.
Saída de exemplo
Console (enable) show versionWS-C6509 Software, Version NmpSW: 5.5(5)Copyright (c) 1995-2000 by Cisco SystemsNMP S/W compiled on Dec 14 2000, 17:05:38System Bootstrap Version: 5.3(1)Hardware Version: 2.0 Model: WS-C6509 Serial #: SCA0412024UMod Port Model Serial # Versions--- ---- ------------------- ----------- --------------------------------------1 2 WS-X6K-SUP1A-2GE SAD04281END Hw : 3.2 Fw : 5.3(1) Fw1: 5.4(2) Sw : 5.5(5) Sw1: 5.5(5) WS-F6K-PFC SAD04340506 Hw : 1.13 8 WS-X6408-GBIC SAD0415009A Hw : 2.4 Fw : 5.1(1)CSX SW : 5.5(5)4 48 WS-X6348-RJ-45 SAL0446200S Hw : 1.4 Fw : 5.4(2) SW : 5.5(5)15 1 WS-F6K-MSFC SAD04120BNJ Hw : 1.4 Fw : 12.1(8a)E2 SW : 12.1(8a)E2 DRAM FLASH NVRAMModule Total Used Free Total Used Free Total Used Free------ ------- ------- ------- ------- ------- ------- ----- ----- -----1 65408K 37463K 27945K 16384K 15673K 711K 512K 236K 276KUptime is 18 days, 21 hours, 54 minutesConsole (enable)
Se uma elevação é exigida, verifique sempre os Release Note primeiramente para ver se há a plataforma particular e escolha a versão que você precisa de promover a.
Se estiver tendo problemas com várias portas, tente ativar ou desativar as portas com problema. A porta pode ser permitida ou desabilitado emitindo o set port {permita | comando mod/port do desabilitação}.
Em algumas situações, o Catalyst Switch pôde encontrar problemas com uma porta. Desativar e reativar essa porta específica pode resolver o problema.
Nota: Desabilitando ou permitindo uma porta, você pode igualmente provocar alguns eventos no dispositivo conectado a essa porta (tal como o reinício de um processo em um server que seja colado). Na maioria das situações, quando desativar e reabilitar uma porta soluciona o problema, significa que o problema não está relacionado a software. Se isto resolve a edição, restaure esta placa de linha durante uma janela de manutenção de modo que o self-test ocorra.
Se você estiver enfrentando problemas em uma porta específica, tente mover a conexão para outra porta. Use uma estação que você saiba a trabalhar e conectar à porta de falha.
Se a ação anterior de desabilitar e habilitar novamente a porta não resolver o problema, mova a conexão para outra porta no mesmo módulo (com a mesma configuração). Se o problema for resolvido, isso indica que pode ter ocorrido uma falha de hardware. Se o problema persiste, pode ser devido à configuração do dispositivo conectado. Verifique que a velocidade de porta e as configurações bidirecional são a mesma na porta de switch e no dispositivo conectado.
Por exemplo, uma estação conectada à porta 1 no módulo 7 continua sendo conectada e desconectada. Experimente trocar as conexões da porta 1 e da porta 2 no mesmo módulo (certificando-se de que a porta 1 e a porta 2 possuam a mesma configuração). Se o problema já não ocorre na porta 2, mas agora a estação na porta 1 começa bater pelo contrário, esta aponta a um problema com a porta 1. Se o problema segue à porta 2, este poderia indicar um possível problema com a configuração, o dispositivo conectado, ou o problema de cabo.
Tenha uma sessão de console aberta e capture diagnósticos do auto-teste de energia da inicialização (CARGO) e todos os mensagens de erro de sistema. Restaure o módulo emitindo o comando reset mod.
Após ter restaurado o módulo, se a placa de linha volta em linha e todas as portas passam seu teste de diagnósticos e traficam os começos que passam, os problemas de módulo são provavelmente devido a uma questão de software. Emita o comando show test mod determinar se este módulo passou todos seus testes diagnósticos na inicialização. Note todo o F para resultados da falha.
Remova o módulo e o inspecione por pinos tortos. Para remontar o módulo, pressione firmemente a alavanca do ejetor e aperte os parafusos de instalação.
Em alguns casos, uma placa mal ajustada pode causar sintomas que parecem ser uma falha de hardware. Uma placa mal colocada pode causar corrupção de tráfego no painel traseiro, o que pode resultar em vários problemas no chassi do Catalyst. Por exemplo, se um módulo corromper o tráfego na placa-mãe do Catalyst, isso poderá fazer com que o teste automático falhe para o próprio módulo e outros módulos. Reinicializar todas as placas pode resolver isso e permitir que os autotestes sejam aprovados.
Tente remover todas as placas de linha no chassi, exceto o módulo de Engine do supervisor ativo e o módulo do problema, para determinar se a falha você encontrou mudanças. Se a falha persistir, mova a placa de linha para um slot conhecido no chassi.
Nota: Se o módulo era um tipo diferente de módulo, salvar sua configuração e emita o comando clear config module.
Se uma das placas de linha do chassi estiver defeituosa, ela também poderá causar uma falha em outras placas de linha. Neste caso, remover uma placa pode resolver os problemas vistos nas outras placas. Se o módulo ainda está falhando depois que você removeu todas as placas de linha restantes e moveu a placa de linha para um outro entalhe, este pode indicar que a placa de linha é defeituosa. Se um outro interruptor está disponível, tente o módulo em um outro chassi determinar finalmente se é um módulo ou um problema de chassi.
Se o módulo parece se operar normalmente e passar o tráfego após ter removido os módulos adicionais e ter movido o módulo para um outro entalhe, este pode indicar um problema possível com o chassi. Tente colocar o módulo de volta no local original e determine se ele retorna à condição de falha. Se o módulo parece se operar normalmente e está passando o tráfego na localização original, este pode indicar um problema de software. Use o Bug Toolkit (clientes registrados somente) para procurar por erros na plataforma do Catalyst, na versão de software, e no erro que você está experimentando.
Remova o Supervisor Engine e inspecione-o para os pinos de curvatura. Assente o Supervisor Engine, comprima firmemente as alavancas de ejetor, e aperte os parafusos de instalação cativa. Para o Switches do Catalyst 5500 e 6000 Series, os motores do supervisor podem ser instalados no slot1 e em 2. Para eliminar problemas da dependência do entalhe, mova o Supervisor Engine para o outro entalhe disponível para o módulo de Supervisor Engine. O Switches do Catalyst 5500 e 6000 Series igualmente apoia a Redundância que permite que o interruptor tenha os Supervisor Engine dual. Se você é Supervisor Engine dual running, tente forçar um switchover ao motor do supervisor em standby desconectando o motor do supervisor ativo ou emitindo o comando reset mod. Para obter mais informações sobre das exigências do Supervisor Engine do entalhe, refira estes links:
Tenha uma sessão de console aberta e capture o diagnóstico POST de inicialização e quaisquer mensagens de erro do sistema. Espere o Supervisor Engine para inicializar. Se o show system command sys-status é ainda defeituoso, o Supervisor Engine falhou.
Verificação o que estava acontecendo na altura da falha.
Se uma falha se mantém reoccurring, examine o que acontece naquele tempo e lugar. Isto pôde dar-lhe uma indicação a respeito do que está ocorrendo fora do Catalyst Switch que faz com que falhe. Por exemplo, uma pequena interrupção de energia, que poderia ser luzes piscando no prédio.