Este documento contém informações para resolver problemas de travamento no processador versátil de interface (VIP).
A Cisco recomenda que você tenha conhecimento dos avisos de campo do 7500 Series Router.
As informações neste documento são baseadas nestas versões de software e hardware:
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
Para interpretar um travamento de VIP, é importante primeiro entender a arquitetura básica do VIP. A figura nesta seção mostra o diagrama de blocos funcionais do VIP2, que inclui estes componentes:
A CPU de computação de conjunto de instruções (RISC) e circuito associado da Orion, que inclui RAM dinâmica (DRAM), cache L2, circuito integrado específico de aplicativos (ASIC) da RENO e ROM de inicialização.
CyBus ASIC—O componente que controla e transfere pacotes entre a RAM estática (SRAM) do VIP2 e a memória de pacote do sistema (MEMD) através do CyBus ou CxBus.
ASIC de memória de pacote—Responsável pela movimentação de pacotes entre adaptadores de porta e SRAM.
Barramentos PCI (Peripheral Component Interconnect)—Caminhos de dados entre os adaptadores de porta e SRAM VIP2.
Bridges—Responsável pelo isolamento dos barramentos PCI individuais dos adaptadores de porta.
O microcódigo VIP2 (firmware) é uma imagem que fornece instruções de software específicas da placa. Um dispositivo de memória programável somente leitura (PROM) no VIP2 contém uma imagem de inicialização de microcódigo padrão que ajuda o sistema a localizar e carregar a imagem de microcódigo do pacote do software Cisco IOS® ou da memória Flash. A imagem de inicialização do microcódigo no PROM inicializa o VIP2 e, em seguida, auxilia o download da imagem de microcódigo do VIP2. Todas as interfaces do mesmo tipo carregam a mesma imagem de microcódigo, seja a partir do pacote de software Cisco IOS ou a partir da memória Flash. Embora a memória Flash possa armazenar várias versões de microcódigo para um tipo de interface específico, apenas uma imagem pode carregar na inicialização.
O comando show controllers cbus exibe a versão de microcódigo atualmente carregada e em execução para cada processador de interface e para o VIP2. O comando show startup-config mostra as instruções do sistema atuais para carregamento de microcódigo na inicialização.
Ao solucionar problemas, você pode usar a figura nesta seção como um guia para ler informações de um arquivo VIP crashinfo ou do syslog. Por exemplo, veja esta saída de syslog que mostra que paridade ruim é encontrada quando lida do VIP SRAM:
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Como você vê nas recomendações da próxima seção, o VIP nesta saída deve ser monitorado e o SRAM ou VIP deve ser substituído se ocorrerem travamentos semelhantes.
Você pode verificar o conteúdo do endereço 0x21 na EEPROM na saída do comando show diag para verificar o modelo de um VIP. Os valores que correspondem a cada tipo de VIP são mostrados nesta tabela:
Valor | VIP | Tipo de controlador |
---|---|---|
0x14 | VIP1 | Controlador VIP |
0x15 | VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) | controlador VIP2 |
0x1E | VIP2-50 | Controlador VIP2 R5K |
0x20 | FEIP2 | Controlador de FEIP2 |
0x21 | GEIP | Controlador GEIP |
0x40 | GEIP +* | controlador GEIP+ |
0x22 | VIP4-80 | Controlador VIP4-80 RM7000 |
0x31 | VIP4-50 | Controladora VIP4-50 RM5271 |
0x4E | VIP6-80 | Controlador VIP6-80 RM7000B |
Observação: o GEIP+ é baseado no VIP4-80. Todas as informações adicionais neste documento sobre o VIP4-80 também se aplicam ao GEIP+.
Aqui está um exemplo:
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
Nessa saída, você pode ver se esse VIP é um VIP2-50.
A diferença entre um VIP2-10, um VIP2-15, um VIP2-20 e um VIP2-40 é a quantidade de DRAM e SRAM em cada um. Os vários VIP2s (se eles não tiverem sido atualizados) podem ser diferenciados na saída do comando show diag pelas configurações de memória mostradas nesta tabela:
Memória | VIP |
---|---|
DRAM de 8 MB/SRAM de 512 KB | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
DRAM de 16 MB/SRAM de 1 MB | VIP2-20 |
32 MB DRAM/2 MB SRAM | VIP2-40 |
As informações contidas no arquivo crashinfo podem ser inestimáveis quando você tenta resolver problemas de software ou tenta diagnosticar a causa subjacente de travamentos do sistema. O arquivo crashinfo não contém apenas informações de registro e um rastreamento de pilha para o VIP, contém também informações de memória extensiva e de contexto. Toda vez que o VIP trava, ele tenta gravar um arquivo de informações de travamento para o bootflash do RSP. Os arquivos de informação de travamento são armazenados neste formato:
crashinfo_vip_<slot#>_<data>_<time>
Você pode executar o comando dir para localizar os arquivos VIP crashinfo como mostrado aqui:
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
Este flash de inicialização do roteador contém dois arquivos de informação de travamento VIP. Emita o comando show file ou mais para visualizar e capturar o conteúdo desses arquivos de acordo com este procedimento:
Comece fazendo o logon no seu programa terminal.
Emita o comando term length 0.
Emita o comando more bootflash:<crashinfo filename>.
Salve a saída em um arquivo.
Consulte Recuperando Informações do Arquivo Crashinfo para obter mais informações sobre como trabalhar com arquivos crashinfo.
Se você tiver a saída do comando show technical-support (do modo de ativação) de seu dispositivo Cisco, poderá usar para exibir possíveis problemas e correções. Você deve ser um cliente registrado, estar conectado e ter JavaScript habilitado para usar .
Os travamentos de VIP são classificados em várias categorias com base na causa do travamento. Sempre que um erro não recuperável é encontrado, o VIP trava. Esses erros podem ser o resultado de erros de paridade, software ou hardware que fazem com que uma mensagem de confirmação negativa (NACK) esteja presente no CyBus ou problemas de software. Esta seção fornece informações sobre cada um desses tipos de erro.
Se você tiver a saída do comando show technical-support (do modo de ativação) de seu dispositivo Cisco, poderá usar para exibir possíveis problemas e correções. Você deve ser um cliente registrado, estar conectado e ter JavaScript habilitado para usar .
Erros de paridade ocorrem em um VIP quando o hardware tenta verificar a validade dos dados comparando os valores de paridade calculados com os valores anteriores de paridade para os mesmos dados. Uma única inversão de bit nos dados pode resultar em erro de paridade. Quando você diagnostica erros de paridade em um VIP, é importante entender cada local no qual a paridade é verificada e em que erros de paridade podem ocorrer. Este diagrama descreve essas informações. Além disso, consulte a Análise da árvore de falhas do Cisco 7500 VIP para obter mais informações sobre erros de paridade.
Como mostrado neste diagrama, há sete tipos diferentes de erros de paridade que podem ocorrer em um VIP. Observe que os erros podem ser recebidos de outra origem e podem não ter se originado no próprio VIP. A origem do erro de paridade pode ser do Route/Switch Processor (RSP), de outro VIP ou de adaptadores de porta mal encaixados ou defeituosos. Para entender corretamente um travamento de VIP, é importante diagnosticar a origem do travamento.
Também é importante entender que os dados com paridade ruim podem ser relatados por vários dos dispositivos de verificação de paridade no VIP e no Cisco 7500 Series Router para qualquer operação única de leitura ou gravação. Por exemplo, se o VIP lê um pacote em uma fila de transmissão no RSP em seu próprio SRAM, e há um erro de paridade na SRAM do RSP, você verá mensagens de erro do MD ASIC no RSP, do CYA ASIC no VIP e também do PCI/ASIC de memória de pacote no VIP.
Este diagrama mostra a análise de árvore de falhas para travamentos de VIP:
O VIP4-50, o VIP4-80 e o VIP6-80 usam correção de erro de bit único e correção de código de erro de detecção de erro de bit duplo (ECC) para memória de CPU e memória de pacote. Ambos são SDRAM (Synchronous Dynamic RAM, RAM dinâmica síncrona). Um único erro de bit na SDRAM é corrigido e o sistema continua funcionando normalmente.
Os erros de paridade de vários bits nos números 2 ou 3 desta tabela são um evento fatal que faz com que ocorram erros de multibit ECC. O cache interno da CPU e os barramentos no sistema usam a detecção de paridade de bits únicos. Como mostrado aqui, a arquitetura do VIP4 e do VIP6 é diferente do VIP2. Portanto, algumas mensagens de erro não são vistas e outras mensagens de erro são relatadas de forma diferente do que estão no VIP2. Nesta seção de erro de paridade, as diferenças entre o VIP2, o VIP4 e o VIP6 são indicadas e explicadas.
Exceções de erro de paridade de cache ocorrem quando uma paridade incorreta é descoberta na CPU ou no cache de dados principal. O erro de paridade pode ter ocorrido na DRAM VIP, na controladora DRAM, no cache principal ou na própria CPU. Erros de paridade descobertos neste local também são referidos como PMPEs (Erros de paridade de memória do processador). Esses erros resultam em um travamento imediato do VIP e a saída é semelhante em VIPs e RSPs. Um valor de sig de vinte (sig=20) indica a ocorrência de uma exceção de erro de paridade de cache. O valor sig é exibido nas mensagens de registro do sistema referentes ao travamento.
O código recente também fornece uma linha verbosa significativa como mostrado aqui:
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
Os dados contidos no arquivo de VIP de informação de travamento também apontam para o mesmo local de erro de paridade no cache de dados primário:
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
É possível que um cache principal ou PMPE seja um erro transitório. Se esta for a primeira instância de um PMPE, você normalmente pode ignorá-la com segurança. Entretanto, se o mesmo VIP passar por um segundo PMPE ou um PMPE subseqüente, é necessário substituir o VIP. Às vezes, a substituição da própria DRAM também pode resolver o problema.
Nota de VIP4 e VIP6 —Os erros de paridade que ocorrem no cache interno da CPU e no CyAsic são detectados como exceções de erro de paridade de cache. Erros de paridade de bit único na memória da CPU são corrigidos, e nenhuma ação precisa ser tomada. Erros de paridade de vários bits na memória da CPU são detectados como um erro de paridade de multibits ecc procmem. A memória da CPU no VIP deve ser substituída se um erro de paridade de múltiplos bits procmem ecc for relatado.
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
Quando um VIP é baixado do MEMD no RSP e esses erros são vistos, isso geralmente indica que outro VIP gravou uma paridade incorreta no MEMD ou o MEMD foi corrompido. Se a origem for do MEMD e continuar, você precisará substituir o RSP. Por outro lado, se a origem da paridade incorreta for outro VIP, você deve recolocar e, se necessário, substituir o VIP que grava a paridade incorreta.
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
Observação: o VIP4 e o VIP6 mostram as mesmas mensagens de erro sobre o erro de paridade do CyBus, mas a mensagem de erro de paridade de gravação do barramento de pacote não é exibida.
Os erros de paridade do controlador de DRAM e os erros de paridade do controlador de E/S (entrada/saída) são detectados pelo RENO ASIC. Um erro de paridade originado na DRAM ou na controladora DRAM é relatado como uma exceção de paridade de cache. Um erro de paridade detectado pelo controlador de E/S é relatado, como mostrado nesta saída. Freqüentemente, erros de paridade reportados pelo controlador de E/S originaram-se em outro lugar e são reportados pelo controlador de E/S além das mensagens de outros locais.
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
Observação: o VIP4 e o VIP6 não mostram esta mensagem de erro.
O PMA ASIC reporta um erro de paridade de memória lida de pacote sempre que um erro de paridade é lido da memória de pacotes (SRAM) no VIP. Este erro é relatado no registro do sistema, conforme mostrado aqui:
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
Também é possível perceber a evidência de erro de paridade de memória lida de pacote de informação no arquivo de informação de travamento de VIP:
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
Os erros de paridade de SRAM também podem ser transitórios, portanto, trate a primeira ocorrência da mesma forma que os erros de paridade de DRAM. Se o erro persistir, substitua a SRAM ou o VIP.
Nota sobre VIP4 e VIP6—Os erros de paridade de bit único na memória do pacote são corrigidos. Erros de paridade de vários bits na memória do pacote são detectados como um erro de paridade de vários bits ecc pakmem. A memória de pacote VIP deverá ser substituída se o erro pakmem ecc multi-bit parity for reportado.
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
O PMA ASIC informa um erro de paridade de gravação de barramento de pacote sempre que um erro de paridade é gravado na memória de pacotes. Neste exemplo, o VIP é apenas o mensageiro e o problema não existe com a memória deste VIP.
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
Observação: o VIP4 e o VIP6 não mostram esta mensagem de erro.
Os erros de paridade podem ser detectados em barramentos de PCI 1 e 2, que fazem a interface diretamente com os adaptadores de porta. Esses barramentos são ligados por um terceiro barramento de PCI, o barramento 0, no qual os erros de paridade também podem ser detectados. Os erros de paridade originados em qualquer barramento PCI são mais comumente causados por adaptadores de porta mal encaixados ou defeituosos. Sempre que vir essas mensagens na saída de syslog de um travamento de VIP, você precisará recolocar o adaptador de porta para resolver o problema.
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
Se a recolocação do adaptador de porta não resolver o problema, o problema está no adaptador de porta ou no VIP. Mova o adaptador de porta para outro compartimento e insira um segundo adaptador de porta no compartimento original para solucionar problemas. Isto normalmente aponta o hardware defeituoso. Um exemplo é mostrado abaixo:
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Observação: os mesmos erros ocorrem com o VIP4 e o VIP6, mas a mensagem de erro é diferente. Ele é detectado como um erro de paridade mestre de PCI e um erro de paridade de escravo de PCI. Execute as mesmas etapas descritas para Erros de paridade do barramento PCI VIP para solucionar esse problema.
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
Os erros de paridade também podem ser detectados pelo VIP nos dados ou no endereço de uma operação de leitura ou gravação no CyBus. Se isso ocorrer, você verá uma saída de syslog semelhante a esta:
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
Use essas informações em conjunto com as informações presentes nos registros do sistema para determinar a verdadeira origem do erro.
Observação: o VIP4 e o VIP6 mostram as mesmas mensagens de erro para erros de paridade do CyBus.
Quando o VIP tenta gravar em um endereço inválido no MEMD, o RSP coloca um NACK no CyBus para esse slot. Geralmente, esse é um problema de software, mas também pode ser um problema de hardware. Por exemplo, nesta saída, o VIP grava 4 bytes em um endereço inválido, de modo que o RSP coloca um NACK no CyBus para esse slot.
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
No entanto, como mostrado nesta saída, o RSP também coloca um NACK em um VIP para tentar gravar paridade incorreta no MEMD.
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
Quando um NACK é exibido em todos os slots, como mostrado nesta saída, é um erro de hardware. O intermediário é defeituoso e o gabinete de placa deve ser substituído.
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
Travamentos de VIP não causados por nenhum dos motivos neste documento são mais comumente causados por outros problemas de software. Essas panes podem ser manifestadas em uma variedade de maneiras. Estas são sugestões gerais para reduzir o risco de travamentos de VIP devido a problemas de software e para lidar com eles se ocorrerem:
Certifique-se sempre de que a imagem do software Cisco IOS suporta o VIP.
Sempre mantenha a imagem RSP-BOOT e a principal imagem do software Cisco IOS na mesma versão.
Certifique-se de que a configuração de VIP e o adaptador de porta sejam suportados pela versão atual do Cisco IOS Software.
Verifique as notas de versão para obter os requisitos corretos de nível e de memória do Cisco IOS Software.
Este é um exemplo de uma saída de log do sistema de um travamento de VIP devido a um problema de software:
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
Talvez a informação mais importante a ser obtida no caso de um problema de software seja o arquivo de informação de travamento para o VIP. Consulte a seção Obtain a VIP Crashinfo File para obter instruções sobre como capturar essas informações.
O VIP trava muitas vezes e quando você revisa o arquivo de informações de travamento, esta mensagem pode ser exibida:
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
A mensagem de erro sinal da CPU 10 significa erro de exceção de barramento. Os erros de barramento podem ser problemas de software ou hardware. A solução alternativa para esse problema é recolocar o módulo e monitorar o roteador. Se o módulo continuar travando depois que você recolocar o módulo, entre em contato com a ferramenta TAC Case Open (somente clientes registrados) com o arquivo de informações de travamento.
É recomendável criar um arquivo de resumo de travamento VIP com essas informações antes de abrir um caso. Inclua essas informações no campo Descrição do problema da ferramenta TAC Case Open (somente clientes registrados) .
Descrição do problema
Resultado do comando show version
Saída do comando show diag slot [x]
trecho de arquivo Crashinfo
Resumo Syslog
Em seguida, colete as informações para coletar se você abrir um caso no TAC.
Este é um exemplo de um arquivo de resumo de travamento:
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Se você ainda precisar de assistência após executar as etapas de solução de problemas neste documento e quiser abrir um caso no Suporte Técnico da Cisco, certifique-se de incluir estas informações: |
---|
Observação: se possível, não recarregue manualmente ou desligue e ligue o roteador antes de coletar essas informações, pois isso pode fazer com que informações importantes sejam perdidas, necessárias para determinar a causa raiz do problema. |
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
02-Oct-2006 |
Versão inicial |