本文档提供了用于排除通用接口处理器(VIP)崩溃故障的信息。
思科建议您了解7500系列路由器现场通知。
本文档中的信息基于以下软件和硬件版本:
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
为了解释VIP崩溃,首先了解VIP的基本架构非常重要。本部分的图显示了VIP2的功能框图,其中包括以下组件:
Orion精简指令集计算(RISC)CPU和相关电路,包括动态RAM(DRAM)、L2缓存、RENO专用集成电路(ASIC)和引导ROM。
CyBus ASIC — 在VIP2静态RAM(SRAM)和系统数据包内存(MEMD)之间通过CyBus或CxBus控制和传输数据包的组件。
数据包内存ASIC — 负责在端口适配器和SRAM之间移动数据包。
外围组件互联(PCI)总线 — 端口适配器和VIP2 SRAM之间的数据路径。
网桥 — 负责隔离端口适配器的单个PCI总线。
VIP2微码(固件)是提供卡特定软件说明的映像。VIP2上的可编程只读存储器(PROM)设备包含默认微码引导映像,该映像可帮助系统从Cisco IOS®软件捆绑包或闪存中查找和加载微码映像。PROM中的微码引导映像初始化VIP2,然后协助下载VIP2微码映像。同一类型的所有接口都从Cisco IOS软件捆绑包或闪存加载相同的微码映像。虽然闪存可以存储特定接口类型的多个微码版本,但启动时只能加载一个映像。
show controllers cbus命令显示每个接口处理器和VIP2当前加载和运行的微代码版本。show startup-config命令显示当前系统在启动时加载微代码的说明。
排除故障时,可以使用本节中的图作为指南,从VIP crashinfo文件或系统日志中读取信息。例如,查看以下系统日志输出,该输出显示从VIP SRAM读取时发现奇偶校验错误:
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
如下一节的建议所示,应监控此输出中的VIP,并且如果再次发生类似崩溃,应更换SRAM或VIP。
您可以在show diag命令输出中检查EEPROM中地址0x21的内容,以验证VIP的型号。与每个VIP类型对应的值如下表所示:
价值 | VIP | 控制器类型 |
---|---|---|
0x14 | VIP1 | VIP控制器 |
0x15 | VIP2(VIP2-10、VIP2-15、VIP2-20、VIP2-40) | VIP2控制器 |
0x1E | VIP2-50 | VIP2 R5K控制器 |
0x20 | FEIP2 | FEIP2控制器 |
0x21 | GEIP | GEIP控制器 |
0x40 | GEIP +* | GEIP+控制器 |
0x22 | VIP4-80 | VIP4-80 RM7000控制器 |
0x31 | VIP4-50 | VIP4-50 RM5271控制器 |
0x4E | VIP6-80 | VIP6-80 RM7000B控制器 |
注意:GEIP+基于VIP4-80。本文档中有关VIP4-80的所有详细信息也适用于GEIP+。
示例如下:
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
从此输出中,您可以看到此VIP是VIP2-50。
VIP2-10、VIP2-15、VIP2-20和VIP2-40之间的区别是每个DRAM和SRAM的数量。在show diag命令输出中,各种VIP2(如果尚未升级)可通过下表所示的内存配置进行区分:
内存 | VIP |
---|---|
8 MB DRAM/512 KB SRAM | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
16 MB DRAM/1 MB SRAM | VIP2-20 |
32 MB DRAM/2 MB SRAM | VIP2-40 |
当您尝试解决软件问题或尝试诊断系统崩溃的根本原因时,crashinfo文件中包含的信息可能是非常宝贵的。crashinfo文件不仅包含VIP的日志记录信息和堆栈跟踪,还包含大量内存和情景信息。每次VIP崩溃时,VIP都会尝试将crashinfo文件写入RSP的bootflash。Crashinfo文件以以下格式存储:
crashinfo_vip_<slot#>_<data>_<time>
您可以发出dir命令以找到VIP crashinfo文件,如下所示:
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
路由器的此bootflash包含两个VIP crashinfo文件。发出show file或more命令,以便根据以下步骤查看和捕获这些文件的内容:
开始使用您的终端程序登录。
发出term length 0命令。
发出more bootflash:<crashinfo filename>命令。
将输出保存到文件。
有关如何使用crashinfo文件的详细信息,请参阅从Crashinfo文件检索信息。
如果您的Cisco设备有show technical-support(从启用模式)命令的输出,则可以使用 以便显示潜在问题和修复方法。您必须是注册客户、已登录并启用JavaScript才能使用 。
VIP崩溃根据崩溃原因分为几类。一旦发现不可恢复的错误,VIP就会崩溃。这些错误可能是奇偶校验错误、导致CyBus上出现否定确认消息(NACK)的软件或硬件或软件问题的结果。本节提供有关这些错误类型的信息。
如果您的Cisco设备有show technical-support(从启用模式)命令的输出,则可以使用 来显示潜在的故障和修复方法。您必须是注册客户、已登录并启用JavaScript才能使用 。
当硬件尝试通过比较计算的奇偶校验值与同一数据的先前奇偶校验值来检查数据的有效性时,VIP上会出现奇偶校验错误。数据中的单位翻转可能导致奇偶校验错误。当您诊断VIP上的奇偶校验错误时,了解检查奇偶校验的每个位置以及可能发生奇偶校验错误的位置非常重要。此图概述了此信息。此外,有关奇偶校验错误的详细信息,请参阅Cisco 7500 VIP故障树分析。
如图所示,VIP上可能出现七种不同类型的奇偶校验错误。请注意,错误可以从其他来源接收,可能不是源自VIP本身。奇偶校验错误的来源可能是路由/交换处理器(RSP)、另一个VIP,或者是端口适配器安装不当或故障。为了正确了解VIP崩溃,诊断崩溃的根源非常重要。
了解奇偶校验错误的数据可由VIP和Cisco 7500系列路由器上的多个奇偶校验设备报告,以执行任何单次读或写操作。例如,如果VIP将RSP上传输队列上的数据包读入其自己的SRAM,并且RSP的SRAM中存在奇偶校验错误,则您会看到来自RSP上的MD ASIC、VIP上的CYA ASIC以及VIP上的PCI/数据包内存ASIC的错误消息。
此图显示VIP崩溃的故障树分析:
VIP4-50、VIP4-80和VIP6-80使用CPU内存和数据包内存的单位纠错和双位错误检测错误代码纠错(ECC)。两个都是同步动态RAM(SDRAM)。纠正了SDRAM中的单位错误,系统继续正常运行。
此表中数字2或3的多位奇偶校验错误是导致ECC多位错误的致命事件。系统中的CPU内部缓存和总线使用单位奇偶校验检测。如图所示,VIP4和VIP6的体系结构与VIP2不同。因此,某些错误消息不可见,其他错误消息的报告方式也与VIP2不同。在此奇偶校验错误部分中,VIP2、VIP4和VIP6之间的区别被表示和解释。
当在CPU或主数据缓存中发现奇偶校验错误时,会发生缓存奇偶校验错误异常。奇偶校验错误可能发生在VIP DRAM、DRAM控制器、主缓存或CPU本身。在此位置发现的奇偶校验错误也称为处理器内存奇偶校验错误(PMPE)。 这些错误会立即导致VIP崩溃,VIP和RSP的输出类似。sig值为20(sig=20)表示发生缓存奇偶校验错误异常。特征值显示在崩溃的系统日志消息中。
最近的代码还提供了有意义的详细行,如下所示:
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
VIP crashinfo文件中包含的信息也指向主数据缓存中相同的奇偶校验错误位置:
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
主缓存或PMPE可能是暂时性错误。如果这是PMPE的第一个实例,通常可以安全地忽略它。但是,如果同一VIP经历第二次或后续PMPE,您应更换VIP。有时更换DRAM本身也可以解决问题。
VIP4和VIP6注意 — 在CPU内部缓存和CyAsic中发生的奇偶校验错误被检测为缓存奇偶校验错误异常。纠正CPU内存中的单位奇偶校验错误,无需采取任何操作。CPU存储器中的多位奇偶校验错误被检测为procmem ecc多位奇偶校验错误。如果报告了procmem ecc多位奇偶校验错误,应更换VIP中的CPU内存。
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
当VIP从RSP中的MEMD下载并出现这些错误时,这通常表示另一个VIP已写入与MEMD的奇偶校验错误,或MEMD已损坏。如果源来自MEMD,并且该源仍然存在,则需要更换RSP。相反,如果错误奇偶校验的源是另一个VIP,则您应重新拔插,如有必要,请更换写入错误奇偶校验的VIP。
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
注意:VIP4和VIP6显示有关CyBus奇偶校验错误的相同错误消息,但不显示数据包总线写奇偶校验错误消息。
DRAM控制器奇偶校验错误和输入/输出(I/O)控制器奇偶校验错误都由RENO ASIC检测。在DRAM或DRAM控制器中产生的奇偶校验错误报告为高速缓存奇偶校验异常。报告I/O控制器检测到的奇偶校验错误,如此输出所示。通常,I/O控制器报告的奇偶校验错误源自其他位置,除来自其他位置的消息外,I/O控制器还报告这些错误。
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
注意:VIP4和VIP6不显示此错误消息。
PMA ASIC在VIP上从数据包内存(SRAM)读取奇偶校验错误时报告数据包内存读取奇偶校验错误。系统日志中报告此错误,如下所示:
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
在VIP crashinfo文件中,您还可以看到数据包内存读取奇偶校验错误的证据:
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
SRAM奇偶校验错误也可能是瞬时的,因此将第一次出现的错误与DRAM奇偶校验错误一样处理。如果错误仍然存在,请更换SRAM或VIP。
VIP4和VIP6注意 — 数据包内存中的单位奇偶校验错误已纠正。检测分组存储器中的多位奇偶校验错误作为pakmem ecc多位奇偶校验错误。如果报告了pakmem ecc多位奇偶校验错误,应更换VIP数据包内存。
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
PMA ASIC在奇偶校验错误写入数据包存储器时报告数据包总线写入奇偶校验错误。在本例中,VIP仅是信使,此VIP的内存不存在问题。
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
注意:VIP4和VIP6不显示此错误消息。
可在PCI总线1和2中检测奇偶校验错误,两者都直接与端口适配器接口。这些总线由第三PCI总线(总线0)桥接在一起,在该总线上还可以检测奇偶校验错误。源自任何PCI总线的奇偶校验错误通常是由端口适配器安装不当或故障引起的。在VIP崩溃的系统日志输出中看到这些消息时,需要重新拔插端口适配器以解决此问题。
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
如果重新拔插端口适配器无法解决问题,则问题出在端口适配器或VIP。将端口适配器移到另一个托架,并将第二个端口适配器插入原始托架中以排除故障。这通常指向违规硬件。示例如下所示:
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
注意:VIP4和VIP6出现相同错误,但错误消息不同。它被检测为PCI主奇偶校验错误和PCI从奇偶校验错误。执行与VIP PCI总线奇偶校验错误概述的步骤相同的步骤以解决此问题。
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
VIP也可以在CyBus上读或写操作的数据或地址中检测奇偶校验错误。如果发生这种情况,您会看到类似以下的系统日志输出:
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
将此信息与系统日志中的信息结合使用,以确定错误的真正来源。
注意:VIP4和VIP6显示的错误消息与CyBus奇偶校验错误相同。
当VIP尝试写入MEMD中的无效地址时,RSP会在CyBus上为该插槽放置NACK。这通常是软件问题,但也可能是硬件问题。例如,在此输出中,VIP将4个字节写入无效地址,因此RSP在CyBus上为该插槽放置NACK。
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
但是,如此输出所示,RSP还在VIP上放置NACK,以尝试向MEMD写入错误奇偶校验。
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
如此输出所示,当所有插槽上都显示NACK时,这是硬件错误。仲裁器故障,必须更换卡盒。
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
VIP崩溃并非由本文档中的任何原因引起的,最常见的原因是其他软件问题。这些崩溃可以通过多种不同的方式表现。以下是降低因软件问题导致的VIP崩溃风险的一般建议,并在发生这些问题时加以处理:
始终确保Cisco IOS软件映像支持VIP。
请始终将RSP-BOOT映像和主Cisco IOS软件映像保持在同一版本。
确保当前版本的Cisco IOS软件支持VIP配置和端口适配器。
查看版本说明,了解正确的Cisco IOS软件级别和内存要求。
以下是由于软件问题导致VIP崩溃的系统日志输出示例:
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
如果软件出现问题,可能需要获取的最重要信息是VIP的crashinfo文件。有关捕获此信息的说明,请参阅“获取VIP Crashinfo文件”部分。
VIP多次崩溃,当您查看崩溃信息文件时,您可能会看到以下消息:
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
CPU信号10错误消息表示总线异常错误。总线错误可能是软件或硬件问题。此问题的解决方法是重新拔插模块并监控路由器。如果在重新拔插模块后模块继续崩溃,请使用崩溃信息文件与TAC Case Open(TAC案例打开工具)(仅限注册客户)联系。
最好在您提交案例之前使用此信息创建VIP崩溃摘要文件。在TAC Case Open工具的Problem Description(问题描述)字段中包含此信息(仅限注册客户)。
问题说明
show version命令的输出
show diag slot [x]命令的输出
Crashinfo文件摘录
系统日志摘要
然后,收集“Information to Collect if You Open a TAC Case”(如果您提交TAC案例要收集的信息)。
以下是崩溃摘要文件的示例:
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
如果在执行本文档中的故障排除步骤后仍需要帮助,并且希望向思科技术支持部门提交报告,请确保包括以下信息: |
---|
注意:如果可能,在收集此信息之前,请勿手动重新加载或重新通电路由器,因为这可能导致确定问题根本原因所需的重要信息丢失。 |
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
02-Oct-2006 |
初始版本 |