在极少数情况下,PA-A3 ATM端口适配器上的主处理器可能会崩溃,并将输出类似于以下内容的“crashdump”打印到控制台:
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: %ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC %ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010 %ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000 %ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 %ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 %ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530 %ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968 %ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540 %ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000 %ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4 %ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4 %ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440 %ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000 %ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000 %ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000 %ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000
本文档说明如何排除PA-A3上的分段和重组(SAR)崩溃故障。
本文档没有任何特定的要求。
本文档不限于特定的软件和硬件版本。
有关文件规则的更多信息请参见“ Cisco技术提示规则”。
PA-A3使用LSI ATMizer II芯片来提供SAR和其他关键功能。SAR的名称显示在show controllers atm命令的输出中。
router# show controller atm 3/0 Interface ATM3/0 is up Hardware is ENHANCED ATM PA - DS3 (45Mbps) Lane client mac address is 0030.7b1e.9054 Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 !--- Output suppressed.
ATMizer微码(固件)是提供SAR特定软件指令的映像。Cisco 7500平台上的通用接口处理器(VIP)IOS®和7200平台上的系统IOS包含SAR固件,在重置后下载到SAR。根据用于显示ATM接口当前加载和运行的微码版本的平台,使用以下命令:
7200系列 — show controller atm(请参阅上面的输出示例)
7500系列 — show controller vip slot# tech
PA-A3使用两个SAR来提供处理和传输高速OC-3和OC-12链路所需的处理能力。
注意:单个SAR足以支持DS-3/E-3,但PA-A3-T3也使用两个SAR来保证一致性。
SAR崩溃转储指示哪个SAR遇到问题。
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: SAR0 = receive SAR1 = transmit
7xxx路由器系列支持PA-A3。7200和7500路由器使用外围组件互连(PCI)总线作为端口适配器和“主机”内存之间的数据路径。主机内存是VIP上的本地SRAM或7200网络处理引擎(NPE)上的SRAM。
下图说明VIP2的架构和PCI总线的位置:
SAR提供到PCI总线的连接,以便传输到数据包存储器。它还为ATM信元处理和外部线路的PHY或物理接口提供SAR功能。
根据SAR崩溃的原因,可以将SAR崩溃分为几类。一旦发现不可恢复的错误,SAR就会崩溃。这些错误可能是软件或硬件的结果。要确定原因,请查阅在crashdump输出第二行中显示的原因寄存器。异常代码以原因寄存器值的二到六位记录。从最右侧的位开始,位为零。例如:
%ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68
将十六进制值0x00004018转换为二进制。请注意,每个十六进制值代表四位。本例中的二进制等价值是4 = 0100,0 = 0000,1 =0001,8 = 10000,然后0x00004018 = 0100 0000 0001 1000。
通过从右到左计数来查找2到6位。在本例中,位2到6等于00110
将这五个位转换回十六进制。在本例中,00110转换为0x06。
请查阅例外代码表。在本例中,SAR因辅助总线错误异常而崩溃。
异常代码 | 描述 | 可能原因 |
0x00 | 中断 | 断开条件。 |
0x01 | TLB修改异常 | |
0x02 | TLB异常(加载/获取) | |
0x03 | TLB异常(存储) | |
0x04 | 地址错误(加载/获取) | 未对齐地址(软件)。 |
0x05 | 地址错误(存储) | 未对齐地址(软件)。 |
0x06 | 总线错误 | 总线超时、奇偶校验错误等(硬件)。 |
0x07 | 预留 | |
0x08 | Syscall | 尝试执行SYSCALL指令。 |
0x09 | 断点 | 尝试执行BREAK指令。 |
0x0a | 保留指令 | 尝试执行无效指令。 |
0x0b | 协处理器不可用 | 尝试在不可用的协处理器上执行。 |
0x0c | 算术溢出 | |
0x0d | 陷阱 | |
0x0e | 预留 | |
0x0f | 浮点 | 尝试访问非现有FPU。 |
0x10-1f | 预留 |
当任何值原因寄存器的位15设置为1时,SAR崩溃的原因是硬件导致的PCI中止或奇偶校验错误。具体而言,原因寄存器在crashdump中显示为:
cause 0x00008000
通过更换ATM端口适配器排除此原因值故障。如果问题仍然存在,请更换通用接口处理器(VIP)(如果使用7500系列路由器),或者更换网络处理引擎(NPE)/网络服务引擎(NSE)(如果使用7200或7400系列路由器)。
Cisco Bug ID CSCdr09895(仅限注册用户)可防止重复的崩溃转储打印到控制台,因为只有第一个崩溃转储与故障排除相关。以下Bug ID可解决导致SAR崩溃的罕见情况。请使用Bug工具包(仅注册客户)确定您的Cisco IOS软件版本是否受这些Bug ID影响。
Cisco Bug ID | 解释 |
CSCdp62791 | 通过不在未配置的VC上向SAR发送数据包或使用无效封装将数据包发送到SAR来防止SAR1崩溃。 注意:尽管CSCdp01166报告了不同的症状,但它会对CSCdp62791进行复制并通过CSCdp进行修复。 |
CSCdp42529 | 防止在发射SAR上不存在的VPI/VCI对上接收信元导致SAR1崩溃。当创建或关闭大量SVC时,可能会出现此问题,因此,传输SAR会忽略来自VIP或NPE上主机CPU的命令中断。发生这种情况时,仅在接收SAR上定义VC,如果在未定义的VPI/VCI对上接收OAM环回或资源管理单元,则发送SAR崩溃。 |
CSCdr09895 | 防止在中转流量较大时,当SAR尝试访问辅助内存中的非法地址时发生SAR0崩溃,在辅助内存中存储等待分段和重组的数据包。此情况称为总线错误。 |
CSCdp64588 | 防止因重复SAR(0或1)崩溃而导致路由器崩溃。当SAR崩溃时,PCI主机驱动程序(提供路由器中PA-A3和PCI总线之间的接口)尝试再次启动PA。如果SAR重复崩溃,并且PA不响应主机驱动程序,则主机驱动程序会尝试关闭(关闭)PA,并关闭PA。在某些情况下,如果SAR崩溃,且主机驱动程序已清除与此PA相关的内存,则路由器会因总线错误而崩溃。 |
以下要点总结了如何排除PA-A3 ATM端口适配器上的SAR崩溃故障:
确定SAR0(接收SAR)还是SAR1(发送SAR)崩溃。崩溃转储的第一行会告诉您。
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump
使用异常代码表解码crashdump输出中的原因寄存器值。
如果原因寄存器是位15设置为1的值,请更换硬件。
如果原因寄存器有其它值,请收集思科技术支持的以下信息:
crashdump输出
show controller atm(7200系列)
show controller vip slot# tech(7500系列)
show tech-support
可以重点考虑安装您目前正在运行的Cisco IOS软件系列最新的维护版本。
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
10-Sep-2018 |
初始版本 |