简介
本文档介绍如何分析聚合服务路由器903(ASR903)上常见的硬件故障症状及其故障排除方法。
先决条件
要求
Cisco 建议您具有以下主题的基础知识:
- Cisco IOS-XE软件
- ASR 903 CLI
使用的组件
本文档中的信息是从发现故障症状的特定实验环境中的设备创建的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解任何命令的潜在影响
概述
Cisco ASR 903路由器是功能齐全的聚合平台,旨在经济高效地交付融合移动和业务服务。此紧凑型3机架单元(RU)路由器具有深度浅、功耗低、温度范围宽等特点,可提供高服务规模、完全冗余和灵活的硬件配置。Cisco ASR 903路由器IP无线接入网络(RAN)网络中的预聚合路由器或运营商级以太网网络中的聚合路由器。
该平台包括以下主要现场可更换单元(FRU),如下图所示:
标签 |
组件 |
1 |
接口模块(IM) |
2 |
两个路由交换处理器(RSP)单元插槽。支持RSP1A-55、RSP1B-55、RSP2A-64和RSP2A-128 |
3 |
风扇盘 |
4 |
冗余直流电源 |
在正常操作期间,任何现场可更换单元(FRU)都可能出现故障症状。这通常会导致更换硬件组件,而硬件组件不一定是硬件故障。通过采用某些故障排除技术,您可以从故障状态恢复这些模块,从而减少网络停机时间。
故障排除
DC电源报告的故障(A900-PWR550-D)
- 使用多米仪测量直流PSU(电源单元)连接器的输入直流电压,以验证电源。读数应在24V至60V范围内。
- 如果输入电压读数正常,请检查面板上LED的状态(“输入正常”和“输出失败”)。 如果两个LED都熄灭,请更换DC PSU。
- 如果“Input OK”LED为绿色,但“output Fail”LED为琥珀色/红色,则先卸下输入电源连接器,然后将整个DC PSU插出。等待 15 秒。将直流PSU插回并连接输入电源连接器。本练习需要对两个直流电源箱(如果系统有两个直流电源箱)执行。
- 如果“Input OK”(输入正常)LED为绿色,“output FAIL”(输出失败)LED完全不亮,请更换DC PSU。
注意:路由器可以使用单个电源运行。如果未通电,则需要物理插入辅助电源设备。
风扇托架报告故障
Cisco ASR 903路由器使用与电源分离的模块化风扇托架。风扇托架包含12个风扇,即使风扇出现故障,也能提供足够的容量来维持运行。风扇托架模块有两种类型(A903-FAN和A903-FAN-E),具体取决于使用路由器的环境。后者(A903-FAN-E)配有8毫米风扇灰尘过滤器,防止灰尘进入单元,并避免可能损坏部件。
情形 1:托盘中的单个风扇模块出现故障
使用命令“show platform”或“show facility-alarm status”确定托盘中风扇的状态。在风扇发生故障时,风扇托架状态将显示为“故障”,并显示已发生故障的单台设备的详细信息。
ASR903#
show platform | in FAN|State
Chassis type: ASR-903
Slot Type State Insert time (ago)
P2 A903-FAN-E
f2, f4, f6, fail
05:00:00
[an error occurred while processing this directive]
ASR903#
sh facility-alarm status
System Totals Critical: 1 Major: 3 Minor: 0
Source Severity Description [Index]
Fan Tray CRITICAL Multiple Fan Failures [2]
Fan Tray MAJOR Fan 2 Failure [5]
Fan Tray MAJOR Fan 4 Failure [7]
Fan Tray MAJOR Fan 6 Failure [9]
[an error occurred while processing this directive]
这些输出显示插槽f2、f4和f6中的风扇模块出现故障,需要更换。
方案 2:风扇托架报告为“未知”
在某些情况下,风扇托架在“show platform”输出中可能报告为“Unknown”,而网络管理系统(NMS)站也可能生成警报。
ASR903#
sh platform | in P2
Chassis type: ASR-903
Slot Type State Insert Time (ago)
P2 Unknown N/A never
[an error occurred while processing this directive]
执行以下步骤,帮助恢复模块:
- 对风扇模块进行物理重新拔插。移除或更换风扇托架后,至少需要2分钟,系统才能重新初始化。如果您正在使用带灰尘过滤器的型号“A903-FAN-E”,请尝试清洁过滤器,确保过滤器不会堵塞风扇模块。
- 重新启动路由器并验证是否检测到风扇托架。
- 如果风扇托架仍报告“未知”,则可能需要更换风扇以解决此问题。
注意:在CSCuu75796中记录有已知的外观缺陷,FAN托架将报告为未知。为避免错误的故障消息,在移除或更换风扇托架后,至少需要2分钟时间系统重新初始化。
RSP报告的故障
场景1:RSP报告为未知
ASR903#
show platform | in R1
Chassis type: ASR-903
Slot Type State Insert Time (ago)
R1 A903-RSP1B-55 unknown 1d01h
[an error occurred while processing this directive]
- 执行命令“hw-module slot R1 reload”并验证处理器是否正在初始化。
- 如果备用RSP在“引导”和“未知”状态之间切换,而未转换到“init,standby”状态,则问题主要是本地bootflash中缺少IOS-XE映像。
- 使用带有有效IOS-XE映像的USB闪存驱动器启动RSP。如果模块继续处于“未知”状态,请对模块进行物理重新拔插。
- 如果上述所有步骤都失败,请从RSP模块收集控制台日志并向TAC提交服务请求。
场景2:备用RSP在“引导”和“初始、备用”状态之间切换
备用RSP模块出现此行为的常见原因之一是主用RSP和备用RSP之间的配置同步失败。应执行以下命令来验证这一点:
ASR903#show redundancy config-sync failures bem
ASR903#show redundancy config-sync failures mcl
ASR903#show redundancy config-sync failures prc
[an error occurred while processing this directive]
如果上述任何命令中都报告了故障,请实施以下解决方法并验证RSP是否处于正常运行状态。
ASR903# config terminal
ASR903config)#redundancy
ASR903(config)#mode sso
ASR903(config-red)#no policy config-sync lbl prc reload
ASR903config-red)#no policy config-sync bulk prc reload
ASR903(config-red)#end
[an error occurred while processing this directive]
如果RSP模块继续处于引导环路中,请检查设备日志中是否存在任何链路错误,如下所示。如果是,如果物理重新拔插无法修复RSP模块,则可能需要更换RSP模块。
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive]
接口模块(IM)无法初始化
每当安装模块时,IM都会转换到特定状态(停止服务 — >插入 — >引导 — >确定)。 如果六个可用插槽中的任意一个接口模块(IM)在引导状态后失败,请执行以下步骤:
ASR903#sh platform
Chassis type: ASR-903
Slot Type State Insert Time (ago)
0/4 A900-IMA8S inserted/unkown 00:27:02 (physical)
[an error occurred while processing this directive]
- 使用命令“hw-module subslot <slot/subslot> reload”重新加载受影响的模块。验证模块是否已恢复。
ASR903#hw-module subslot 0/1 reload
Proceed with reload of module? [confirm]
%IOSXE_OIR-6-SOFT_RELOADSPA: SPA(A900-IMA1X) reloaded on subslot 0/1
[an error occurred while processing this directive]
- 将模块重新插入同一插槽。如果模块保持“未知”状态,请尝试将其插入另一个插槽以排除机箱上的线卡插槽故障。
- 观察日志并查看任何内核/链路错误,如下所示:
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive] “链路培训”错误基本上意味着在特定插槽的外围组件互联快速(PCIe)总线上存在通信错误。PCIe热插拔模块托管在RSP引擎上。执行RSP切换,以便模块注册到备用RSP(路由交换处理器)的PCIe总线。 如果模块在切换后恢复,则需要更换之前的活动RSP模块。
ASR903#redundancy force-switchover
Proceed with switchover to standby RP? [confirm]
[an error occurred while processing this directive]
注意:如需进一步帮助,请向思科技术支持中心(TAC)提交服务请求,其中包含故障排除的详细信息以及路由器的“show tech-support”输出。