简介
本文档介绍在设备无法到达时,在GSR12000设备(运行IOS或IOS-XR)的情况下进行故障排除的步骤。
先决条件
要求
思科建议您对GSR12000平台有基本的了解。
使用的组件
本文档仅限于Cisco 12000系列路由器。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
故障排除
LED指示
在进一步恢复/调试节点之前,请记录LED信息(如下表所示)。
插槽无 |
module |
信息 |
LED状态 |
1 |
电源架/电源输入模块 |
电源正常“绿色”=>电源输入模块正常 否则,以下LED之一显示琥珀色“琥珀色” 故障、OC(过电流)、温度(过温) 注意:需要收集机箱中安装的所有PEM的信息 |
PEM1: PEM2: PEM3: PEM4: |
2 |
报警卡 |
LED ENABLED和FAIL 分别设置为LED ENABLED和FAIL ,每个交换矩阵卡(2 CSC + 3 SFC)和警报卡本身设置一个LED ENABLED和FAIL 绿色表示已启用 琥珀色表示插槽出现故障/空 |
报警卡: CSC0: CSC1: SFC0: SFC1: SFC2: |
3 |
鼓风机 |
有两个状态LED“OK(正常)”和“FAIL(失败)” 正常LED指示风扇正常 FAIL LED指示风扇问题 |
顶部: BOT: |
3 |
LC |
Eng3在稳定状态下有LED段“IOX RUN”。 Eng5在启动或IN RESET期间,面板上的LED呈绿色稳定状态或琥珀色 |
插槽0至 插槽 15 |
4 |
RP |
处于稳定状态的主动ACTV RP 处于稳定状态的备用STBY RP 记录控制台以太网LED |
ACTV: STBY: |
面板图片视图
显示不同LED的报警卡面板
显示PEM状态LED的隐私增强型邮件(PEM)面板
基于流程图的路由器调试与恢复
流程图1
确认控制台连接详细信息和终端服务器可访问性已建立。
流程图2
如果控制台访问不可用,请使用此流程图。
流程图3
当控制台访问不可用且LED亮起,但显示不正确状态时,请使用此流程图。
*显示LED
- PRP:RP ACTV、RP STBY
- LC:IOS运行(E3)/绿色LED(E5)
- 报警卡:绿色
- 交换矩阵卡:绿色(报警卡上的LED)
- PEM:绿色LED
- 风扇:绿色LED
- 间歇性检查可访问性:
— 检查是否显示任何卡已更改
命令列表1:当可访问活动RP的控制台时要收集的捕获。
admin show platform
admin show redundancy
admin show environment power-supply
show power-mgr detail
show logging
运行这些命令以检查进程状态、CPU使用率、数据包管理器状态并识别故障进程(如果有)
并收集会话中提供的命令。
show processes blocked
show processes cpu | ex 0%
show packet-memory summary
收集上述确定流程的这些日志集。
show processes <jid>
show processes threadname <jid>
follow jid <> iter <3>
交换矩阵日志
admin show controllers fabricq drop
admin show controllers fabricq errors
admin show controllers fabricq output
admin show controllers fabricq queue
admin show controllers fabricq tofab
admin show controllers fabricq frfab
admin show controllers fabric (3 times)
show controller fia location <all slots> (3 times)
Mbus计数器(捕获2-3次)
admin show mbus can-error location all
admin show mbus counters location all
run mtool discover
PD跟踪
admin show controllers fabric trace
admin show sysldr trace all
show fiad trace
show_psarb_trace (from shell)
如果有时间,您可以收集showtech(大日志)。
admin show tech-support shelf-management file <qualified disk path>
命令列表2:仅可访问备用控制台时收集的日志
注意:仅当活动控制台访问不可用但备用访问可访问时,才收集日志。
步骤:使用此过程访问备用的ksh(shell)并通过mbus连接到主用ksh,并从主用的shell收集日志。
<esc>ksh从备用控制台,然后连接<active nodeid>
了解卡状态、电源状态和控制台日志的基本日志
show_platform –a
envmon_show -m –p
show_logging -A
admin show logging
用于检查交换矩阵驱动程序和QAD是否正常的日志
fabricq_lwm_show_command -v -a
fabricq_lwm_show_command -v -t
fabricq_lwm_show_command -v -f
fabricq_lwm_show_command -v -q
fabricq_lwm_show_command -v -d
fabricq_lwm_show_command -v -r
fabricq_lwm_show_command -v -o
fabricq_lwm_show_command -v -p
fabricq_lwm_show_command -v -c
fabricq_lwm_show_command -v -p
fabricq_lwm_show_command -v -s
qad_show -b -i
检查mbus问题(收集2-3次)
mtool discover
show_mbus can-stats
show_mbus can-error
运行这些命令以检查进程状态、CPU使用率和数据包管理器状态,识别故障进程(如果有),并收集此会话中提供的命令。
show_processes -b
show_proc_cpu -c | grep -v -E 0%
packet_show summary
packet_show corrupt
Collect below set of logs for the above identified process
sysmgr_show -o -p <jid in hex>
show_processes -T -p <jid in hex>
attach_process -j <jid> -i 3
收集PD跟踪
fiad_show_ltrace
show_psarb_trace
sysldr_show_ltrace
IOS命令列表:在控制台可访问时收集的捕获。
Show logging
Show tech
Show gsr
Show monitor event-trace lci
Show monitor event-trace agent-ctrl
Show monitor event-trace board
Show monitor event-trace fab
Show gsr agent-ctrl
show gsr power-mgr details
show env power
show env internal
多次转储这些日志和时间间隔。
Execute-on all show controller fia
Show controller fia
Show controller errors fabric counters
Show controller errors
Show controller xbar
Show controllers sca
Show controllers clock
Show controllers csc-fpga
Show controllers fab-clk
Show mbus counters
Show mbus can