简介
本文档介绍如何修复SMAUG — 现场可编程设备(FPD)“NOT READY”(未就绪)以及需要收集用于根本原因分析(RCA)的日志。
排除NCS4K中的“SMAUG FPD NOT READY”故障
平台:NCS4K
卡:400G线卡 — NCS4K-4H-OPW-QC2
可能触发器:FPD升级和卡重新加载、RP重新加载或切换
问题描述如下:
描述了有问题的状态
要收集的日志:
- 从XR:
show tech-support stat
和show tech-support slice-manager
- 从管理员:
show tech-support slice-manager
, show tech-support shelf_mgr
,show tech-support ccc
, show tech-support HBloss
- 从XR:
dumpcore running grima_driver location
- 从活动LC获取grima和dma的跟踪。执行XR提示中的步骤。
#attach location 0/lc0
Fri Jun 7 00:20:00.329 CDT
[xr-vm_node0_LC0_CPU0:~]$ export PS1=#
#lspci -vd:8bec
#grima_ltrace_show -A
#nl_dma_ltrace_show -A
要恢复问题,请执行以下操作:
- 从XR检查进程
grima_driver
和 slice_manager
,然后重新启动它们以获取活动LC位置。
show processes grima_driver location <0/LC0 or 0/LC1 – active LC>
show processes slice_manager location <0/LC0 or 0/LC1 – active LC>
Process restart grima_driver location <active LC>
Process restart slice_manger location <active LC>
这必须在大多数情况下解决此问题。