此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档介绍Cisco IOS® XR中的“SW_INACTIVE”及其故障排除方法。
本文档没有任何特定的要求。
本文档不限于特定硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
Cisco IOS XR平台的线卡和路由器交换机处理器/路由器处理器(RSP/RP)中的“SW_INACTIVE”状态,例如,下一个输出显示错误。
RP/0/RSP0/CPU0:XR#admin show platform
Location Card Type HW State SW State Config State
----------------------------------------------------------------------------
0/1 A9K-MOD400-TR OPERATIONAL OPERATIONAL NSHUT
0/0 A9K-MOD400-TR OPERATIONAL SW_INACTIVE NSHUT >>>
0/RSP0 A9K-RSP880-SE OPERATIONAL OPERATIONAL NSHUT
0/RSP1 A9K-RSP880-SE OPERATIONAL OPERATIONAL NSHUT
0/FT0 ASR-9010-FAN-V2 OPERATIONAL N/A NSHUT
0/FT1 ASR-9010-FAN-V2 OPERATIONAL N/A NSHUT
0/PT0 A9K-DC-PEM-V3 OPERATIONAL N/A NSHUT
0/PT1 A9K-DC-PEM-V3 OPERATIONAL N/A NSHUT
在思科IOS XR平台中,64位(也称为eXR),下一组状态组成有限状态机(FSM),以便引导线卡/RSP/RP。
上述FSM适用于高于7.1.1的版本和其他NCS5500的版本。
接下来是这些状态:
“SW_INACTIVE”(软件非活动)状态表示软件未准备好在设备上运行。节点没有足够的信息继续下一状态,正在向活动RSP/RP请求信息以烘焙映像。
换句话说,“SW_INACTIVE”是节点(线路卡/RSP/RP)与活动(主)节点同步的状态。
为什么线卡需要与活动节点同步?
下一个输出显示线路卡下载的某些文件,以启动FSM并引导至IOS_XR_RUN状态。
主要文件包括:
注意:线卡和备用路由处理器使用相同的进程检查ISO和启动所需的所有信息。外围组件快速互联(PCIE)协议专为处理非核心组件的点对点连接而构建。IOFPGA和MIFPGA是首批FPGA中能够启动通讯并为线卡建立控制路径的一种。这些FPGA主要用于PCIE通信。
要归档上述客户端-服务器模型,Cisco IOS XR需要:
0/RSP1/ADMIN0:canbus_driver[3903]: %PLATFORM-CANB_SERVER-7-CBC_POST_RESET_NOTIFICATION : Node 0/1 CBC-0, reset reason CPU_RESET_POR (0x05000000)
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_POWERED_OFF, event_reason_str 'HW Event Powered OFF' for card 0/1
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_POWERED_ON, event_reason_str 'HW Event Powered ON' for card 0/1
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_OK, event_reason_str 'HW Event OK' for card 0/1
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-CARD_HW_OPERATIONAL : Card: 0/1 hardware state going to Operational
0/RSP1/ADMIN0:canbus_driver[3903]: %PLATFORM-CANB_SERVER-7-CBC_PRE_RESET_NOTIFICATION : Node 0/1 CBC-0, reset reason CPU_RESET_POR (0x05000000)
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_RESET, event_reason_str 'HW Event RESET' for card 0/1
0/RSP1/ADMIN0:canbus_driver[3903]: %PLATFORM-CANB_SERVER-7-CBC_POST_RESET_NOTIFICATION : Node 0/1 CBC-0, reset reason CPU_RESET_POR (0x05000000)
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_POWERED_OFF, event_reason_str 'HW Event Powered OFF' for card 0/1
0/RSP0/ADMIN0:shelf_mgr[3945]: %INFRA-SHELF_MGR-6-HW_EVENT : Rcvd HW event HW_EVENT_POWERED_ON, event_reason_str 'HW Event Powered ON' for card 0/1
注意:此状态并不表示线路卡存在硬件故障。请注意,“HW_EVENT_OK”表示线路卡硬件运行正常,FPGA和所有PCIE均未显示问题。
警告:中断引导进程会生成引导进程以重新启动,模块需要一段时间才能完成。请注意CLI中显示的日志。如果日志未显示任何错误,则让线卡/模块继续此过程。
如果路由器在启动过程中检测到错误,它会自动执行恢复操作。
2. 如果线卡显示此日志,请勿将其从机箱中移除。线路卡正在下载过程中,需要完成。
0/0/ADMIN0: inst_agent[3930]: %INFRA-INSTAGENT-4-XR_PART_PREP_REQ : Received SDR/XR partition request. Looking for available matching partition. If not found, new one will be created after copying relevant image and RPMs
0/0/ADMIN0: fpd_agent[3927]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Golden FPGA is unprotected :DECLARE :0/0: FPD IPU-FP
Golden FPGA is below minimum version, Perform force fpd upgrade for IPU-FPGA
0/0/ADMIN0: fpd_agent[3927]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Golden FPGA is unprotected :DECLARE :0/0: FPD IPU-FS
Golden FPGA is below minimum version, Perform force fpd upgrade for IPU-FSBL
0/0/ADMIN0: fpd_agent[3927]: %PKT_INFRA-FM-3-FAULT_MAJOR : ALARM_MAJOR :Golden FPGA is unprotected :DECLARE :0/0: F
IPU-Linux Golden FPGA is below minimum version, Perform force fpd upgrade for IPU-Linux
0/0/ADMIN0: inst_agent[3930]: %INFRA-INSTAGENT-4-XR_PART_PREP_IMG : SDR/XR image baking in progress
注意:完成此操作后,FPD将升级,并且线路卡必须正常启动。如果发现问题,请检查Action Items and Information(操作项目和信息)以通过TAC打开案例。
3. 如果最近插入的板卡中没有日志,请转至“要收集的信息”部分。
对于“SW_INACTIVE”,重点关注XR虚拟机和管理虚拟机。
其次,在发出show platform命令时:
此示例显示两个show platform命令的输出:
RP/0/RSP0/CPU0:XR# show platform
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0 A9K-RSP5-SE SW_INACTIVE NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-24X10GE-1G-SE IOS XR RUN NSHUT
0/1/CPU0 A9K-24X10GE-1G-SE IOS XR RUN NSHUT
0/2 A9K-20HG-FLEX-SE SW_INACTIVE NSHUT
0/3 A9K-20HG-FLEX-SE SW_INACTIVE NSHUT
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:XR# admin show platform
Location Card Type HW State SW State Config State
----------------------------------------------------------------------------
0/0 A9K-24X10GE-1G-SE OPERATIONAL OPERATIONAL NSHUT
0/1 A9K-24X10GE-1G-SE OPERATIONAL OPERATIONAL NSHUT
0/2 A9K-20HG-FLEX-SE OPERATIONAL OPERATIONAL NSHUT
0/3 A9K-20HG-FLEX-SE OPERATIONAL OPERATIONAL NSHUT
0/RSP0 A9K-RSP5-SE OPERATIONAL OPERATIONAL NSHUT
0/RSP1 A9K-RSP5-SE OPERATIONAL OPERATIONAL NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL N/A NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL N/A NSHUT
0/PT0 A9K-DC-PEM-V2 OPERATIONAL N/A NSHUT
注意:图中所示的输出显示的是来自其他路由器的信息,而不是其他show命令使用的路由器信息。
此示例显示两个show platform命令的输出:
RP/0/RSP0/CPU0:XR# show platform
Node Type State Config state
--------------------------------------------------------------------------------
0/RSP0 A9K-RSP5-SE IOS XR RUN NSHUT
0/RSP1/CPU0 A9K-RSP5-SE(Active) IOS XR RUN NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL NSHUT
0/0/CPU0 A9K-24X10GE-1G-SE IOS XR RUN NSHUT
0/1/CPU0 A9K-24X10GE-1G-SE IOS XR RUN NSHUT
0/2 A9K-20HG-FLEX-SE IOS XR RUN NSHUT
0/3 A9K-20HG-FLEX-SE IOS XR RUN NSHUT
0/PT0 A9K-DC-PEM-V2 OPERATIONAL NSHUT
RP/0/RSP0/CPU0:XR# admin show platform
Location Card Type HW State SW State Config State
----------------------------------------------------------------------------
0/0 A9K-24X10GE-1G-SE OPERATIONAL SW_INACTIVE NSHUT
0/1 A9K-24X10GE-1G-SE OPERATIONAL OPERATIONAL NSHUT
0/2 A9K-20HG-FLEX-SE OPERATIONAL OPERATIONAL NSHUT
0/3 A9K-20HG-FLEX-SE OPERATIONAL OPERATIONAL NSHUT
0/RSP0 A9K-RSP5-SE OPERATIONAL OPERATIONAL NSHUT
0/RSP1 A9K-RSP5-SE OPERATIONAL OPERATIONAL NSHUT
0/FT0 ASR-9006-FAN-V2 OPERATIONAL N/A NSHUT
0/FT1 ASR-9006-FAN-V2 OPERATIONAL N/A NSHUT
0/PT0 A9K-DC-PEM-V2 OPERATIONAL N/A NSHUT
一旦确定引导环路或线路卡不进入烘焙状态,请检查:
如前所述,线路卡需要下载文件并启动。对此,有2个选项:
第一个选项:连接到线路卡的控制台:
为此,请发出以下命令:
RP/0/RP0/CPU0:XR#admin
sysadmin-vm:0_RP0#run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$ attachCon 0/X --> X is the linecard slot number
示例显示如何连接到线路卡0/0/CPU0:
RP/0/RP0/CPU0:XR#admin
sysadmin-vm:0_RP0# run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$ attachCon 0/0
===============================================
==== Connecting to Line Card =====
===============================================
Line Card: No 0
Press <Ctrl-W> to disconnect
Enabling 16550 on uart 0 baud rate 115200
host login:
注意:选择enter并插入主机登录信息,这些信息在首次调配路由器时使用。
第二个选项:检查管理VM中的PCIE日志:
在管理问题中:
sysadmin-vm:0_RSP0# run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$ ls /misc/scratch/pcie/loggerd/
此命令显示插入机箱中的线卡。
示例显示仅插入一个线卡的机箱中的命令:
[sysadmin-vm:0_RSP0:~]$ ls /misc/scratch/pcie/loggerd
LC0
一旦确定并在输出中显示“SW_INACTIVE”线路卡,则继续发出下一个命令:
[sysadmin-vm:0_RSP0:/]$ ls /misc/scratch/pcie/loggerd/LC0
注意:发出命令时,请考虑它显示不同的线卡。在这种情况下,请使用相关的线路卡发出命令。在本例中为LC0。
命令显示线卡中的文件。记下任何带pslot的文件。
警告:发出命令时,请考虑用户可能失去CLI访问权限。如果CLI被冻结,请选择Ctrl-W。
线卡0/0/CPU0中的插槽的输出示例:
[sysadmin-vm:0_RSP0:~]$ ls /misc/scratch/pcie/loggerd/LC0
[sysadmin-vm:0_RSP0:~]$ ls /misc/scratch/pcie/loggerd/LC0
first last pslot_2_uart_0_w0
[sysadmin-vm:0_RSP0:~]$ ls /misc/scratch/pcie/loggerd/LC0/pslot_2_uart_0_w0
选择enter后,将显示以下信息。
===============================================
==== Connecting to Line Card =====
===============================================
Line Card: No 0
Press <Ctrl-W> to disconnect
Enabling 16550 on uart 0 baud rate 115200
TriggerCpRmonInit
ASR9K Init Starting ASR9k initialization ...
Reading both MB and DB cookie
Board Type:0x3d1013
Starlord LC setting i2c block 7
The base address of i2c_mux4to1 is at dc30e000
zl init starlord lc
Initializing Zl clock to 322MHz
Missing Parameter SERVER_URL
##########################################################
System Bootstrap, Version 23.278 [ASR9K x86 ROMMON],
Copyright (c) 1994-2020 by Cisco Systems, Inc.
Compiled on Sat 03/14/2020 14:37:06.76
BOARD_TYPE : 0x3d1013
Rommon : 23.278 (Primary)
IPU FPGA(PL) : 1.10.1 (Primary)
IPU INIT(HW.FPD) : 1.10.1
IPU FSBL(BOOT.BIN) : 1.104.0
IPU LINUX(IMAGE.FPD) : 1.104.0
GAMORA FPGA : 0.36.1
CBC0 : Part 1=55.7, Part 2=55.7, Act Part=1
Product Number : ASR-9901-LC
Slot Number : 2
##########################################################
Got EMT Mode as Disk Boot
<snip>
注意:在某些情况下,如果线路卡处于“SW_INACTIVE”状态,PCIE会显示引导环路。继续记录会话并收集这些输出以进行进一步的故障排除。
发出以下命令:
RP/0/RP0/CPU0:PE2#admin
sysadmin-vm:0_RP0# run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$ls -lah /misc/disk1/tftpboot
下一个输出是此命令的输出:
sysadmin-vm:0_RSP0# run ls -lah /misc/disk1/tftpboot
total 3.2G
drwxrwxrwx. 3 root root 4.0K Jan 31 02:14 .
drwxrwxrwx. 12 root root 4.0K Jan 31 01:49 ..
-rw-r--r--. 1 root root 119M Jan 31 01:46 asr9k-common-7.3.2
-rw-r--r--. 1 root root 120M Dec 18 15:32 asr9k-common-7.5.2
-rw-r--r--. 1 root root 1.4G Jan 31 01:36 asr9k-mini-x64-7.3.2
-rw-r--r--. 1 root root 1.5G Dec 18 15:25 asr9k-mini-x64-7.5.2
drwxr-xr-x. 3 root root 4.0K Mar 16 2022 boot
-rwxr-xr-x. 1 root root 637 Jan 31 01:57 grub.cfg
-rw-r--r--. 1 root root 906K Jan 31 01:48 grub.efi
lrwxrwxrwx. 1 root root 22 Jan 31 01:57 system_image.iso -> ./asr9k-mini-x64-7.3.2
-rwxrwxrwx. 1 root root 1007 Jan 31 01:58 zapdisk.log
从输出中,考虑以下问题:
要检查DHCP配置,请发出以下命令:
RP/0/RP0/CPU0:XR#admin
sysadmin-vm:0_RP0# run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$cat /etc/dhcp/dhcpd.conf
此命令的示例输出:
RP/0/RP0/CPU0:XR#admin
sysadmin-vm:0_RP0# run chvrf 0 bash -l
[sysadmin-vm:0_RSP0:~]$cat /etc/dhcp/dhcpd.conf
ddns-update-style none;
default-lease-time 86400;
max-lease-time 604800;
authoritative;
subnet 192.168.0.0 netmask 255.0.0.0 {
pool {
max-lease-time 600;
range 192.168.0.128 192.168.0.191;
allow unknown-clients;
}
filename "grub.efi";
next-server 192.168.0.1;
option subnet-mask 255.0.0.0;
option broadcast-address 192.168.0.255;
option ip-forwarding off;
}
与之前的情况类似,检查此文件是否显示信息,如果显示,请继续参阅信息以通过TAC建立案例。
如果未看到任何输出,请继续操作。
提示:在某些情况下,根据场景,fpd auto-upgrade enable需要同时配置到管理VM和XR VM。
“我看到/misc/disk1/tftpboot中的文件并且/etc/dhcp/dhcpd.conf显示信息”:在XR虚拟机中添加fpd auto-upgrade(有关更多信息,请单击:系统管理配置指南)
配置完成后,在线插拔(OIR)将插入线卡,并检查此线卡显示的日志。
“I does not see any file in /misc/disk1/tftpboot but/etc/dhcp/dhcpd.conf displayed information”:这可能是活动路由处理器无法共享文件的问题。
sysadmin-vm:0_RSP0# hw-module location <Linecard in SW_INACTIVE state> bootmedia network reload
在本示例中,对线路卡0/0/CPU0发出命令:
sysadmin-vm:0_RSP0# hw-module location 0/0 bootmedia network reload
使用相同的故障排除步骤检查日志。如果日志类似,请继续参阅通过TAC建立案例所需的信息部分:
“I does not see files in misc/disk1/tftpboot nor information is displayed in /etc/dhcp/dhcpd.conf”:此场景需要从TAC进行进一步检查。进入“Information required to open a case with TAC”部分。
提示:打开案例时,请收集所有信息并将其附加到案例(打开时)。这样可避免延误调查
要收集的日志:
在XR VM中:
show logging
路由处理器/线路卡控制台日志;如果备用路由处理器中出现问题,请考虑将控制台电缆连接到此节点,并记录显示的输出。
show hw-module fpd location all
在XR VM中:
show controllers switch statistics location <路由处理器/线路卡>
show controllers switch statistics detail location <active Route Processor> <switch port no>
显示警报
要附加的文件:
在管理虚拟机中:
Show tech-support OS
Show tech-support canbus
Show tech-support control-ethernet
Show tech-support ctrace
注意:Admin show techs:要将admin show tech复制到默认XR_PLANE,请在管理模式下发出下一个命令:copy harddisk:/showtech/ harddisk:/showtech/ location 0/RSP/VM1。如果复制文件时遇到问题,请单击此链接:Show Tech Support files to XR VM。
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
16-Feb-2024 |
初始版本 |