简介
本文档介绍当ASR9K V1 DC电源模块从管理show平台消失时出现的问题的解决方案。Lineage Version 1(V1)直流(DC)电源在丢失两个电源后可能不会显示在资产中。
问题
当您测试直流电源并切断直流电源的电源时,请选中show platform,并且看不到列出的电源。
以下是您在测试时采取的步骤:
1.将直流电源连接至顶部电源托盘/模块和底部电源托盘/模块,并且电源已打开。
2.模拟全电源故障,并关闭所有直流电源输入至电源托盘/模块。
3.仅将直流输入恢复到顶部托盘/模块。
4.等待设备启动(仍然关闭底部托盘/模块的电源)。
5.将直流电输入恢复到底部托盘/模块。
恢复底部托盘的直流电源输入后,您将在admin show inventory power-supply和admin show platform中看到电源模块。然而事实并非如此。
说明:
如果没有连接直流电源输入,线路电源将产生集成电路(I2C)错误。这意味着您可以在通电时检测它们的存在(这通过单独的连接而不是I2C来完成),而您不会检测到它们的存在。 在admin show platform中看不到当前电源模块,因为底部托盘无法与其通信以发现其状态。
电源管理器代码会将它们标记为发生故障,因为电源生成的错误计数很高。回收方法是电源的OIR。
CSCun46616:电源模块I2C故障处理(主要是V1)的描述部分提供了详细说明。
此处复制此内容:
未通电的V1模块需要两个电压来检测其自身地址。这些电压是5V和8V。9010的两个托盘之间共享5V,但8V不共享。这意味着,如果模块插入托盘的未通电插槽(该插槽尚未通电模块),则该模块无法检测到正确的地址。
要解决此问题,需要更改电源模块驱动程序代码,以便它不会持续尝试对出现故障的模块进行I2C访问,这可能是由于对无法通过I2C访问的模块重复的(停滞的)I2C警报导致的。这些重复的I2C尝试会导致电源模块驱动程序初始化延迟,如果机架管理器没有及时收到电源模块驱动程序的机箱电源分配,可能会阻止LC被机架管理器启动。
这就是这次的情形。机架底部的所有电源都没有直流输入,因此托盘没有8V电源,因此托盘底部的所有模块开始产生I2C错误。电源管理器将所有这些模块标记为发生故障,在更换这些模块之前(即OIR),不会尝试恢复它们。
解决方案
当您按以下顺序重新启动两个进程时,可以恢复系统:
process restart pwrmon
process restart shelfmgr