本文档介绍Cisco Nexus 7000 6.0KW交流电源模块故障警报的可能原因和建议的纠正措施。
Cisco 建议您具有以下主题的基础知识:
本文档中的信息基于以下软件和硬件版本:
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
N7K电源模块可能因多种不同原因被列为故障,每种原因对提供给机箱的电源有各种影响。
电源模块故障可在许多位置报告为故障,例如:
Nexus7000# show environment power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 350 W 6000 W Ok
2 N7K-AC-6.0KW 470 W 6000 W Fail/Shut
3 N7K-AC-6.0KW 313 W 6000 W Ok
<snip>
2013 Dec 1 22:29:20.814 Nexus7000 PLATFORM-2-PS_FAIL Power supply 2
failed or shut down (Serial number AZS1000000W)
当N7K电源模块出现故障时,故障原因会保存在电源设备(PSU)的板载8位寄存器中。 要查看这些寄存器,请在CLI中输入show environment power detail命令,并在输出中查找Hardware alam_bits行:
Nexus7000# show environment power detail
<snip>
Power Usage Summary:
--------------------
Power Supply redundancy mode (configured) PS-Redundant
Power Supply redundancy mode (operational) PS-Redundant
Total Power Capacity (based on configured mode) 12000 W
Total Power of all Inputs (cumulative) 18000 W
Total Power Output (actual draw) 3060 W
Total Power Allocated (budget) 5593 W
Total Power Available for additional modules 6407 W
Power Usage details:
--------------------
Power reserved for Supervisor(s): 420 W
Power reserved for Fabric Module(s): 500 W
Power reserved for Fan Module(s): 1273 W
Total power reserved for Sups,Fabrics,Fans: 2193 W
Are all inlet chords connected: Yes
Power supply details:
---------------------
PS_1 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
PS_2 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0: 2, reg1: 0, reg2:80, reg3: 10
Reg0 bit1: restarted successfully
PS_3 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
在本例中,您可以看到电源2(PS_2)具有:
要确定在8位寄存器中设置的位,必须将十六进制(HEX)值转换为8位二进制值。示例如下:
注册 | 十六进制值 | 二进制值 | 位集(基于0) |
---|---|---|---|
reg0 | 2 | 0000 0010 | 1 |
reg2 | 80 | 1000 0000 | 7 |
reg3 | 10 | 0001 0000 | 4 |
根据本节中提供的表,匹配寄存器号和位集,以查找故障原因和建议的纠正措施。
位 | 默认值 | 位名 | 注释 | 建议操作 |
---|---|---|---|---|
7
|
0
|
PEC错误 | 如果在SMBus写入周期中检测到PEC错误,则锁存到1(管理引擎检查读取周期PEC)。 | 重置并监控重现情况。查找SMBus上其他设备的PEC错误实例。 |
6
|
0
|
访问无效 | 如果只读或未使用的寄存器或位置被写入或未使用的位置被读取,则锁存到1。 | 重置并监控重现情况。查找SMBus上其他设备的错误实例。 |
5
|
0
|
数据超出范围 | 如果尝试将控制寄存器更改为无效值,则锁存到1。 | 重置并监控重现情况。查找SMBus上其他设备的错误实例。 |
4
|
0
|
交流损耗2 | AC线路2为<规格允许。锁定 | 检查交流输入。 |
3
|
0
|
AC 1损耗 | AC线路1为<规格允许。锁定 | 检查交流输入。 |
2
|
0
|
已关闭 | 锁存到1(如果电源关闭)。 | 检查PSU交换机。 |
1
|
0
|
已成功启动 | 如果导致关闭的事件已恢复,则电源模块可以从关闭状态重新启动。一旦电源模块成功启动,请将此位设置为1。系统软件可以通过将1写入此位来清除它。此标志向控制器提供已发生已解决事件的信息。此信息非常有用,因为重新启动会清除所有状态和警报标志,并且从电源发出的中断可能仍未完成,控制器仍可以提供服务。 | 仅供参考。不需要采取任何操作。 |
0
|
0
|
启用PIN HI | 电源关闭,因为硬件启用信号为HI。 | PSU在内部接地,如果PSU开关关闭,则预期接地。如果PSU开关打开,请切换开关。更换PSU。 |
位 | 默认值 | 位名 | 注释 | 建议操作 |
---|---|---|---|---|
7
|
0
|
内部故障 | 内部诊断失败。 | 仅可能出现表面问题(请参阅Cisco Bug ID CSCty78612)。 重置PSU。更换PSU。 |
6
|
0
|
已重新通电 | 如果在以下情况下发生受控关闭,则锁定为1: 1)已设置40位5的电源循环位寄存器 |
仅供参考。不需要采取任何操作。 |
5
|
0
|
50V 2过流关闭 | 由于50V输出2超出额定电流,因此电源已关闭。 | 检查交流输入。重置PSU。 |
4
|
0
|
50V 1过电流关闭 | 由于50V输出1超出额定电流,因此电源已关闭。 | 检查交流输入。重置PSU。 |
3
|
0
|
3.4V过流关闭 | 由于3.4V输出超过额定电流,电源已关闭。 | 检查交流输入。重置PSU。 |
2
|
0
|
50V 2过压关闭 | 由于50V输出2超过额定电压,电源已关闭。 | 检查交流输入。重置PSU。 |
1
|
0
|
50V 1过压关闭 | 由于50V输出1超过额定电压,电源已关闭。 | 检查交流输入。重置PSU。 |
0
|
0
|
3.4V过压关闭 | 由于3.4V输出超过额定电压,电源已关闭。 | 检查交流输入。重置PSU。 |
位 | 默认值 | 位名 | 注释 | 建议操作 |
---|---|---|---|---|
7
|
0
|
风扇故障 | 如果风扇速度降至正常工作速度的70%以下,则闩锁1。电源模块不会因风扇故障而关闭。 | 检查风扇是否有障碍物。更换PSU。 |
6
|
0
|
热传感器故障 | 其中一个热传感器发生故障。 | 更换PSU。 |
5
|
0
|
温度提升2shutdown | 由于Boost 2过温情况,电源已关闭。 | 检查环境。 |
4
|
0
|
温度提升1shutdown | 由于升温1过温,电源已关闭。 | 检查环境。 |
3
|
0
|
50V2温度shutdown | 由于50V输出2过温,电源已关闭。 | 检查环境。 |
2
|
0
|
50V 1,温度超过shutdown | 电源因50V输出1过温而关闭。 | 检查环境。 |
1
|
0
|
温度3.4Vshutdown | 电源因3.4V输出超温而关闭。 | 检查环境。 |
0
|
0
|
超温警告 | 在热关闭事件之前发出5秒。 | 检查环境。 |
位 | 默认值 | 位名 | 注释 | 建议操作 |
---|---|---|---|---|
7
|
0
|
强制关闭 | 如果电源通过电源旋钮键关闭,则此位将位于逻辑1;否则,逻辑0。 | 仅供参考。不需要采取任何操作。 |
6
|
0
|
未使用 | ||
5
|
0
|
未使用 | ||
4
|
0
|
输入模式更改 | 如果AC1或AC2的输入模式更改,此位将设置为1。 | 仅供参考。不需要采取任何操作。 |
3
|
0
|
当前共享故障 | 如果两个模块无法当前共享,则此位设置为1。 | 重置PSU。更换PSU。 |
2
|
0
|
电压下50V模块2 | 模块2的50V输出低于额定电压。仅在AC2打开时发出警报。 | 更换PSU。 |
1
|
0
|
50V模块1在电压下 | 模块1的50V输出低于额定电压。仅在AC1打开时发出警报。 | 更换PSU。 |
0
|
0
|
电压下3.4V | 3.4V的输出低于额定电压。 | 更换PSU。 |
通过本文档中使用的示例中介绍的信息,您可以看到电源风扇未通过寄存器2的第7位设置。风扇已检查是否有障碍物(如表中建议的),但未找到。然后,PSU通过退货授权(RMA)更换。
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
21-May-2015 |
初始版本 |