本文檔介紹Cisco Nexus 7000 6.0KW交流電源模組故障警報的可能原因和建議的糾正措施。
思科建議您瞭解以下主題的基本知識:
本文中的資訊係根據以下軟體和硬體版本:
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路正在作用,請確保您已瞭解任何指令可能造成的影響。
N7K電源模組可能由於多種不同原因列為故障,每種原因都會對提供給機箱的電源產生不同的影響。
電源模組故障可在多個位置報告為故障,例如:
Nexus7000# show environment power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 350 W 6000 W Ok
2 N7K-AC-6.0KW 470 W 6000 W Fail/Shut
3 N7K-AC-6.0KW 313 W 6000 W Ok
<snip>
2013 Dec 1 22:29:20.814 Nexus7000 PLATFORM-2-PS_FAIL Power supply 2
failed or shut down (Serial number AZS1000000W)
當N7K電源模組發生故障時,故障原因儲存在電源單元(PSU)上的板載8位暫存器中。 要檢視這些暫存器,請在CLI中輸入show environment power detail命令,並在輸出中查詢Hardware alam_bits行:
Nexus7000# show environment power detail
<snip>
Power Usage Summary:
--------------------
Power Supply redundancy mode (configured) PS-Redundant
Power Supply redundancy mode (operational) PS-Redundant
Total Power Capacity (based on configured mode) 12000 W
Total Power of all Inputs (cumulative) 18000 W
Total Power Output (actual draw) 3060 W
Total Power Allocated (budget) 5593 W
Total Power Available for additional modules 6407 W
Power Usage details:
--------------------
Power reserved for Supervisor(s): 420 W
Power reserved for Fabric Module(s): 500 W
Power reserved for Fan Module(s): 1273 W
Total power reserved for Sups,Fabrics,Fans: 2193 W
Are all inlet chords connected: Yes
Power supply details:
---------------------
PS_1 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
PS_2 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0: 2, reg1: 0, reg2:80, reg3: 10
Reg0 bit1: restarted successfully
PS_3 total capacity: 6000 W Voltage:50V
chord 1 capacity: 3000 W
chord 1 connected to 220v AC
chord 2 capacity: 3000 W
chord 2 connected to 220v AC
Software-Alarm: No
Hardware alam_bits reg0:1A, reg1: 0, reg2: 0, reg3:10
Reg0 bit1: restarted successfully
Reg0 bit3: loss of line1
Reg0 bit4: loss of line2
Reg3 bit4: reserved
在本例中,您可以看到電源2(PS_2)具有:
為了確定在8位暫存器中設定的位,必須將十六進位制(HEX)值轉換為8位二進位制值。以下是範例:
報名 | 十六進位制值 | 二進位制值 | 位設定(基於0) |
---|---|---|---|
reg0 | 2 | 0000 0010 | 1 |
reg2 | 80 | 1000 0000 | 7 |
reg3 | 10 | 0001 0000 | 4 |
根據本節中提供的表,匹配暫存器編號和位集,以便找出故障原因和建議的糾正措施。
位 | 預設值 | 位名稱 | 意見 | 建議的操作 |
---|---|---|---|---|
7
|
0
|
PEC錯誤 | 如果在SMBus寫入週期上檢測到PEC錯誤,則鎖存為1(Supervisor檢查讀取週期PEC)。 | 重置並監視是否重新發生。查詢SMBus上其他裝置的PEC錯誤例項。 |
6
|
0
|
無效訪問 | 如果只讀或未使用的暫存器或位置被寫入,或者未使用的位置被讀取,則鎖存為1。 | 重置並監視是否重新發生。查詢SMBus上其他裝置的錯誤例項。 |
5
|
0
|
資料超出範圍 | 如果嘗試將控制暫存器更改為無效值,則鎖存為1。 | 重置並監視是否重新發生。查詢SMBus上其他裝置的錯誤例項。 |
4
|
0
|
AC 2丟失 | AC線路2允許<規格。已鎖定 | 檢查交流輸入。 |
3
|
0
|
AC 1丟失 | AC線路1允許<規格。已鎖定 | 檢查交流輸入。 |
2
|
0
|
已關閉 | 如果電源已關閉,則鎖存為1。 | 檢查PSU交換機。 |
1
|
0
|
已成功啟動 | 如果導致關閉的事件已恢復,則電源模組可以從關閉狀態重新啟動。在電源模組成功啟動後,將此位設定為1。系統軟體可以通過向此位寫入1來清除它。此標誌向控制器提供已發生並已解決的事件的資訊。此資訊非常有用,因為重新啟動會清除所有狀態和報警標誌,並且從電源發出的中斷可能仍未結束,控制器仍可繼續運行。 | 僅供參考。不需要執行任何操作。 |
0
|
0
|
啟用pin HI | 電源關閉,因為硬體啟用訊號為HI。 | PSU在內部接地,如果PSU開關關閉,則預期會接地。如果PSU開關開啟,則切換開關。更換PSU。 |
位 | 預設值 | 位名稱 | 意見 | 建議的操作 |
---|---|---|---|---|
7
|
0
|
內部故障 | 內部診斷失敗。 | 僅潛在無關緊要的問題(請參閱Cisco錯誤ID CSCty78612)。 重置PSU。更換PSU。 |
6
|
0
|
已重新通電 | 如果發生以下情況中的受控關閉,則鎖定為1: 1)已設定「電源循環」位暫存器40位5 |
僅供參考。不需要執行任何操作。 |
5
|
0
|
50V 2過電流關機 | 由於50V輸出2超出額定電流,電源已關閉。 | 檢查交流輸入。重置PSU。 |
4
|
0
|
50V 1過電流關機 | 由於50V輸出1超出額定電流,電源已關閉。 | 檢查交流輸入。重置PSU。 |
3
|
0
|
3.4V過電流關機 | 由於3.4V輸出超過額定電流,電源已關閉。 | 檢查交流輸入。重置PSU。 |
2
|
0
|
50V 2過電壓關機 | 由於50V輸出2超出額定電壓,電源已關閉。 | 檢查交流輸入。重置PSU。 |
1
|
0
|
50V 1過壓關機 | 由於50V輸出1超過額定電壓,電源已關閉。 | 檢查交流輸入。重置PSU。 |
0
|
0
|
3.4V過電壓關閉 | 由於3.4V輸出超過額定電壓,電源已關閉。 | 檢查交流輸入。重置PSU。 |
位 | 預設值 | 位名稱 | 意見 | 建議的操作 |
---|---|---|---|---|
7
|
0
|
風扇故障 | 如果風扇速度下降到正常工作速度的70%以下,則閂鎖1。電源模組不會因風扇故障情況而關閉。 | 檢查風扇是否有障礙物。更換PSU。 |
6
|
0
|
熱感測器故障 | 其中一個熱感測器發生故障。 | 更換PSU。 |
5
|
0
|
升溫2高於溫度關機 | 由於增壓2過溫情況,電源已關閉。 | 檢查環境。 |
4
|
0
|
升壓1高於溫度關機 | 由於升壓1過溫情況,電源已關閉。 | 檢查環境。 |
3
|
0
|
50V 2 over temp.關機 | 由於50V輸出2過溫情況,電源已關閉。 | 檢查環境。 |
2
|
0
|
50V 1 over temp.關機 | 電源已關閉,因為50V輸出1溫度過高。 | 檢查環境。 |
1
|
0
|
3.4V超溫關機 | 由於3.4V輸出過溫情況,電源已關閉。 | 檢查環境。 |
0
|
0
|
超溫警告 | 在熱關閉事件發生5秒前發出。 | 檢查環境。 |
位 | 預設值 | 位名稱 | 意見 | 建議的操作 |
---|---|---|---|---|
7
|
0
|
強制關閉 | 如果電源通過電源旋鈕鍵關閉,則此位將處於邏輯1;否則,邏輯0。 | 僅供參考。不需要執行任何操作。 |
6
|
0
|
未使用 | ||
5
|
0
|
未使用 | ||
4
|
0
|
輸入模式更改 | 如果AC1或AC2的輸入模式改變,此位設定為1。 | 僅供參考。不需要執行任何操作。 |
3
|
0
|
當前共用錯誤 | 如果兩個模組當前共用失敗,則此位設定為1。 | 重置PSU。更換PSU。 |
2
|
0
|
50V模組2(在電壓下) | 模組2的50V輸出低於額定電壓。僅當AC2開啟時發出警報。 | 更換PSU。 |
1
|
0
|
50V模組1(在電壓下) | 模組1的50V輸出低於額定電壓。僅當AC1開啟時發出警報。 | 更換PSU。 |
0
|
0
|
電壓為3.4V | 3.4V的輸出電壓低於額定電壓。 | 更換PSU。 |
利用本文檔中使用的示例中描述的資訊,您可以看到電源風扇在暫存器2第7位設定中發生故障。風扇被檢查是否有障礙物(如表中所建議的),但是沒有發現障礙物。然後,通過退貨授權(RMA)更換PSU。
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
21-May-2015 |
初始版本 |