簡介
本文檔介紹如何分析聚合服務路由器903(ASR903)上的常見硬體故障症狀及其故障排除方法。
必要條件
需求
思科建議您瞭解以下主題的基本知識:
- Cisco IOS-XE軟體
- ASR 903 CLI
採用元件
本文中的資訊是根據觀察到故障症狀的特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路正在作用,請確保您已瞭解任何指令可能造成的影響
概觀
Cisco ASR 903路由器是功能全面的聚合平台,旨在經濟高效地提供融合的移動和業務服務。這款緊湊型3機架單元(RU)路由器深度淺、功耗低、溫度範圍廣,可提供高服務規模、完全冗餘和靈活的硬體配置。Cisco ASR 903路由器定位為IP無線接入網路(RAN)網路中的預聚合路由器或運營商乙太網路中的聚合路由器。
該平台包括以下主要現場可更換單元(FRU),如下圖所示:
標籤 |
元件 |
1 |
介面模組(IM) |
2 |
兩個路由交換處理器(RSP)單元插槽。支援RSP1A-55、RSP1B-55、RSP2A-64和RSP2A-128 |
3 |
風扇托架 |
4 |
冗餘直流電源 |
在正常操作期間,任何現場可更換單元(FRU)都可能會出現故障症狀。通常,這最終會替代硬體元件,硬體元件不一定會導致硬體故障。通過遵循某些故障排除技術,您可以將這些模組從故障狀態中恢復,從而縮短網路停機時間。
疑難排解
直流電源報告故障(A900-PWR550-D)
- 使用萬用表驗證電源,測量DC PSU(電源單元)聯結器上的輸入直流電壓。讀數應在24V至60V範圍內。
- 如果輸入電壓讀數正常,請檢查面板上指示燈的狀態(「Input Ok」(輸入正常)和「Output Fail」(輸出失敗))。 如果兩個LED均熄滅,則更換DC PSU。
- 如果「Input OK」(輸入正常)LED為綠色,但「Output Fail」(輸出失敗)LED為琥珀色/紅色,則首先卸下輸入電源接頭,然後插出完整的DC PSU。等待15秒。將DC PSU插回並連線輸入電源接頭。需要對兩個DC PSU執行此練習(如果系統有兩個DC PSU)。
- 如果「Input OK」(輸入正常)LED為綠色,而「Output FAIL」(輸出失敗)LED完全不發光,請更換DC PSU。
附註:使用單個電源時,路由器可以運行。如果輔助電源單元未通電,則需要物理插入。
風扇托架報告故障
Cisco ASR 903路由器使用獨立於電源的模組化風扇托架。風扇托架包含12個風扇,即使發生風扇故障,該托架也具有足夠的容量來維持運行。有兩種型別的風扇托架模組(A903-FAN和A903-FAN-E),取決於使用路由器的環境。後者(A903-FAN-E)配有8mm風扇除塵器,可防止灰塵進入單元並避免元件可能損壞。
案例 1:托盤中的單個風扇模組出現故障
使用命令「show platform」或「show facility-alarm status」確定托盤中風扇的狀態。如果風扇發生故障,風扇托架狀態將顯示為「故障」,同時顯示發生故障的單個裝置的詳細資訊。
ASR903#
show platform | in FAN|State
Chassis type: ASR-903
Slot Type State Insert time (ago)
P2 A903-FAN-E
f2, f4, f6, fail
05:00:00
[an error occurred while processing this directive]
ASR903#
sh facility-alarm status
System Totals Critical: 1 Major: 3 Minor: 0
Source Severity Description [Index]
Fan Tray CRITICAL Multiple Fan Failures [2]
Fan Tray MAJOR Fan 2 Failure [5]
Fan Tray MAJOR Fan 4 Failure [7]
Fan Tray MAJOR Fan 6 Failure [9]
[an error occurred while processing this directive]
這些輸出顯示,插槽f2、f4和f6中的風扇模組出現故障,需要更換。
案例 2:風扇托架報告為「未知」
在某些情況下,在「show platform」輸出中,風扇托架可能報告為「Unknown」,網路管理系統(NMS)工作站可能也會發出警報。
ASR903#
sh platform | in P2
Chassis type: ASR-903
Slot Type State Insert Time (ago)
P2 Unknown N/A never
[an error occurred while processing this directive]
執行以下步驟可幫助恢復模組:
- 對風扇模組執行物理重新拔插。在拆除或更換風扇托架後,至少等待2分鐘讓系統重新初始化。如果使用型號「A903-FAN-E」搭配防塵過濾器,請嘗試清潔過濾器以確保它不會堵塞風扇模組。
- 對路由器執行重新通電並驗證是否檢測到風扇托架。
- 如果風扇托架仍報告「未知」,則可能需要更換部件來解決問題。
附註:CSCuu75796中存在一個已知的修飾缺陷,風扇托架在該缺陷中將被報告為「未知」。為避免出現錯誤故障資訊,在卸下或更換風扇托架後,至少要等待2分鐘讓系統重新初始化。
RSP報告的故障
場景1:RSP報告為「未知」
ASR903#
show platform | in R1
Chassis type: ASR-903
Slot Type State Insert Time (ago)
R1 A903-RSP1B-55 unknown 1d01h
[an error occurred while processing this directive]
- 執行命令「hw-module slot R1 reload」並驗證處理器是否正在初始化。
- 如果待命RSP在「booting」和「unknown」狀態之間切換,而不轉換為「init,standby」狀態,則問題主要是由於本地bootflash中缺少IOS-XE映像。
- 使用帶有有效IOS-XE映像的USB快閃記憶體驅動器來引導RSP。如果模組繼續處於「未知」狀態,請對模組執行物理重新拔插。
- 如果上述所有步驟均失敗,請從RSP模組收集控制檯日誌並使用TAC開啟服務請求。
場景2:備用RSP在「引導」和「初始化,備用」狀態之間切換
備用RSP模組出現此行為的常見原因之一是主用和備用RSP之間的配置同步失敗。應執行以下命令驗證這一點:
ASR903#show redundancy config-sync failures bem
ASR903#show redundancy config-sync failures mcl
ASR903#show redundancy config-sync failures prc
[an error occurred while processing this directive]
如果上述任何命令中都報告了故障,則實施以下解決方法,並驗證RSP是否保持運行。
ASR903# config terminal
ASR903config)#redundancy
ASR903(config)#mode sso
ASR903(config-red)#no policy config-sync lbl prc reload
ASR903config-red)#no policy config-sync bulk prc reload
ASR903(config-red)#end
[an error occurred while processing this directive]
如果RSP模組繼續留在引導環路中,請檢查裝置日誌中是否存在如下所示的任何鏈路錯誤。如果是,如果物理重新拔插無法修復,則可能需要更換RSP模組。
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive]
介面模組(IM)無法初始化
無論何時安裝模組,IM都會轉換到特定狀態(out of service->inserted->booting->OK)。 如果六個可用插槽中任何一個插槽中的介面模組(IM)無法通過引導狀態,請執行以下步驟:
ASR903#sh platform
Chassis type: ASR-903
Slot Type State Insert Time (ago)
0/4 A900-IMA8S inserted/unkown 00:27:02 (physical)
[an error occurred while processing this directive]
- 使用命令「hw-module subslot <slot/subslot> reload」重新載入受影響的模組。驗證模組是否已恢復。
ASR903#hw-module subslot 0/1 reload
Proceed with reload of module? [confirm]
%IOSXE_OIR-6-SOFT_RELOADSPA: SPA(A900-IMA1X) reloaded on subslot 0/1
[an error occurred while processing this directive]
- 將模組物理地重新拔插在同一插槽中。如果模組處於「未知」狀態,請嘗試將其插入另一個插槽,以排除機箱上的線路卡插槽故障。
- 觀察日誌並觀察任何核心/鏈路錯誤,如下所示:
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive] 「鏈路訓練」錯誤主要表示特定插槽的外圍元件互連Express(PCIe)匯流排上存在通訊錯誤。PCIe熱插拔模組託管在RSP引擎上。執行RSP切換,以便模組在備用RSP(路由交換處理器)的PCIe匯流排上註冊。 如果模組在切換後恢復,則需要更換以前的活動RSP模組。
ASR903#redundancy force-switchover
Proceed with switchover to standby RP? [confirm]
[an error occurred while processing this directive]
附註:如需進一步的協助,請向思科技術協助中心(TAC)提交服務請求,提供所進行疑難排解的詳細資料以及路由器的「show tech-support」輸出。