本文提供判斷Catalyst交換器上是否有硬體故障的一般原則。以下清單適用於執行Cisco Catalyst OS(CatOS)軟體的Catalyst 4500/4000、5500/5000和6500/6000系列交換器。目標是幫助思科客戶確定基本硬體問題,或在聯絡思科技術支援之前執行更廣泛的故障排除。
您也可以參閱以下相關疑難排解檔案以獲得進一步協助:
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
本文件沒有特定先決條件。
本檔案中的資訊是根據適用於Catalyst 4500/4000、5500/5000和6500/6000交換器的所有軟體版本中提供的命令編寫的。
唯一的例外是set test diaglevel命令,該命令是在CatOS軟體版本5.4(1)中匯入。
如果您在Catalyst 6500/6000或Catalyst 4500/4000系列交換器上執行Cisco IOS®軟體,則CatOS中使用的show和set命令無法使用。但是,本文中使用的步驟適用於交換器硬體,而且可以使用類似的Cisco IOS軟體命令來應用。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您在即時網路中工作,請確保在使用任何命令之前瞭解其潛在影響。
下面是一個有序的故障排除過程,它將有助於收集解決問題所需的資訊。細化問題的範圍將節省客戶尋找解決方案的寶貴時間,並且遵循這些步驟將確保重要資料不會丟失。
檢視show system命令的輸出,瞭解是否有任何故障。狀態欄位與系統元件上的各種LED相關。系統上的所有各種LED都應為綠色。如果LED不呈綠色,則可能表示出現故障。瞭解Catalyst交換機系列的元件以及LED指示您確定元件是否發生故障非常重要。Supervisor Engine上的狀態LED指示Supervisor Engine是否通過所有診斷測試。Supervisor Engine包含系統操作軟體。如果系統軟體有問題,請檢查Supervisor Engine。開啟控制檯會話並確定Supervisor Engine是處於啟動模式還是ROM監控(ROMmon)模式。如果交換機停滯在引導或ROMmon模式,請按照從引導失敗中恢復運行CatOS的Catalyst交換機文檔中的故障排除步驟操作。
show system命令將為您提供Catalyst交換機的寶貴環境和系統資訊。命令輸出還顯示正常運行時間,即交換機已啟動並運行的時間量。此資訊在確定交換機故障發生的時間時很有用。
如果您的Cisco裝置具有show system指令的輸出,可以使用Output Interpreter(僅限註冊客戶)顯示潛在問題和修正程式。
輸出示例
Console (enable) show system PS1-Status PS2-Status ---------- ---------- ok none Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout ---------- ---------- ---------- -------------- --------- faulty off faulty 18,22:37:24 20 min PS1-Type PS2-Type ------------ ------------ WS-CAC-1300W none Modem Baud Traffic Peak Peak-Time ------- ----- ------- ---- ------------------------- disable 9600 0% 0% Fri May 24 2002, 07:04:29 PS1 Capacity: 1153.32 Watts (27.46 Amps @42V) System Name System Location System Contact CC ------------------------ ------------------------ ------------------------ --- Console (enable)
註:如果發生任何故障(如上述故障風扇狀態),請檢查風扇部件和電源是否有任何問題。
PS — 狀態:指示機箱中電源的狀態。出現故障的PS或未提供電源的PS可能表示Supervisor引擎模組出現故障(系統狀態故障)。 如果交換機具有橙色系統LED且PS#-Status為faulty,這並不意味著電源或交換機出現故障。這可能表示其中一個電源未正確插入或可能未插入。
註:Catalyst 4006需要安裝兩個電源以運行交換機,還需要一個額外電源以實現冗餘。如需詳細資訊,請參閱Catalyst 4000系列交換器的主要功能檔案的標準裝置一節。
風扇狀態:如果這表示存在問題,則系統可能會過熱,從而導致交換機運行出現問題。
系統狀態:指示系統中是否檢測到任何故障。
流量與峰值:這指示Catalyst背板上的負載。當網路正常運行且沒有任何問題時,監視此利用率。稍後,當網路中可能出現問題時,可能會使用正常操作的結果來比較,例如,如果生成樹協定(STP)環路、廣播風暴或其他型別的生成大量流量的事件可能導致其他裝置效能下降。
發出show test mod 命令檢視疑似故障模組的輸出。
注意:show test命令可能向您顯示一個診斷條目。如果此診斷級別設定為bypass或minimal,可以通過發出set test diaglevel complete命令來更改此級別,並重置模組以便進行自測試。set test diaglevel complete命令執行所有可用的自測試,而最小和旁路選項跳過部分或全部測試。
如果您在show test命令的輸出中看到F,則表示此部件可能已遭遇硬體故障。
示例1:Catalyst 4000
Galaxy> (enable) show test 1 Diagnostic mode (mode at next reset: complete) Module 1 : 2-port 1000BaseX Supervisor POST Results Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) Galaxy Supervisor Status : . CPU Components Status Processor : . DRAM : . RTC : . EEPROM : . FLASH : . NVRAM : . Temperature Sensor : . Uplink Port 1 : . Uplink Port 2 : . Me1 Status : . EOBC Status : . SCX1000 - 0 Register : . Switch Sram : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 1 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 2 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . Galaxy> (enable) show test 5 Diagnostic mode (mode at next reset: complete) Module 5 : 14-port 1000 Ethernet Status: (. = Pass, F = Fail, U = Unknown) Eeprom: . NICE Regs: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . NICE SRAM: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . 1000Base Loopback Status: Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ----------------------------------------- . . . . . . . . . . . . . .
示例2:Catalyst 5000
Sacal> show test 1 Module 1 : 2-port 100BaseFX MM Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . MCP Comm: . EARL Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . MonitorTest . DontLearn: . FlushPacket: . ConditionalLearn: . EarlLearnDiscard: . EarlTrapTest: . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) CPU : . Sprom : . Bootcsum : . Archsum : N RAM : . LTL : . CBL : . DPRAM : . SAMBA : . Saints : . Pkt Bufs : . Repeater : N FLASH : N MII Status: Ports 1 2 ----------- N N SAINT/SAGE Status : Ports 1 2 3 -------------- . . . Packet Buffer Status : Ports 1 2 3 -------------- . . . Loopback Status [Reported by Module 1] : Ports 1 2 3 -------------- . . . Channel Status : Ports 1 2 ----------- . .
示例3:Catalyst 6500
tamer>(enable) show test 1 Diagnostic mode: complete (mode at next reset: minimal) Module 1 : 2-port 1000BaseX Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . EOBC Comm: . Line Card Status for Module 1 : PASS Port Status : Ports 1 2 ----------- . . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) Module 1 Earl V Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . DontLearnTest: . ConditionalLearnTest: . BadBpduTest: . TrapTest: . MatchTest: . SpanTest: . CaptureTest: . ProtocolMatchTest: . IpHardwareScTest: . IpxHardwareScTest: . MultipleRoutersScTest: . L3DontScTest: . L3RedirectTest: . L3Capture2Test: . L3VlanMetTest: . AclPermitTest: . AclDenyTest: . Loopback Status [Reported by Module 1] : Ports 1 2 ----------- . . Channel Status : Ports 1 2 ----------- . . InlineRewrite Status : Ports 1 2 ----------- . . tamer>(enable) show test 3 Diagnostic mode: complete (mode at next reset: minimal) Module 3 : 48-port 10/100BaseTX Ethernet Line Card Status for Module 3 : PASS Port Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ------------------------------------------------------------------------ . . . . . . . . . . . . . . . . . . . . . . . . Line Card Diag Status for Module 3 (. = Pass, F = Fail, N = N/A) Loopback Status [Reported by Module 1] : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Channel Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . InlineRewrite Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . .
檢視show logging buffer命令的輸出,瞭解在交換機出現故障時顯示的任何錯誤消息。
Catalyst交換器可能會顯示一則訊息,指出交換器內發生的任何事件。檢視此輸出,並檢查「消息和恢復過程」文檔中顯示的任何消息的含義。這樣可以指示故障發生時到底發生了什麼錯誤,並驗證問題是否與硬體或軟體相關。使用錯誤消息解碼器(僅供註冊客戶使用)工具幫助解碼任何消息的輸出。
輸出示例
系統日誌可能會顯示以下錯誤消息:
SYS-2-FAN_FAIL: Fan failed SYS-2-MOD_TEMPMINORFAIL: Module 2 minor temperature threshold exceeded
如果我們在消息和恢復過程中查詢消息,可以看到第一條消息表示系統中的一個或多個風扇出現故障。然後顯示模組2檢測到模組2上的溫度已上升的消息。在這種情況下,您需要檢查風扇模組以解決問題。
除了審閱錯誤訊息外,最好使用Bug工具包(僅供註冊客戶使用)來檢視軟體版本是否有任何問題。show version命令會提供用於錯誤搜尋的軟體版本資訊。
例如,如果您在show log命令輸出中識別到例外狀況,請使用Bug Toolkit(僅供註冊客戶使用)在Catalyst平台上搜尋錯誤、軟體版本以及在show log中搜尋例外狀況。
發出show version命令,檢查出現問題的模組的型號和使用的軟體版本。確定動態隨機存取記憶體(DRAM)總數和快閃記憶體總數。使用特定平台的Software Advisor(僅供註冊客戶使用)或產品概述來確定硬體是否與軟體相容。
此命令驗證您運行的軟體的版本。此命令還包含有關快閃記憶體和DRAM大小的資訊。如果需要升級,此資訊非常有用。
輸出示例
Console (enable) show version WS-C6509 Software, Version NmpSW: 5.5(5) Copyright (c) 1995-2000 by Cisco Systems NMP S/W compiled on Dec 14 2000, 17:05:38 System Bootstrap Version: 5.3(1) Hardware Version: 2.0 Model: WS-C6509 Serial #: SCA0412024U Mod Port Model Serial # Versions --- ---- ------------------- ----------- -------------------------------------- 1 2 WS-X6K-SUP1A-2GE SAD04281END Hw : 3.2 Fw : 5.3(1) Fw1: 5.4(2) Sw : 5.5(5) Sw1: 5.5(5) WS-F6K-PFC SAD04340506 Hw : 1.1 3 8 WS-X6408-GBIC SAD0415009A Hw : 2.4 Fw : 5.1(1)CSX SW : 5.5(5) 4 48 WS-X6348-RJ-45 SAL0446200S Hw : 1.4 Fw : 5.4(2) SW : 5.5(5) 15 1 WS-F6K-MSFC SAD04120BNJ Hw : 1.4 Fw : 12.1(8a)E2 SW : 12.1(8a)E2 DRAM FLASH NVRAM Module Total Used Free Total Used Free Total Used Free ------ ------- ------- ------- ------- ------- ------- ----- ----- ----- 1 65408K 37463K 27945K 16384K 15673K 711K 512K 236K 276K Uptime is 18 days, 21 hours, 54 minutes Console (enable)
如果需要升級,請務必首先檢視特定平台的版本說明,然後選擇需要升級的版本。
如果多個埠出現問題,請嘗試啟用或禁用問題埠。可通過發出set port {enable來啟用或禁用埠 | disable} mod/port 命令。
在某些情況下,Catalyst交換器可能會遇到一個連線埠的問題。停用和重新啟用此特定連線埠可能會解決問題。
注意:通過禁用或啟用埠,您還可能觸發連線到該埠的裝置上的某些事件(例如,重新啟動伺服器上被停滯的進程)。 在大多數情況下,禁用和重新啟用埠可以解決問題,這意味著問題與硬體無關。如果這樣可以解決問題,請在維護時段重置此線卡,以便進行自檢。
如果某個特定連線埠發生問題,請嘗試將連線移動到另一個連線埠。使用已知工作的工作站並將其連線到故障埠。
如果先前禁用和重新啟用埠的操作未解決問題,請將連線移動到同一模組(具有相同配置)上的不同埠。 如果這樣可以解決問題,則表示可能已發生硬體故障。如果問題仍然存在,可能是由於連線的裝置的配置所致。確認交換器連線埠和連線裝置上的連線埠速度和雙工設定相同。
例如,連線到模組7上的埠1的站台會一直運行和關閉。嘗試交換同一模組上的埠1和埠2連線(確保埠1和埠2具有相同的配置)。 如果埠2上不再出現此問題,但埠1上的工作站現在開始擺動,則表明埠1出現問題。如果埠2出現問題,則可能表明配置、連線的裝置或電纜存在問題。
開啟控制檯會話並捕獲啟動加電自檢(POST)診斷和任何系統錯誤消息。發出reset mod 指令以重設模組。
重置模組後,如果線卡重新聯機並且所有埠通過診斷測試並且流量開始通過,則模組問題可能是由於軟體問題所致。發出show test mod 命令,以確定此模組是否已在啟動時通過所有診斷測試。請注意任何F以查詢失敗結果。
卸下模組並檢查其針腳是否彎曲。要重新拔插模組,請用力按下彈出器拉杆,然後擰緊安裝螺釘。
在某些情況下,卡安裝不正確可能導致出現硬體故障症狀。插錯卡可能導致背板上的流量損壞,這可能導致在Catalyst機箱中出現各種問題。例如,如果一個模組損壞Catalyst背板上的流量,則可能導致自身和其他模組的自檢失敗。重新拔插所有卡可以解決此問題,並允許通過自檢。
嘗試卸下機箱中的所有線卡(活動Supervisor Engine模組和問題模組除外),以確定故障是否發生變化。如果故障繼續,請將線卡移至機箱中已知的工作插槽中。
注意:如果模組是不同型別的模組,請儲存配置並發出clear config module 命令。
如果機箱中的某個線卡出現故障,則可能導致其他線卡出現故障。在這種情況下,卸下一個卡可以解決其它卡上出現的問題。如果在卸下所有其它線卡並將線卡移至另一個插槽後,模組仍然無法正常工作,這可能表示線卡出現故障。如果有其它交換機可用,請嘗試使用其它機箱中的模組,最終確定是模組問題還是機箱問題。
如果模組工作正常,並且在卸下其它模組並將模組移至另一個插槽後傳輸流量,這可能表明機箱可能存在問題。嘗試將模組放回其原始位置,並確定故障是否返回。如果模組運行正常,並且在原始位置傳遞流量,則這可能表明存在軟體問題。使用Bug Toolkit(僅供註冊客戶使用)搜尋Catalyst平台上的錯誤、軟體版本以及您遇到的錯誤。
卸下Supervisor Engine並檢查針腳是否彎曲。重新拔插Supervisor Engine,用力按下彈出杆,然後擰緊固定安裝螺釘。若是Catalyst 5500和6000系列交換器,Supervisor Engine可安裝在插槽1和2中。若要消除插槽依賴性問題,請將Supervisor Engine移至可用於Supervisor Engine模組的另一個插槽。Catalyst 5500和6000系列交換器也支援備援,允許交換器具有雙Supervisor引擎。如果正在運行雙Supervisor Engine,請嘗試通過拔掉作用中Supervisor Engine或發出reset mod 命令來強制切換到備用Supervisor Engine。有關插槽Supervisor Engine要求的詳細資訊,請參閱以下連結:
開啟控制檯會話並捕獲啟動POST診斷和任何系統錯誤消息。等待Supervisor Engine初始化。如果show system命令sys-status仍為faulty,則Supervisor Engine出現故障。
檢查故障發生時的情況。
如果故障不斷發生,請檢查該時間及地點發生的情況。這麼做可能會讓您瞭解Catalyst交換器以外發生什麼會導致Catalyst交換器失敗。例如,電力短暫中斷,可能是建築物中的燈光閃爍。
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
30-Aug-2005 |
初始版本 |