簡介
本文檔說明了Cisco路由器上監視器超時的原因,並說明了如何排除這些超時故障。
必要條件
需求
本文讀者應瞭解以下主題:
採用元件
本文中的資訊係根據以下軟體和硬體版本:
注意:本文檔不適用於Cisco Catalyst交換機或MGX平台,而只適用於Cisco路由器。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路正在作用,請確保您已瞭解任何指令可能造成的影響。
慣例
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
辨識監視器逾時
思科處理器具有計時器,可防止某些型別的系統掛起。CPU定期重置監視程式計時器。監視程式計時器基本上控制每個進程的時間。如果未重置計時器,則會發生陷阱。如果進程比其所需時間更長,則使用監視程式計時器來逃避此進程。
這只有在出問題時才會發生。根據實際情況,路由器可以自行重置,或者從故障中恢復並在控制檯日誌中生成錯誤消息,如下所示:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
或
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
如果不對路由器進行重新通電或手動重新載入,則show version命令的輸出如下所示:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...
如果您有來自Cisco裝置的show version命令輸出,則可以使用Cisco CLI Analyzer顯示潛在問題和解決方法。要使用思科CLI分析器,您必須是註冊客戶、已登入並已啟用JavaScript。
疑難排解
監視器逾時的根本原因可能與硬體或軟體相關。以下是您可以用來辨識問題來源的常見症狀:
排除此類問題的第一步是確定您遇到的監視器超時型別。監視器超時有兩種型別:
軟體監視器超時
此超時是由中斷級別的無限循環或硬體問題引起的。以下是此類超時的一些指示:
-
控制檯日誌包含以下行:
***看門狗超時***
PC = 0x6022536C,SP = 0x00000000
-
show version輸出報告重新載入原因為「監視器計時器超時」:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
-
未生成任何crashinfo檔案。有關詳細資訊,請參閱從Crashinfo檔案檢索資訊。
大多數情況下,這些消息表明主處理器主機板或某個模組存在硬體問題。
在您辨識了軟體監視器超時後,下一步是檢查產品Field Notice彙總以瞭解您的平台和系統中已安裝元件存在哪些已知的嚴重硬體問題。例如,有一條有關Cisco 3600系列路由器的現場通知:Cisco 3600 T1/E1 PRI模組監視器超時。在進一步排除故障之前,請確保檢查Field Notices。
如果最近安裝了新模組,則必須首先嘗試將其刪除,以驗證是否是監視器超時的原因。如果監視器超時仍然存在,請嘗試重新放置所有可拆卸元件。
如果監視器超時在此時繼續運行,則您的硬體沒有現場通知,如果最近未安裝新模組,請更換主處理器板。在高端平台上,處理器主機板是獨立卡(例如NPE-400或RSP8)。在低端平台(Cisco 1700、2500、4000、2600、3600等)上,主機板不能單獨出貨。在這種情況下,您必須更換機箱本身。
進程監視器超時
此逾時是由處理序層級的無限回圈所造成。以下是此逾時的一些指示:
此問題很可能是Cisco IOS軟體Bug。
如果您有來自Cisco裝置的show stacks命令的輸出,可以使用Cisco CLI Analyzer顯示潛在問題和解決方法。要使用思科CLI分析器,您必須是註冊客戶、已登入並已啟用JavaScript。
但是,系統在重新載入之前陷入了循環。因此,堆疊追蹤不必相關。您可以在版本系列中升級到最新的Cisco IOS軟體版本,以消除所有已知的Process Watchdog問題。如果升級後仍然發生崩潰,請收集儘可能多的資訊(請參閱排除路由器崩潰故障),並與您的技術支援人員聯絡。
與監視器超時相關的錯誤消息
還有與監視器計時器相關的其他控制檯錯誤消息。請勿將這些訊息與監視程式計時器當機混淆。請務必使用Error Message Decoder(僅限註冊客戶)幫助檢查這些錯誤消息的含義。此工具提供許多錯誤訊息的詳細說明,並建議解決它們的動作。
請考慮以下訊息:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = [chars]
此訊息表示指定的處理序執行時間過長,而且尚未放棄處理器。系統已關閉指定的進程。根據您的配置,這可能導致系統崩潰。如果消息只出現一次,則無需執行任何操作。然而,如果消息再次出現,應該把它視為進程監視器超時,並採取必要措施。
打開TAC服務請求時要收集的資訊
如果執行上述故障排除步驟後仍需幫助,並且要向Cisco TAC 提交服務請求(僅供註冊客戶使用),請確保包括以下資訊: |
- 在打開服務請求之前執行的故障排除。
- show technical-support輸出(如果可能,在啟用模式下)。
- show log輸出或控制檯捕獲資訊(如果可用)。
- 針對發生板卡崩潰的插槽,execute-on slot [slot #] show tech的輸出。
- crashinfo檔案(如果可用,但尚未包括在show technical-support輸出中)。
請將收集到的資料以非壓縮的純文字檔案格式(.txt)附加到您的服務請求。您可使用TAC服務請求工具(僅供註冊客戶使用)將資訊上傳到服務要求,將資訊附加到服務要求。如果無法訪問服務請求工具,可在郵件的主題行中註明服務請求號,然後將以附件形式將資訊傳送到attach@cisco.com。 注意:除非需要對Cisco 12000系列Internet路由器上的板卡崩潰進行故障排除,否則請勿在收集上述資訊之前手動重新載入路由器或對路由器重新加電,因為這樣做可能導致確定問題根本原因所需的重要資訊丟失。 |
相關資訊