簡介
本文檔描述了Cisco路由器上監視器超時的原因,並說明如何排除這些超時故障。
必要條件
需求
本文檔的讀者應瞭解以下主題:
採用元件
本文中的資訊係根據以下軟體和硬體版本:
注意:本文檔不適用於Cisco Catalyst交換機或MGX平台,而只適用於Cisco路由器。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路正在作用,請確保您已瞭解任何指令可能造成的影響。
慣例
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
確定監視器超時
思科處理器具有計時器,可防止某些型別的系統掛起。CPU定期重置監視程式計時器。監視程式計時器基本控制每個進程的時間。如果計時器未重置,則會發生陷阱。如果進程比必須的長,則使用監視程式計時器來逃避此進程。
這只有在出現問題時才會發生。根據情況,路由器可以重置自己,或從故障中恢復並在控制檯日誌中生成錯誤消息,如下所示:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
或
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
如果不重新通電或手動重新載入路由器,show version 命令的輸出如下所示:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...
如果您的Cisco裝置輸出了show version命令,則可以使用Cisco CLI Analyzer顯示潛在問題和修復程式。要使用Cisco CLI Analyzer,您必須是已註冊的客戶,必須登入並啟用JavaScript。
疑難排解
監視器逾時的根本原因可能與硬體或軟體相關。以下是您可以用來判斷問題來源的常見症狀:
解決此類問題的第一步是確定您遇到的監視器超時型別。監視程式超時有兩種型別:
軟體監視器超時
此超時是由中斷級別的無限循環或硬體問題導致的。以下是此類超時的一些指示:
-
控制檯日誌包含以下行:
*** Watch Dog Timeout ***
PC = 0x6022536C,SP = 0x00000000
-
show version輸出將報告重新載入原因,因為「監視程式計時器已過期」:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
-
未生成crashinfo檔案。有關詳細資訊,請參閱從Crashinfo檔案檢索資訊。
大多數情況下,這些消息表明主處理器主機板或某個模組存在硬體問題。
識別軟體監視器超時後,下一步是檢查您的平台和系統中安裝的所有元件的Product Field Notice Summary以瞭解已知的關鍵硬體問題。例如,Cisco 3600系列路由器有一個現場通知:Cisco 3600 T1/E1 PRI模組監視器超時。在進一步排除故障之前,請務必檢查現場通知。
如果最近安裝了新模組,您必須首先嘗試將其刪除,以驗證它是否是監視器超時的原因。如果監視器超時仍然存在,請嘗試重新放置所有可拆卸元件。
如果此時監視器超時持續,則您的硬體沒有現場通知;如果最近沒有安裝新的模組,請繼續並更換主處理器板。在高端平台上,處理器板是單獨的卡(例如NPE-400或RSP8)。 在低端平台(Cisco 1700、2500、4000、2600、3600等)上,主機板不能單獨發貨。在這種情況下,您必須更換機箱本身。
進程監視器超時
此超時由進程級別的無限循環導致。以下是此逾時的一些指示:
此問題很可能是Cisco IOS軟體錯誤。
如果您的Cisco裝置輸出了show stacks命令,可以使用Cisco CLI Analyzer顯示潛在問題和修正程式。要使用Cisco CLI Analyzer,您必須是已註冊的客戶,必須登入並啟用JavaScript。
但是,重新載入之前,系統停滯在環路中。因此,堆疊追蹤不需要相關。您可以在版本系列中升級到最新的Cisco IOS軟體版本,以消除所有已知的Process Watchdog問題。如果升級後仍然發生崩潰,請收集儘可能多的資訊(請參閱路由器崩潰故障排除),並與技術支援代表聯絡。
與監視器超時相關的錯誤消息
還有其他與監視程式計時器相關的控制檯錯誤消息。請勿將這些消息與監視程式計時器崩潰相混淆。請務必使用錯誤訊息解碼器(僅限註冊客戶)來檢查這些錯誤訊息的含義。 此工具為您提供了許多錯誤消息的詳細說明,並建議了解決這些錯誤的操作。
請考慮以下訊息:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = [chars]
此消息表示指定的進程運行時間過長,並且尚未放棄處理器。系統已關閉指定的進程。根據您的配置,這可能導致系統崩潰。如果消息只出現一次,則無需進行任何操作。但是,如果此情況再次發生,您必須將其視為進程監視器超時,並採取必要措施。
開啟TAC服務請求時要收集的資訊
如果您在完成上述故障排除步驟後仍然需要幫助,並且希望向Cisco TAC提交服務請求(僅限註冊客戶),請確保包括以下資訊: |
- 在開啟服務請求之前執行的故障排除。
- show technical-support output(如果可能處於啟用模式)。
- show log輸出或控制檯捕獲(如果可用)。
- execute-on slot [slot #] show tech for the slot that experience the line card crash。
- crashinfo檔案(如果可用,且尚未包含在show technical-support輸出中)。
請將收集的資料以非壓縮的純文字檔案格式(.txt)附加到您的服務請求。 您可以使用TAC服務請求工具(僅限註冊客戶)將資訊上傳到服務請求(僅限註冊客戶)。 如果您無法訪問Service Request工具,可以將電子郵件附件中的資訊傳送到attach@cisco.com,並將您的服務請求編號包含在郵件主題行中。 註:除非需要對Cisco 12000系列網際網路路由器上的線卡崩潰進行故障排除,否則請不要在收集上述資訊之前手動重新載入或重啟路由器,因為這樣可能會導致確定問題根本原因所需的重要資訊丟失。 |
相關資訊