简介
本文描述了在 Cisco 路由器上出现监视器超时的原因,并介绍了排除故障的方法。
先决条件
要求
本文档的读者应掌握以下这些主题的相关知识:
使用的组件
本文档中的信息基于以下软件和硬件版本:
-
所有 Cisco 路由器
-
所有的 Cisco IOS® 软件版本
注意:本文档不适用于Cisco Catalyst交换机或MGX平台,而仅适用于Cisco路由器。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
规则
有关文件规则的更多信息请参见“ Cisco技术提示规则”。
识别监视器超时
Cisco 处理器有防范特定类型的系统挂起的计时器。CPU 定期重新设置监视计时器。监视器计时器主要控制每个进程的时间。如果没有重新设置计时器,陷阱就会发生。如果进程运行时间超过其正常的时间,则使用监视器计时器退出该进程。
此情况仅在出现错误时发生。根据具体情况,路由器能重置其本身,或者从故障恢复并在控制台日志中生成错误消息,如下所示:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
或
%SYS-2-WATCHDOG: Process aborted on watchdog timeout, process = Exec
*** System received a Software forced crash ***
signal = 0x17, code = 0x24, context= 0x60ceca60
如果不重新通电或手动重新加载路由器,则 show version 命令的输出如下所示:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 09:26:24 UTC Mon Mar 27 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
...
如果从Cisco设备获得show version命令的输出,则可以使用Cisco CLI Analyzer显示潜在问题和修复。要使用思科 CLI 分析器,您必须是注册客户、已登录并已启用 JavaScript。
故障排除
监视器超时的根源可能与硬件或软件相关。您可以通过以下常见症状识别问题的根源:
对此问题进行故障排除的第一步是确定您遇到的监视器超时类型。监视器超时有两种主要类型。
软件监视器超时
此超时由中断级别的死环路或者由硬件问题引起。以下是此类超时的一些征兆:
-
控制台日志包含以下行:
*** Watch Dog Timeout ***
PC = 0x6022536C, SP = 0x00000000
-
show version output 报告重新加载原因为“监视器计时器超时”:
Router#show version
...
Router uptime is 1 hour, 47 minutes
System restarted by watchdog timer expired at 06:30:24 UTC Mon Jan 28 2000
System image file is "flash:c3640-is-mz.113-7-T.bin", booted via flash
-
没有生成 crashinfo 文件。有关详细信息,请参阅从 Crashinfo 文件检索信息。
在大多时间里,这些消息表示与主处理器板或其中的一个模块有关的硬件问题。
在您识别了软件监视器超时后,下一步是检查产品 Field Notice 汇总以了解您的平台和系统中已安装组件存在哪些已知的严重硬件问题。例如,Cisco 3600 系列路由器有一个 Field Notice:Cisco 3600 T1/E1 PRI 模块监视器超时。确保在进行进一步故障排除之前查看 Field Notices。
如果最近安装了新的模块,您必须首先尝试将其删除,以验证其原因是否为监视器超时。如果监视器超时仍然存在,请尝试重装所有可移动的组件。
如果这时看门狗仍然超时,您的硬件没有问题信息通告(Field Notice),并且最近没有安装新模块,请继续操作并更换主处理器板。在高端平台上,处理器板是一个分开的卡(例如 NPE-400 或 RSP8)。 在低端平台(Cisco 1700、2500、4000、2600、3600等)上,主板不能单独出售。在这种情况下,您必须替换机箱。
处理监视器超时
此超时由进程级别上的无限循环造成。以下是此种超时的一些征兆:
此问题很可能是 Cisco IOS 软件 Bug。
如果从Cisco设备输出了show stacks命令,则可以使用Cisco CLI分析器显示潜在问题和修复。要使用思科 CLI 分析器,您必须是注册客户、已登录并已启用 JavaScript。
但是,系统在重新加载前阻塞在环路中。所以,这可能与堆栈跟踪不相关。可以升级到您的版本系列中最新的 Cisco IOS 软件版本以排除所有已知进程监视器问题。如果升级后仍会崩溃,那么请尽可能地收集信息(请参阅路由器崩溃故障排除),然后与技术支持代表联系。
与监视器超时相关的错误消息
有与监视器计时器相关的控制台其他错误消息。请勿将这些消息与监视器计时器崩溃混淆。务必在错误消息解码器(仅限注册用户)帮助下查看这些错误消息的含义。 此工具提供了许多错误消息的详细说明,以及解决这些错误所建议采取的操作。
考虑此消息:
%SYS-2-WATCHDOG: Process aborted on watchdog timeout,
process = [chars]
此消息表明,特定进程运行时间过长,并且处理器未被放弃。系统已关闭了指示的进程。根据您的具体配置,这可能导致系统崩溃。如果此消息只出现一次,则无需采取任何行动。然而,如果消息再次出现,应该把它视为进程监视器超时,并采取必要措施。
建立 TAC 服务请求时要收集的信息
相关信息