简介
本文档介绍了几种不常见的系统崩溃类型。我们建议您在阅读本文前先阅读路由器崩溃故障排除。
先决条件
要求
本文档没有任何特定的前提条件。
使用的组件
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
规则
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
确定重新加载的原因
如果您没有对路由器进行重新通电或手工重新加载,则可以在 show version 输出中找到重新加载的原因,如下所示:
Router uptime is 3 days, 18 hours, 39 minutes
System restarted by [reload cause]
System image file is "flash:c2500-js-l.120-9.bin"
如果您有思科设备的show version命令输出,可以使用思科CLI分析器揭示潜在问题并进行修复。要使用思科 CLI 分析器,您必须是注册客户、已登录并已启用 JavaScript。
故障排除
某些类型的崩溃可明显说明存在硬件或软件故障,而另一些则没那么明显。在这种情况下,借助常识是最好的方法。如果路由器正常运行几个月后突然每隔 20 分钟开始重新加载一次,则很可能是硬件问题。如果路由器在更改配置后开始崩溃,则很可能是和软件有关的问题。
对于较新Cisco IOSâ®软件版本的硬件问题,可尝试用show region命令识别故障卡。或者使用演绎推理(例如,如果插入新模块后出现问题,则问题很可能是此新模块导致的)。您也可以通过额外的测试(在另一个插槽中插入相同的模块或在相同的插槽中插入另一个模块)来确定存在故障的设备。
通过升级到最新版本的 Cisco IOS 软件版本系列可消除所有已知的软件问题。
如果您有思科设备的show stacks命令输出,可以使用思科CLI分析器揭示潜在问题并进行修复。要使用思科 CLI 分析器,您必须是注册客户、已登录并已启用 JavaScript。
如果路由器升级后仍然存在问题,则可能出现了新的 Bug。在这种情况下,请联系您的 Cisco 技术支持代表并尽可能多地提供信息。有关详细信息,请参阅路由器崩溃故障排除。
系统崩溃的次常见类型
地址错误
当软件尝试访问未正确对齐的边界上的数据时会发生地址错误;只允许对偶数地址进行双字节和四字节访问。地址错误通常表示存在软件 Bug,但硬件故障也会导致此问题(有关详细信息,请参阅故障排除部分)。
算术异常
软件问题通常会导致此种错误(有关详细信息,请参阅故障排除部分)。
缓存错误异常
当路由器检测出奇偶错误时,会发生此类崩溃。此问题是瞬态问题或硬件故障。有关如何对此问题进行故障排除的信息,请参阅处理器内存奇偶错误。
错误 - 级别 <x>
x 表示 1 到 7 之间的一个数字。
这类崩溃通常和硬件有关。CPU 板出现故障通常会造成此类崩溃。
错误中断
若出现错误中断崩溃,则说明处理器以外的其他设备检测出致命错误。若要确定根本原因,您需要了解更多信息。要求采用 crashinfo 文件或 show tech-support 命令输出来进行故障排除(请参阅路由器崩溃故障排除)。收集此信息后,请联系您的 Cisco 技术支持代表。
格式错误
除非根据发生的情况可明确判定是硬件故障(有关详细信息,请参阅故障排除部分),否则请就此问题联系您的 Cisco 技术支持代表。
非法指令
此错误通常与软件有关。然而,硬件故障也可能导致此问题(通常是闪存或动态 RAM (DRAM) 出现故障)。Cisco IOS 软件映像损坏也可能会导致此问题(有关详细信息,请参阅故障排除部分)。
不合法的操作码异常
硬件故障也会导致此错误(例如,CPU 板故障)。某些情况下,软件问题可能会导致此错误(有关详细信息,请参阅故障排除部分)。
跳到零错误
当Cisco IOS软件设法执行数据而不是代码时,经常会发生此类错误。通常情况下,软件 Bug 会导致此问题,但如果根据症状可明确判定是硬件故障,则考虑 CPU 是否存在故障(有关详细信息,请参阅故障排除部分)。
线路仿真器陷阱
当处理器设法执行无效指令时,会发生1010/1111行仿真器错误。代码 1010/1111 并不相关(此代码取决于您试图执行的无效指令)。
导致线路仿真器陷阱错误的可能原因是:
加电
如果 show version 命令输出显示 restarted by reload 或 System returned to ROM by power-on,则可以推断路由器已重新通电或停电数秒。验证您的电源并对出口回路(从路由器到电源)进行故障排除。
注意:如果Cisco 7200系列路由器使用以下早期硬件版本的端口适配器,则该系列的路由器会因监视器超时而崩溃,并通电将崩溃报告为System returned to ROM:
-
PA-CT1/PRI
-
PA-CE1/PRI-75
-
PA-CE1/PRI-120
-
PA-4E
-
PA-5EFL
-
PA-8E
如果您认为这个问题对您的路由器造成了影响(在您确保不是电源问题后),则接收 show tech-support 报告并联系您的 Cisco 技术支持代表。
重新加载
如果 show version 命令输出显示 restarted by reload 或 system returned to ROM by reload,则可以推断用户通过 reload 命令手工重启路由器。这不是系统崩溃。
预留异常
对于此类崩溃,重新加载的目的是确保路由器不会传输损坏的数据。原因可能与硬件相关,也可能与软件相关(请参阅故障排除部分)。
因失误重新启动
除非根据产生的错误可明确判定是硬件故障(请参阅故障排除部分),否则请联系您的 Cisco 技术支持代表。
Sigtrap(信号陷阱)异常
这通常是软件问题,是另一种报告软件所致崩溃的方式。
未定义陷阱
除非根据发生的情况可明确判定是硬件故障(请参阅故障排除部分),否则请联系您的 Cisco 技术支持代表。
意外硬件中断
硬件故障通常会导致此类崩溃(请参阅故障排除部分)。
未知故障
除非根据发生的情况可明确判定是硬件故障(请参阅故障排除部分),否则请联系您的 Cisco 技术支持代表。
未知重新加载原因
此处导致崩溃的故障会阻止路由器记录重新加载原因。此问题可能与硬件或软件相关。除非根据发生的情况可明确判定是硬件故障(请参阅故障排除部分),否则请联系您的 Cisco 技术支持代表。
证实您能否通过升级到您所在版本系列的最新 Cisco IOS 软件版本来修复这个故障。否则,请从 crashinfo 文件或控制台日志中额外收集信息(请参阅路由器崩溃故障排除)并联系您的 Cisco 技术支持代表。
写入总线错误中断
硬件故障通常会导致此类崩溃(请参阅故障排除部分)。
报告TAC案例应收集的信息
相关信息