更换实际正常运行的硬件时,通常会浪费宝贵的时间和资源。本文档帮助排除Cisco 7300系列路由器的潜在硬件问题,并提供指针以识别硬件故障。
注:本文档不涉及任何与软件相关的故障,但通常被误认为硬件故障的故障除外。
本文档的读者应掌握以下这些主题的相关知识:
本文档中的信息基于以下软件和硬件版本:
思科IOS®软件版本12.1(9)EX1及更高版本
Cisco 7304 路由器
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
有关文件规则的更多信息请参见“ Cisco技术提示规则”。
无论何时安装新的线卡、模块或Cisco IOS软件映像,都必须确保路由器有足够的内存。您还必须检查硬件和软件是否与您希望使用的功能兼容。
完成以下步骤以检查硬件软件兼容性和内存要求:
请使用软件顾问(仅限注册用户)工具为您的网络设备选择软件。
使用下载软件地区(注册用户)检查Cisco IOS软件需要的最小内存(RAM和闪存)数量,并且/或者下载Cisco IOS软件镜像。要确定路由器上安装的内存(RAM和闪存)大小,请参阅如何选择Cisco IOS软件版本 — 内存要求。
技巧:
如果您确定需要升级 Cisco IOS 软件,请遵循 Cisco 7300 系列路由器的软件安装和升级过程。
提示:有关如何恢复滞留在ROMmon(rommon # > prompt)中的Cisco 7300系列路由器的信息,请参阅Cisco 7300的ROMmon恢复过程。
为了确定原因,第一步是尽可能多的获取该问题的大量信息。此信息是必要的以确定问题的原因:
控制台日志 — 有关详细信息,请参阅为控制台连接应用正确的终端仿真器设置。
Syslog信息 — 如果已将路由器设置为向系统日志服务器发送日志,则可能可以获取有关发生情况的信息。有关详细信息,请参阅如何针对 Syslog 配置 Cisco 设备。
show technical-support - show technical-support命令是许多不同命令的汇编,包括show version、show running-config和show stacks。当路由器出现问题时,思科技术支持中心(TAC)工程师通常会要求提供此信息来排除硬件问题。在重新加载或重新通电之前,必须收集show technical-support,因为这些操作可能会导致有关问题的所有信息丢失。
启动顺序信息 — 路由器出现启动错误时的完整启动顺序。
Crashinfo file(如果可用) — 在Retrieving Information from the Crashinfo File中,可以找到有关如何获取crashinfo文件的信息。
如果从Cisco设备获得show命令的输出(例如show technical-support),则可以使用 来显示潜在的故障和修复方法。为了使用 ,您必须是注册客户、登录并启用JavaScript。
要排除此类故障,必须从路由器的控制台捕获信息。将控制台输出记录到文件中以供以后分析,或者,如果要打开TAC服务请求,请记录到思科技术支持中心(TAC)。
如果您不熟悉Cisco路由器的启动过程,请参阅图12:“Rebooting Documentation(重启文档)”中的“Booting Process(引导过程)”。
如果遇到引导问题,请检查表1中的症状和建议的操作。
表1 — 引导问题的症状和建议操作症状 | 建议操作 |
---|---|
打开路由器电源后,未打开发光二极管(LED)。 | 确保路由器已牢固地插入有效的电源。打开路由器电源后,验证电源上的LED指示灯是否发生变化,如电源概述中所述。网络服务引擎(NSE)的通电顺序LED为:
|
电源上的故障LED为红色。 | 检查开/备用交换机。如果问题仍然存在,请重新安放并更换电源,如卸下和更换电源中所述。 |
电源上的输入正常LED熄灭。 | 验证线路输入电压是否可用且是否在适当范围内:
|
打开路由器电源后,适当的网络服务引擎(NSE)和电源LED亮起,但控制台不响应。 | 检查您的终端设置。 |
路由器每次都在设置模式下启动和启动,但配置存储在非易失性RAM(NVRAM)中。 | 验证配置寄存器是否设置正确。 |
路由器启动并停滞在ROMmon模式(rommon #>提示符)下。 | 设置配置寄存器对0x2102并且重新载入路由器。 rommon 1 > confreg 0x2102 rommon 2 > reset如果7300路由器仍处于ROMmon模式,请参阅ROMmon恢复过程。 |
路由器启动,但陷入启动模式(路由器(引导)>提示符)。 | 如果路由器停滞在引导模式下,则可能是Cisco IOS软件映像不存在或损坏。要解决此问题,您可能需要升级Cisco IOS软件映像。 |
软件和硬件都可能导致自发路由器重新启动/重新加载或崩溃。本文档仅介绍与硬件相关的崩溃。要确定问题是硬件相关还是软件相关,您需要crashinfo和控制台日志。
以下是硬件可能导致的崩溃示例:
奇偶校验错误 — 如果奇偶校验错误仅发生一次,则它被视为单事件翻转(SEU)。 您无需采取任何操作。在“提高网络可用性”(Inderging Network Availability)中,您可以找到有关单个事件升级的详细信息。如果路由器报告多个奇偶校验错误,则表明存在硬件问题。有关详细信息,请参阅处理器内存奇偶校验错误(PMPE)。
总线错误 — 软件或硬件可能导致这些类型的崩溃。请参阅总线错误故障排除,帮助确定是硬件还是软件导致了问题。
路由器挂起最常由软件问题引起。有关如何处理此问题的信息,请参阅排除路由器挂起故障。
当我们提到“系统崩溃”时,是指系统已经检测到某个不可恢复的错误并且已经重新启动的情况。软件问题、硬件问题或两者都可能导致崩溃。本部分介绍硬件引起的崩溃和与软件相关的崩溃,但可能被误认为硬件问题。
重要信息:如果在崩溃后重新加载路由器(例如,通过重新通电或使用reload命令),则有关崩溃的重要信息可能会丢失。在重新加载路由器之前,请尝试收集show technical-support和show log输出,以及crashinfo文件(如果可能)!
有关此问题的详细信息,请参阅排除路由器崩溃故障。
在某些情况下,处理器会尝试访问不存在(软件错误)或未正确响应(硬件问题)的内存位置。 在这些情况下,系统遇到总线错误。
要识别总线错误,请查看路由器(在尚未重新通电或手动重新加载的路由器中)提供的show version输出。
此处显示了总线错误崩溃的两个示例。
Router uptime is 2 days, 21 hours, 30 minutes System restarted by bus error at PC 0x30EE546, address 0xBB4C4 System image file is "flash:igs-j-l.111-24.bin", booted via flash .........
在总线错误期间,您可能在控制台提示符处看到以下错误消息:
*** System received a Bus Error exception *** signal= 0xa, code= 0x8, context= 0x608c3a50 PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
有关详细信息,请参阅排除总线错误崩溃故障。
表2列出了线卡问题的症状和建议措施:
表2 — 线卡问题的症状和建议操作症状 | 建议操作 |
---|---|
show diag输出显示插卡时为空插槽。 | 检验LED是否可见。如果LED不可见,请卸下并重新插入线卡,或尝试使用其他插槽。如果这不起作用,则可能是路由器或卡的硬件故障。请联系思科TAC获取进一步帮助。 |
未知线路卡。错误消息,例如: 00:00:06: %LC-3-LCCREATE: Unable to create driver for Line Card type 630 in slot 2 |
验证当前Cisco IOS软件版本是否支持线卡。为此使用软件顾问(仅限注册客户)工具。 |
show diag输出显示线卡是已停用的线卡。 | 如果show diag输出显示线路卡已停用,请验证当前Cisco IOS软件版本是否支持该线路卡。使用Software Advisor(仅限注册客户)工具执行此操作。 |
默认情况下,并行eXpress转发(PXF)处理器已启用。但是,如果您不确定或遇到PXF问题,请验证是否启用了思科快速转发和PXF。要使用PXF处理,必须启用IP思科快速转发交换。要验证此情况,请查看show running-config命令的输出。如果思科快速转发已启用,您会在配置输出中看到“ip cef”。如果PXF被禁用,您会在配置输出中看到“no ip pxf”。如果您未看到“no ip pxf”,则PXF已启用。
输入show c7300 pxf interface all命令,查看从该接口接收的数据包是经过PXF处理还是已丢弃。
Router# show c7300 pxf int all PXF-If: Y 00001 Gi0/0 (Up, Processing Input) !--- Processing input => PXF processed Features: in=CEF [0x208], out=None [0x0] qstatus=XON
为了进一步排除PXF故障,请查看show c7300 pxf accounting命令的输出,以验证哪些数据包进入和退出PXF处理器。
7300平台引入了基于命令行界面的线卡在线插拔(OIR)准备机制。您可以通过hw-module slot slot-number stop命令停止特定线卡流量、关闭所有接口并停用线卡。
当线路卡处于停用过程中时,请等待OIR LED呈绿色,然后发出与线路卡相关的任何命令。此外,如果线卡处于激活过程中,请等到OIR LED熄灭后再发出与卡相关的任何命令。
要从Cisco 7304路由器移除线卡而不中断数据流,请使用hw-module slot slot-number stop命令。此命令会停止流量,打开绿色OIR LED,并关闭所有线卡接口。当有活动流量时,请勿移除线卡。
stop关键字可停止通过线卡接口的流量并停用线卡。当OIR LED变为绿色时,线卡已停用,可以物理移除。
hw-module slot slot-number start命令可重新启动线卡并关闭OIR LED,并使卡重新联机。如果使用hw-module slot slot-number stop命令,请使用hw-module slot slot-number start命令重新激活线卡。您还可以使用hw-module slot slot-number start命令恢复因某些故障而已停用的线卡。如果在不使用hw-module slot slot-number start命令的情况下实际移除并重新插入该卡,您还可以重新激活线卡。
注:插入线卡时或系统启动后,线卡会自动初始化。您不需要发出hw-module slot slot-number start命令。
表3显示了7300的常见错误消息及其原因:
表3 - 7300路由器上的常见错误消息错误消息 | 原因 |
---|---|
Line card activation is in progress. Please retry the command later. |
如果已输入hw-module slot slot-number start命令,则忽略hw-module slot slot-number start命令的任何其他配置。 |
Line card deactivation is in progress. Please retry the command later. |
可以使用hw-module slot slot-number stop命令停用线卡。但是,如果在OIR LED变为绿色且停用过程完成之前发出hw-module slot slot-number start命令,您会看到此消息。 |
Command cannot be executed. Line card status is deactivated. |
如果线路卡已停用,您会看到此消息。忽略hw-module slot slot-number stop命令。 |
如果在执行上述故障排除步骤后仍需要帮助,您可以向Cisco TAC提交服务请求(仅限注册客户)。请务必包括以下信息: |
---|
注意:除非绝对必要,否则在收集上述信息之前,请勿手动重新加载或重新通电路由器。这可能导致确定问题根本原因所需的重要信息丢失。 |
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
06-Oct-2005 |
初始版本 |