本文为确定是否提供一般使用指南有Catalyst交换机的一个硬件故障。下面的清单适用于Catalyst 4500/4000,运行Cisco Catalyst OS (CatOS)软件的5500/5000和6500/6000系列交换机。目标是帮助Cisco用户识别基本硬件问题,或者在联系思科技术支持之前进行更多广泛的故障排除。
您可以也参考进一步协助的这些相关故障排除文档:
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
本文档没有任何特定的前提条件。
本文档中的信息根据在所有软件版本的可以使用的命令Catalyst的4500/4000, 5500/5000和6500/6000交换机。
对此的唯一的例外set test diaglevel命令,在CatOS软件版本5.4(1)介绍。
如果运行在Catalyst 6500/6000或Catalyst 4500/4000系列交换机的Cisco IOS软件,用于CatOS的显示和集命令不运作。然而,使用可比较的Cisco IOS软件命令,用于本文的步骤适用交换硬件,并且可以应用。
本文档中的信息都是基于特定实验室环境中的设备创建的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您是在真实网络上操作,请确保您在使用任何命令前已经了解其潜在影响。
下列是将协助解决收集必要的信息解决问题的一顺序的故障排除流程。完善范围的问题将节省在查找解决方案的用户的宝贵时间,并且在步骤后保证重的数据不会丢失。
查看输出show system命令所有失败的。状态域与在系统组件的多种LED关连。所有在系统的多种LED应该绿色。如果LED不绿色这可能指示失败。了解Catalyst交换机系列组件是重要的,并且什么LED告诉您确定组件是否失败。状态LED在Supervisor引擎指示Supervisor引擎是否通过所有诊断测试。Supervisor引擎包含系统运行软件。如果有与系统软件的困难请检查Supervisor引擎。有开放一个的控制台会话并且确定Supervisor引擎是否在引导程序或ROM监控器(ROMMON)模式。如果交换机在引导程序或ROMmon模式被滞留,请遵从在运行CatOS的恢复Catalyst交换机的故障排除步骤从启动失败文档。
show system命令将提供您重要的环境和系统信息Catalyst交换机的。命令输出也显示正常运行,是时间交换机是正在运行的。此信息是有用的在确定交换机故障可能发生的时间。
如果有输出一show system命令从您的Cisco设备,您能使用Output Interpreter (仅限注册用户)显示潜在问题和修正。
示例输出
Console (enable) show systemPS1-Status PS2-Status ---------- ---------- ok none Fan-Status Temp-Alarm Sys-Status Uptime d,h:m:s Logout---------- ---------- ---------- -------------- ---------faulty off faulty 18,22:37:24 20 minPS1-Type PS2-Type ------------ ------------ WS-CAC-1300W none Modem Baud Traffic Peak Peak-Time------- ----- ------- ---- -------------------------disable 9600 0% 0% Fri May 24 2002, 07:04:29PS1 Capacity: 1153.32 Watts (27.46 Amps @42V)System Name System Location System Contact CC------------------------ ------------------------ ------------------------ --- Console (enable)
注意: 如果任何失败发生类似以上有故障的风扇状态,请检查风扇组件和电源所有问题的。
PS -状态:指示电源的状况在机箱的。失败PS或PS没有被提供的电源也许指示Supervisor Engine模块的(有故障的系统状态一失败)。如果交换机有橙色系统LED和PS--Status有故障这不一定含义电源或交换机有故障。这是可能的暗示一个电源未正确地插入或不可以接通。
注意: Catalyst 4006要求两个电源安装的操作交换机和冗余的一个额外电源。欲知更多信息,请查看Catalyst 4000家族交换机文档的关键特性的Standard Equipment部分。
风扇状态:如果这指示一问题,系统也许变得过度加热并且引起问题由于交换机的操作。
系统状态:指示是否有在系统检测的任何失败。
流量&高峰:这给予负载的征兆在Catalyst背板的。当网络运行通常不出任何问题时,请监控此利用率。以后,当问题在网络也许发生,正常操作的结果也许用于比较,如果,例如,生成树协议环路、广播风暴,或者生成很多流量事件的其他类型可能促成其它设备体验运行缓慢。
通过发出show test mod命令查看怀疑的失败模块的输出。
注意: show test命令可能显示您diaglevel条目。如果此diaglevel设置绕过或最小,您能通过发出set test diaglevel complete命令和重置模块更改此,以便自检发生。set test diaglevel complete命令执行所有自检联机,而最小和旁路选项未参加某些或所有测验。
如果在输出看到F show test命令中,这表明这部分也许遭受硬件故障。
示例 1:Catalyst 4000
Galaxy> (enable) show test 1 Diagnostic mode (mode at next reset: complete) Module 1 : 2-port 1000BaseX Supervisor POST Results Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) Galaxy Supervisor Status : . CPU Components Status Processor : . DRAM : . RTC : . EEPROM : . FLASH : . NVRAM : . Temperature Sensor : . Uplink Port 1 : . Uplink Port 2 : . Me1 Status : . EOBC Status : . SCX1000 - 0 Register : . Switch Sram : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 1 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . SCX1000 - 2 Register : . Switch SRAM : . Switch Gigaports 0: . 1: . 2: . 3: . 4: . 5: . 6: . 7: . 8: . 9: . 10: . 11: . Galaxy> (enable) show test 5 Diagnostic mode (mode at next reset: complete) Module 5 : 14-port 1000 Ethernet Status: (. = Pass, F = Fail, U = Unknown) Eeprom: . NICE Regs: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . NICE SRAM: Ports 1-4 : . Ports 5-8 : . Ports 9-12 : . 1000Base Loopback Status: Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ----------------------------------------- . . . . . . . . . . . . . .
示例 2:Catalyst 5000
Sacal> show test 1 Module 1 : 2-port 100BaseFX MM Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . MCP Comm: . EARL Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . MonitorTest . DontLearn: . FlushPacket: . ConditionalLearn: . EarlLearnDiscard: . EarlTrapTest: . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) CPU : . Sprom : . Bootcsum : . Archsum : N RAM : . LTL : . CBL : . DPRAM : . SAMBA : . Saints : . Pkt Bufs : . Repeater : N FLASH : N MII Status: Ports 1 2 ----------- N N SAINT/SAGE Status : Ports 1 2 3 -------------- . . . Packet Buffer Status : Ports 1 2 3 -------------- . . . Loopback Status [Reported by Module 1] : Ports 1 2 3 -------------- . . . Channel Status : Ports 1 2 ----------- . .
示例 3:Catalyst 6500
tamer>(enable) show test 1 Diagnostic mode: complete (mode at next reset: minimal) Module 1 : 2-port 1000BaseX Supervisor Network Management Processor (NMP) Status: (. = Pass, F = Fail, U = Unknown) ROM: . Flash-EEPROM: . Ser-EEPROM: . NVRAM: . EOBC Comm: . Line Card Status for Module 1 : PASS Port Status : Ports 1 2 ----------- . . Line Card Diag Status for Module 1 (. = Pass, F = Fail, N = N/A) Module 1 Earl V Status : NewLearnTest: . IndexLearnTest: . DontForwardTest: . DontLearnTest: . ConditionalLearnTest: . BadBpduTest: . TrapTest: . MatchTest: . SpanTest: . CaptureTest: . ProtocolMatchTest: . IpHardwareScTest: . IpxHardwareScTest: . MultipleRoutersScTest: . L3DontScTest: . L3RedirectTest: . L3Capture2Test: . L3VlanMetTest: . AclPermitTest: . AclDenyTest: . Loopback Status [Reported by Module 1] : Ports 1 2 ----------- . . Channel Status : Ports 1 2 ----------- . . InlineRewrite Status : Ports 1 2 ----------- . . tamer>(enable) show test 3 Diagnostic mode: complete (mode at next reset: minimal) Module 3 : 48-port 10/100BaseTX Ethernet Line Card Status for Module 3 : PASS Port Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ------------------------------------------------------------------------ . . . . . . . . . . . . . . . . . . . . . . . . Line Card Diag Status for Module 3 (. = Pass, F = Fail, N = N/A) Loopback Status [Reported by Module 1] : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Channel Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . InlineRewrite Status : Ports 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . . Ports 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 ----------------------------------------------------------------------------- . . . . . . . . . . . . . . . . . . . . . . . .
查看输出show logging buffer命令在您遇到交换机故障的时间附近显示的所有错误消息的。
Catalyst交换机可能显示指示在交换机发生了的所有事件的消息。查看此输出并且检查在消息和恢复流程文档显示的所有消息的含义。这能给予您什么的征兆在失败时正确地出了错,并且使您验证问题是否是涉及的硬件或软件。请使用错误消息解码器(仅限注册用户)工具帮助解密所有消息输出。
示例输出
Syslog可能给予以下错误消息:
SYS-2-FAN_FAIL: Fan failedSYS-2-MOD_TEMPMINORFAIL: Module 2 minor temperature threshold exceeded
如果我们查寻在消息和恢复流程的消息,我们看到第一条消息指示一个或更多风扇的失败在系统的。这由消息跟随模块2检测温度在模块2.在这种情况下上升了,您需要检查风扇模块为了解决问题。
除检查错误消息之外,它是好想法使用Bug Toolkit (仅限注册用户)发现是否有任何问题用软件版本。show version命令将提供软件版本信息使用bug搜索。
例如,如果在show log命令输出中识别一例外,请使用Bug Toolkit (仅限注册用户)搜索在您的Catalyst平台、软件版本和例外的Bug从show log。
检查您有问题与和软件版本您通过发出show version命令使用模块的型号。确定总动态随机访问存储器(DRAM)和总闪存。请使用软件顾问(仅限注册用户)或产品概述特定平台确定硬件是否是与软件兼容。
此命令验证您运行的软件版本。此命令也有关于大小的信息闪存和DRAM。如果需要升级,这是有用的信息。
示例输出
Console (enable) show versionWS-C6509 Software, Version NmpSW: 5.5(5)Copyright (c) 1995-2000 by Cisco SystemsNMP S/W compiled on Dec 14 2000, 17:05:38System Bootstrap Version: 5.3(1)Hardware Version: 2.0 Model: WS-C6509 Serial #: SCA0412024UMod Port Model Serial # Versions--- ---- ------------------- ----------- --------------------------------------1 2 WS-X6K-SUP1A-2GE SAD04281END Hw : 3.2 Fw : 5.3(1) Fw1: 5.4(2) Sw : 5.5(5) Sw1: 5.5(5) WS-F6K-PFC SAD04340506 Hw : 1.13 8 WS-X6408-GBIC SAD0415009A Hw : 2.4 Fw : 5.1(1)CSX SW : 5.5(5)4 48 WS-X6348-RJ-45 SAL0446200S Hw : 1.4 Fw : 5.4(2) SW : 5.5(5)15 1 WS-F6K-MSFC SAD04120BNJ Hw : 1.4 Fw : 12.1(8a)E2 SW : 12.1(8a)E2 DRAM FLASH NVRAMModule Total Used Free Total Used Free Total Used Free------ ------- ------- ------- ------- ------- ------- ----- ----- -----1 65408K 37463K 27945K 16384K 15673K 711K 512K 236K 276KUptime is 18 days, 21 hours, 54 minutesConsole (enable)
如果升级要求,首先总是请检查版本注释特定平台并且选择您需要升级的版本。
如果有问题多个端口,请尝试启用或禁用问题端口。端口可以是启用或禁用的通过发出set port {enable (event)|mod/port命令的禁用}。
在某些状况下, Catalyst交换机也许遇到问题用一个端口。禁用和重新激活此特定端口也许解决问题。
注意: 由禁用的或启用的端口,您可以也触发在设备的一些事件连接对该端口(例如重新启动在卡住)的服务器的一进程。在大多数情况下,当禁用和重新启用端口解决您的问题,这意味着问题不是涉及的硬件。如果这解决问题,重置此线卡在维护窗口期间,以便自检发生。
如果有在一个特定端口的问题,请尝试移动对另一个端口的连接。请使用您知道工作和连接它到失败端口的一个站点。
如果禁用和重新激活端口上一步操作没有清楚问题,切换对一个不同的端口的连接同一个模块的(与相同的配置)。如果这解决问题,这表明硬件故障也许已经发生了。如果问题持续,可能归结于连接的设备的配置。验证端口速度和双工设置是相同的在交换机端口和连接的设备。
例如,站点连接对模块的7端口1继续上升和下降。尝试交换端口1和在同一个模块的端口2连接(确保该端口1和端口2有相同的配置)。如果问题在端口2不再发生,但是端口的1站点当前开始飘荡,这指向一问题与端口1。如果问题跟随对端口2,这可能指示与配置、连接的设备或者电缆问题的一个可能的问题。
有开放一个的控制台会话并且捕获启动Power On Self Test (POST)诊断和所有系统错误消息。通过发出reset mod命令重置模块。
在重置模块以后,如果线卡回来联机,并且所有端口通过他们的诊断测试,并且流量开始通过,模块问题很可能归结于软件问题。发出show test mod命令确定此模块是否通过所有其在启动的诊断测试。注释失败结果的所有F。
去除模块并且检查它管脚。要重新安装模块,请稳固地按弹出控制杆,并且拧紧安装螺丝。
在一些情况下,没有插好的卡可能会导致类似于硬件故障的症状。没有插好的线路卡可能会导致背板上的流量被损坏,这可能导致在Catalyst机箱上出现不同的问题。例如,如果一个模块损坏了Catalyst背板上的业务,则这就有可能导致这个模块本身和其它模块的自检无法通过。重新安装所有的卡可以解决这个问题,并且成功通过自检。
尝试删除所有在机箱的线卡,除了激活的Supervisor引擎模块和问题模块,确定失败您是否遇到更改。如果失败继续,请移动线卡向在机箱的一个已知工作槽。
注意: 如果模块是不同种模块,请保存您的配置并且发出clear config module命令。
如果其中一在机箱的线卡有故障,能导致其他线卡的一失败。在那种情况下,删除一个卡能解决在其他卡看到的问题。如果模块仍然失败,在您删除所有其他线卡并且移动线卡向另一slot后,这可能表明线卡有故障。如果另一交换机是可用的,请设法在另一个机箱的模块根本地确定它是否是模块或机箱问题。
如果模块看上去通常操作和通过流量在删除另外的模块和移动模块以后对另一slot,这可能指示一个可能的问题用机箱。在其原始位置尝试放置模块上一步并且确定失败是否回来。如果模块在原始位置看上去通常操作和通过流量,这可能指示软件问题。请使用Bug Toolkit (仅限注册用户)搜索在Catalyst平台、软件版本和您经历的错误的Bug。
删除Supervisor引擎并且为管脚检查。重新安装Supervisor引擎,稳固地按弹出控制杆,并且拧紧非脱落型安装螺丝。对于Catalyst 5500及6000系列交换机, Supervisor引擎在slot 1和2.可以安装。要消除slot从属关系问题,请移动Supervisor引擎向Supervisor Engine模块的另一slot联机。Catalyst 5500及6000系列交换机也支持允许交换机有双重Supervisor引擎的冗余。如果运行双重Supervisor引擎,请设法强加对备用Supervisor引擎的一个切换通过拔掉激活的Supervisor引擎或通过发出reset mod命令。关于slot Supervisor引擎需求的更多信息,参考这些链路:
有开放一个的控制台会话并且捕获启动POST诊断和所有系统错误消息。等待Supervisor引擎初始化。如果show system命令sys-status有故障, Supervisor引擎失败。
检查什么在失败时发生。
如果失败继续再发生,请调查发生何事在那个时候和地方。这也许给予您征兆至于什么发生在造成它的Catalyst交换机外面发生故障。例如,电源的一个短的中断,可能是闪烁在建立的灯。