此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档介绍如何对运行Cisco IOS®系统软件的Catalyst 6500/6000交换机上的硬件和相关常见问题进行故障排除。
本文档没有任何特定的要求。
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
Cisco IOS 软件是指用于 Supervisor 引擎和 Multilayer Switch Feature Card (MSFC) 模块的单个打包的 Cisco IOS 映像。本文档假设您遇到了某个问题,并且希望获得有关该问题的其他信息或者希望解决该问题。本文档适用于基于 Supervisor 引擎 1、2 或 720 的 Catalyst 6500/6000 交换机。
如果控制台日志记录已启用,则系统信息显示在控制台上,或者如果 syslog 已启用,则系统信息显示在 syslog 中。某些消息仅供参考,并不指示错误条件。有关系统错误消息的概述,请参阅系统消息概述。 启用适当级别的日志记录,并配置交换机以将消息记录到syslog服务器。有关更多配置信息,请参阅配置路由器和交换机设备文档。
要监控已记录的消息,请发出show logging命令或使用工具定期监控工作站。 如果仍然无法确定问题,或者如果文档中没有列出您遇到的错误消息,请联系 Cisco 技术支持上报中心。
Catalyst 6500的控制台上出现错误消息%CONST_DIAG-SP-4-ERROR_COUNTER_WARNING: Module 4 Error counter exceeds threshold。此问题可能有两个原因:
与背板的连接不良(弯曲连接器引脚或电连接不良),或
这可能与故障模块的第一个指示有关。
为了解决此问题,请将诊断引导级别设置为“完成”,然后牢固地重新将模块4插入机箱。这样可以捕获任何潜在的硬件故障,还可以解决任何背板连接问题。
show diagnostic sanity 命令对配置和某些系统状态组合进行一组预定检查。然后,该命令编译警告条件的列表。这些检查旨在查找任何可能不恰当的配置和系统状态。这些检查旨在帮助进行故障排除,维护系统的健全性。该命令不会修改任何当前变量或系统状态。它读取与配置和状态相对应的系统变量,以便在与一组预定组合相匹配时发出警告。该命令不影响交换机功能,并且可以在生产网络环境中使用。运行过程中的唯一限制是,该命令在访问引导映像并测试其有效性时,会将文件系统保留一段有限的时间。Cisco IOS 软件版本 12.2(18)SXE1 或更高版本支持该命令。
此命令有助于检查看似有效但可能产生负面影响的参数的配置。在以下情况下警告用户:
中继 - 中继模式为“on”或者如果端口在“auto”模式下中继。中继端口已设置为所需的模式但并不在中继,或者如果中继端口协商为半双工。
建立信道 - 建立信道模式为“on”,或者如果端口不在建立信道并且已设置为所需模式。
生成树 (Spanning Tree) - 以下选项之一已设置为默认:
根最大老化时间
根转发延迟
最大老化时间
最长转发延迟
hello 时间
端口成本
端口优先级
或者,如果没有为 VLAN 设置生成树 (spanning tree) 根。
UDLD - 端口的单向链路检测 (UDLD) 已禁用、已关闭或处于不确定状态。
流控制和PortFast -端口已禁用接收流控制,或者如果PortFast已启用。
高可用性 - 存在冗余 Supervisor 引擎,但高可用性 (HA) 已禁用。
引导字符串和引导配置寄存器- 引导字符串为空,或者其中已指定为引导映像的文件无效。配置寄存器不包括 0x2、0x102 或 0x2102。
IGMP 监听 - Internet 组管理协议 (IGMP) 监听已禁用。此外,如果IGMP监听已禁用,但路由器端口组管理协议(RGMP)已启用,并且组播已全局启用但在接口上已禁用。
SNMP 社区访问字符串 - 访问字符串(rw、ro、rw-all)已设置为默认。
端口- 端口协商为半双工或具有双工/VLAN不匹配。
内联电源端口 - 内联电源端口处于以下任一状态:
denied(拒绝)
故障
other(其他)
off
模块 - 模块未处于“OK”状态。
测试 - 列出启动时失败的系统诊断测试。
Default gateway(s) unreachable -对默认网关执行Ping操作,以便列出不可达的默认网关。
检查 bootflash 是否已正确格式化且是否有足够空间存放 crashinfo 文件。
以下是输出示例:
注意:实际输出可能因软件版本而异。
Switch#show diagnostic sanity Status of the default gateway is: 10.6.144.1 is alive The following active ports have auto-negotiated to half-duplex: 4/1 The following vlans have a spanning tree root of 32k: 1 The following ports have a port cost different from the default: 4/48,6/1 The following ports have UDLD disabled: 4/1,4/48,6/1 The following ports have a receive flowControl disabled: 4/1,4/48,6/1 The value for Community-Access on read-only operations for SNMP is the same as default. Please verify that this is the best value from a security point of view. The value for Community-Access on read-write operations for SNMP is the same as default. Please verify that this is the best value from a security point of view. The value for Community-Access on read-write-all operations for SNMP is the same as default. Please verify that this is the best value from a security point of view. Please check the status of the following modules: 8,9 Module 2 had a MINOR_ERROR. The Module 2 failed the following tests: TestIngressSpan The following ports from Module2 failed test1: 1,2,4,48
请参阅软件配置指南的show diagnostic sanity部分。
如果交换机 Supervisor 引擎 LED 为红色,或状态显示 faulty,则可能存在硬件问题。您可能收到类似以下内容的系统错误消息:
%DIAG-SP-3-MINOR_HW: Module 1: Online Diagnostics detected Minor Hardware Error
使用以下步骤进一步排除故障:
通过控制台进入Supervisor引擎并发出show diagnostic module {1 | 2} 命令(如有可能)。
注意:必须将诊断级别设置为完全,以便交换机可执行一整套测试,从而识别所有硬件故障。执行完全在线诊断测试使启动时间稍有延长。最小级别下的启动时间比完全级别下的启动时间短,但仍会检测卡上的潜在硬件问题。发出diagnostic bootup level 全局配置命令可在诊断级别之间切换。在Cisco IOS系统软件上,默认诊断级别是最小。
注意:运行Cisco IOS软件的基于Supervisor引擎1的系统不支持在线诊断。
以下输出显示故障示例:
Router#show diagnostic mod 1 Current Online Diagnostic Level = Complete Online Diagnostic Result for Module 1 : MINOR ERROR Test Results: (. = Pass, F = Fail, U = Unknown) 1 . TestNewLearn : . 2 . TestIndexLearn : . 3 . TestDontLearn : . 4 . TestConditionalLearn : F 5 . TestBadBpdu : F 6 . TestTrap : . 7 . TestMatch : . 8 . TestCapture : F 9 . TestProtocolMatch : . 10. TestChannel : . 11. IpFibScTest : . 12. DontScTest : . 13. L3Capture2Test : F 14. L3VlanMetTest : . 15. AclPermitTest : . 16. AclDenyTest : . 17. TestLoopback: Port 1 2 ---------- . . 18. TestInlineRewrite: Port 1 2 ---------- . .
如果通电诊断返回 failure(测试结果中以 F 表示),请完成以下步骤:
将模块重新安装牢固并确保螺钉已拧紧。
将模块移动到相同机箱或不同机箱上已知良好且功能正常的插槽。
注意:Supervisor引擎1或2只能插入插槽1或插槽2。
进行故障排除以消除模块有故障的可能性。
注意:在极少数情况下,有故障的模块可能导致Supervisor引擎报告为faulty(错误)。
要消除这种可能性,请执行以下步骤之一:
如果最近插入了某个模块后 Supervisor 引擎开始报告问题,请移除上次插入的模块并重新安装牢固。如果仍然收到指示 Supervisor 引擎为 faulty 的消息,请拆除该模块后重新引导交换机。如果 Supervisor 引擎正常运行,则可能是该模块有故障。检查该模块上的底板连接器,确保没有损坏。如果没有看见损坏,请尝试将该模块安装在其他插槽或不同机箱中。此外,请检查底板上的插槽连接器上有无弯曲的引脚。检查机箱底板上的连接器引脚时,请使用手电筒(如有必要)。如果仍需帮助,请联系 Cisco 技术支持。
如果最近未添加任何模块,并且更换 Supervisor 引擎未解决问题,则可能是因为模块安装不正确或者有故障。要进行故障排除,请将机箱上除 Supervisor 引擎以外的所有模块全部移除。将机箱通电,确保 Supervisor 引擎无故障启动。如果 Supervisor 引擎启动时未发生任何故障,请开始插入模块,每次插入一个,直到确定有故障的模块。如果 Supervisor 引擎没有再出现故障,则可能是因为某一个模块之前安装不正确。观察交换机,如果仍然出现问题,请向 Cisco 技术支持提出服务请求,以进行进一步的故障排除。
依次执行上述各步骤后,请发出show diagnostic module <module_number> 命令。观察模块是否仍然显示 failure status。如果仍然出现failure 状态,请捕获之前步骤中的日志并向Cisco技术支持提出服务请求,以获取进一步协助。
注意:如果运行的是Cisco IOS软件版本12.1(8)系列,则不完全支持诊断。当诊断已启用时,您将收到错误的故障消息。Cisco IOS 软件版本 12.1(8b)EX4 及更高版本支持诊断,而对于基于 Supervisor 引擎 2 的系统,Cisco IOS 软件版本 12.1(11b)E1 及更高版本支持诊断。此外,有关详细信息,请参阅Field Notice:Cisco IOS软件版本12.1(8b)EX2和12.1(8b)EX3中错误启用的诊断。
在引导序列过程中,如果交换机未引导且无法进行自我诊断,请获取输出并向Cisco技术支持提出服务请求,以获取进一步帮助。
如果在引导序列或 show diagnostics module {1 | 2}命令的输出中未发现任何硬件故障,请发出show environment status和show environment temperature命令,以查看与环境条件相关的输出并查找其他任何有故障的组件。
cat6knative#show environment status backplane: operating clock count: 2 operating VTT count: 3 fan-tray 1: fan-tray 1 fan-fail: OK VTT 1: VTT 1 OK: OK VTT 1 outlet temperature: 35C VTT 2: VTT 2 OK: OK VTT 2 outlet temperature: 31C VTT 3: VTT 3 OK: OK VTT 3 outlet temperature: 33C clock 1: clock 1 OK: OK, clock 1 clock-inuse: in-use clock 2: clock 2 OK: OK, clock 2 clock-inuse: not-in-use power-supply 1: power-supply 1 fan-fail: OK power-supply 1 power-output-fail: OK module 1: module 1 power-output-fail: OK module 1 outlet temperature: 28C module 1 device-2 temperature: 32C RP 1 outlet temperature: 34C RP 1 inlet temperature: 34C EARL 1 outlet temperature: 34C EARL 1 inlet temperature: 28C module 3: module 3 power-output-fail: OK module 3 outlet temperature: 39C module 3 inlet temperature: 23C EARL 3 outlet temperature: 33C EARL 3 inlet temperature: 30C module 4: module 4 power-output-fail: OK module 4 outlet temperature: 38C module 4 inlet temperature: 26C EARL 4 outlet temperature: 37C EARL 4 inlet temperature: 30C module 5: module 5 power-output-fail: OK module 5 outlet temperature: 39C module 5 inlet temperature: 31C module 6: module 6 power-output-fail: OK module 6 outlet temperature: 35C module 6 inlet temperature: 29C EARL 6 outlet temperature: 39C EARL 6 inlet temperature: 30C
如果发现任何系统组件(风扇、电压终端 [VTT])故障,请向 Cisco 技术支持提出服务请求,并提供命令输出。
对于任何模块,如果您在此输出中看到失败状态,请发出hw-module module <module_number> reset 命令。或者,请将模块重新安装在相同或不同的插槽中,尝试恢复该模块。此外,请参阅本文档的对不在线或者显示为faulty或other状态的模块进行故障排除部分,以获取进一步协助。
如果状态指示 OK(正如步骤 3 中的示例输出所示),请发出 show environment alarms 命令,以检查是否有环境警报。
如果没有警报,输出将如下所示:
cat6knative#show environment alarm environmental alarms: no alarms
但是,如果有警报,输出将如下所示:
cat6knative#show environment alarm environmental alarms: system minor alarm on VTT 1 outlet temperature (raised 00:07:12 ago) system minor alarm on VTT 2 outlet temperature (raised 00:07:10 ago) system minor alarm on VTT 3 outlet temperature (raised 00:07:07 ago) system major alarm on VTT 1 outlet temperature (raised 00:07:12 ago) system major alarm on VTT 2 outlet temperature (raised 00:07:10 ago) system major alarm on VTT 3 outlet temperature (raised 00:07:07 ago)
Missing
中如果交换机Supervisor引擎处于连续 booting
在ROM监控器(ROMmon)模式下循环,或没有系统映像,问题很可能不是硬件问题。
Supervisor引擎进入ROMmon模式或在系统映像损坏或 missing
时无法启动。有关如何恢复Supervisor引擎的说明,请参阅从损坏或
引导加载程序映像或ROMmon模式中恢复运行Cisco IOS系统软件的Catalyst 6500/6000。 Missing
您可以从Sup-bootflash:或slot0:(PC卡插槽)启动Cisco IOS映像。请在两台设备中都保存一份系统映像的副本,以实现更快的恢复。如果您的 Supervisor 引擎 2 bootflash 设备只有 16 MB,则有必要升级到 32 MB 才能支持更新的系统映像。有关详细信息,请参阅 Catalyst 6500 系列 Supervisor 引擎 2 Boot ROM 和 Bootflash 设备升级安装说明。
本部分简要介绍备用 Supervisor 引擎模块无法联机的常见原因,以及如何解决每一个问题。您可以使用以下方式之一来判断 Supervisor 引擎模块是否已联机:
show module 命令的输出显示状态为 other 或 faulty。
状态 LED 呈现琥珀色。
常见原因/解决方案
通过控制台连接到备用Supervisor引擎,以确定其是否处于ROMmon模式或连续重新启动。如果 Supervisor 引擎处于上述状态之一,请参阅从损坏或丢失的引导加载程序映像或 ROMmon 模式中恢复运行 Cisco IOS 系统软件的 Catalyst 6500/6000。
注意:如果活动和备用Supervisor引擎运行的版本不同,则备用引擎可能无法联机。例如,在以下情况下 Supervisor 引擎可能无法联机:
活动 Supervisor 引擎运行 Route Processor Redundancy Plus (RPR+) 模式。
注意:RPR+模式在Cisco IOS软件版本12.1[11]EX及更高版本中可用。
而备用 Supervisor 引擎运行的软件版本不支持 RPR/RPR+ 模式,例如 Cisco IOS 软件版本 12.1[8b]E9。
在这种情况下,第二个Supervisor引擎无法联机,因为默认情况下冗余模式是增强型高系统可用性(EHSA)。备用 Supervisor 引擎无法与活动 Supervisor 引擎进行协商。请确保备用 Supervisor 引擎和活动 Supervisor 引擎运行相同的 Cisco IOS 软件级别。
此输出显示插槽 2 中的 Supervisor 引擎处于 ROMmon 模式。您必须通过控制台连接到备用Supervisor引擎才能将其恢复。有关恢复过程,请参阅从损坏或丢失的引导加载程序映像或 ROMmon 模式中恢复运行 Cisco IOS 系统软件的 Catalyst 6500/6000。
tpa_data_6513_01#show module Mod Ports Card Type Model Serial No. --- ----- -------------------------------------- ------------------ ----------- 1 2 Catalyst 6000 supervisor 2 (Active) WS-X6K-S2U-MSFC2 SAD0628035C 2 0 Supervisor-Other unknown unknown 3 16 Pure SFM-mode 16 port 1000mb GBIC WS-X6816-GBIC SAL061218K3 4 16 Pure SFM-mode 16 port 1000mb GBIC WS-X6816-GBIC SAL061218K8 5 0 Switching Fabric Module-136 (Active) WS-X6500-SFM2 SAD061701YC 6 1 1 port 10-Gigabit Ethernet Module WS-X6502-10GE SAD062003CM Mod MAC addresses Hw Fw Sw Status --- ---------------------------------- ------ ------------ ------------ ------- 1 0001.6416.0342 to 0001.6416.0343 3.9 6.1(3) 7.5(0.6)HUB9 Ok 2 0000.0000.0000 to 0000.0000.0000 0.0 Unknown Unknown Unknown 3 0005.7485.9518 to 0005.7485.9527 1.3 12.1(5r)E1 12.1(13)E3, Ok 4 0005.7485.9548 to 0005.7485.9557 1.3 12.1(5r)E1 12.1(13)E3, Ok 5 0001.0002.0003 to 0001.0002.0003 1.2 6.1(3) 7.5(0.6)HUB9 Ok 6 0002.7ec2.95f2 to 0002.7ec2.95f2 1.0 6.3(1) 7.5(0.6)HUB9 Ok Mod Sub-Module Model Serial Hw Status --- --------------------------- --------------- --------------- ------- ------- 1 Policy Feature Card 2 WS-F6K-PFC2 SAD062802AV 3.2 Ok 1 Cat6k MSFC 2 daughterboard WS-F6K-MSFC2 SAD062803TX 2.5 Ok 3 Distributed Forwarding Card WS-F6K-DFC SAL06121A19 2.1 Ok 4 Distributed Forwarding Card WS-F6K-DFC SAL06121A46 2.1 Ok 6 Distributed Forwarding Card WS-F6K-DFC SAL06261R0A 2.3 Ok 6 10GBASE-LR Serial 1310nm lo WS-G6488 SAD062201BN 1.1 Ok
确保 Supervisor 引擎模块正确连接到底板连接器。另外,请确保Supervisor引擎安装螺钉已完全拧紧。有关详细信息,请参阅 Catalyst 6500 系列交换机模块安装说明。
要确定备用 Supervisor 引擎是否为 faulty,请从活动 Supervisor 引擎发出 redundancy reload peer 命令。通过连接到备用 Supervisor 引擎的控制台观察引导序列,以确定是否存在任何硬件故障。
如果备用Supervisor引擎仍然无法联机,请向Cisco技术支持提出服务请求以进一步排除故障。创建服务请求时,请提供从之前步骤中收集的交换机输出的日志。
因为 PA-1XCHSTM1/OC3 的 SRB 中不支持诊断,所以会出现此错误消息。发送此命令时,如果交换机运行 SRB 代码,则将显示不适用状态。这并不是说SPA接口处理器的状态未被检查,因为整体诊断结果正确。此输出从 SRC 代码开始起作用。此漏洞是由SRB代码的Bug导致的,此Bug在思科漏洞ID CSCso02832 (仅限注册的思科客户端访问)中归档。
本部分讨论 Catalyst 交换机备用 Supervisor 意外重新加载的常见原因。
同步启动配置失败后,活动 Supervisor 重置备用 Supervisor。问题的原因可能是管理站在短时间(1-3 秒)内连续执行 wr mem,这样便锁定了启动配置并导致同步失败。如果第一个同步进程还没有完成就发出了第二个 wr mem,备用 Supervisor 上将出现同步故障,有时备用 Supervisor 还会重新加载或重置。此问题记录在Cisco Bug ID CSCsg24830(仅限注册的思科客户端访问)中。该同步故障可通过以下错误消息确定:
%PFINIT-SP-5-CONFIG_SYNC: Sync'ing the startup configuration to the standby Router %PFINIT-SP-1-CONFIG_SYNC_FAIL: Sync'ing the startup configuration to the standby Router FAILED
活动Supervisor不会将其配置与备用Supervisor同步。此情况可能是由于其他进程临时使用配置文件而导致的临时情况。如果输入show configuration命令或show running-configuration命令查看配置或运行配置,则配置文件会锁定。此问题记录在Cisco Bug ID CSCeg21028(仅限注册的思科客户端访问)中。该同步故障可通过以下错误消息确定:
%PFINIT-SP-1-CONFIG_SYNC_FAIL_RETRY: Sync'ing the startup configuration to the standby Router FAILED, the file may be already locked by a command
当您从机箱中以物理方式移除模块时,插槽中模块的配置仍然显示。此问题是设计导致的,因为此设计使模块的更换变得更为简单。如果在插槽中插入相同类型的模块,交换机将使用之前在插槽中的模块配置。如果将其他类型的模块插入插槽,则会清除模块配置。要在模块从插槽中取出时自动删除配置,请在全局配置模式下发出module clear-config命令。确保在模块从插槽中移除之前发出命令。该命令不会清除已从插槽中删除的模块的旧配置。此命令会清除show running-config命令输出中的模块配置和show ip interface brief命令输出中的接口详细信息。从Cisco IOS版本12.2(18)SXF及更高版本中,它还从show version命令删除接口类型计数。
如果交换机在没有任何人工干预的情况下自行重置,请使用以下步骤来识别问题:
交换机可能发生了软件崩溃。发出dir bootflash: 命令,该命令显示MSFC(路由处理器[RP]) bootflash设备,并发出dir slavebootflash: 命令,以检查软件是否崩溃。
本部分中的输出显示crashinfo已记录在RP bootflash:中。确保所查看的 crashinfo 涉及最近的故障。发出more bootflash:filename 命令以显示crashinfo文件。在本示例中,该命令是more bootflash:crashinfo_20020829-112340。
cat6knative#dir bootflash: Directory of bootflash:/ 1 -rw- 1693168 Jul 24 2002 15:48:22 c6msfc2-boot-mz.121-8a.EX 2 -rw- 183086 Aug 29 2002 11:23:40 crashinfo_20020829-112340 3 -rw- 20174748 Jan 30 2003 11:59:18 c6sup22-jsv-mz.121-8b.E9 4 -rw- 7146 Feb 03 2003 06:50:39 test.cfg 5 -rw- 31288 Feb 03 2003 07:36:36 01_config.txt 6 -rw- 30963 Feb 03 2003 07:36:44 02_config.txt 31981568 bytes total (9860396 bytes free)
dir sup-bootflash:命令显示Supervisor引擎bootflash:设备。您还可以发出dir slavesup-bootflash:命令,以显示备用Supervisor引擎bootflash:设备。此输出显示Supervisor引擎bootflash: device:中记录的crashinfo
cat6knative11#dir sup-bootflash: Directory of sup-bootflash:/ 1 -rw- 14849280 May 23 2001 12:35:09 c6sup12-jsv-mz.121-5c.E10 2 -rw- 20176 Aug 02 2001 18:42:05 crashinfo_20010802-234205 !--- Output suppressed.
如果命令输出表明在您怀疑交换机重新引导发生了软件崩溃,请与 Cisco 技术支持联系。 提供 show tech-support 命令和 show logging 命令的输出以及 crashinfo 文件的输出。要发送文件,请通过TFTP从交换机传输到TFTP服务器,然后将文件附加到案例。
如果没有crashinfo文件,请检查交换机的电源以确保它没有发生故障。如果使用不间断电源 (UPS),请确保其工作正常。如果仍然无法确定问题,请与Cisco技术支持上报中心联系。
如果配有分布式转发卡(DFC)的模块在没有用户重新加载的情况下自行重置,请检查DFC卡的bootflash以查看其是否崩溃。如果提供了故障信息文件,则可以找出故障的原因。发出dir dfc#module_#-bootflash:命令以验证是否存在崩溃信息文件以及何时写入该文件。如果DFC重置与crashinfo的时间戳相符,请发出more dfc#module_#-bootflash:filename 命令。或者,发出copy dfc#module_#-bootflash:filename tftp 命令以通过TFTP将文件传输到TFTP服务器。
cat6knative#dir dfc#6-bootflash: Directory of dfc#6-bootflash:/ -#- ED ----type---- --crc--- -seek-- nlen -length- -----date/time------ name 1 .. crashinfo 2B745A9A C24D0 25 271437 Jan 27 2003 20:39:43 crashinfo_ 20030127-203943
有了可用的 crashinfo 文件之后,收集 show logging 命令和 show tech 命令的输出,并与 Cisco 技术支持联系以获得进一步的帮助。
本节列出了其中一个模块无法在线的常见原因以及如何解决该问题。您可以通过以下方式之一确定模块无法联机:
show module命令的输出显示以下状态之一:
other(其他)
未知
故障
errdisable
power-deny
power-bad
状态 LED 呈现琥珀色或红色。
检查相关版本的Catalyst 6500系列发行版本注释中的支持的硬件部分。如果当前运行的软件不支持该模块,请从Cisco IOS软件中心下载所需的软件。
如果状态为 power-deny,则交换机可能没有足够电源为此模块供电。发出show power /strong>命令以确认是否有足够电源可用。请参阅本文档的对C6KPWR-4-POWRDENIED:电源不足、插槽[dec]中的模块电源被拒绝或%C6KPWR-SP-4-POWRDENIED:电源不足、插槽[dec]中的模块电源被拒绝错误消息部分进行故障排除。
如果状态为power-bad,则交换机能够发现板卡但无法分配电力。如果Supervisor引擎无法访问模块上的串行PROM (SPROM)内容以确定线路卡的标识,就有可能发生这种情况。您可以发出show idprom module命令来验证SPROM是否可读。如果SPROM不可访问,您可以重置模块。
确保模块正确安装并完全拧入。如果模块仍无法联机,请发出diagnostic bootup level complete 全局配置命令以确保启用诊断。然后,发出hw-module module <slot_number> reset 命令。如果模块仍无法联机,请检查模块上的背板连接器以确保没有损坏。如果没有明显损坏,请尝试将模块插入其他插槽或其他机箱。此外,请检查底板上的插槽连接器上有无弯曲的引脚。检查机箱底板上的连接器引脚时,请使用手电筒(如有必要)。
发出show diagnostics module <slot_number> 命令以识别模块上的任何硬件故障。发出diagnostic bootup level complete< >全局配置命令以启用完全诊断。您必须启用完整的诊断功能,以便交换机可以对模块执行诊断。如果您启用了最小诊断,并且更改完成诊断,模块必须重置,以便交换机可以执行完全诊断。本部分中的示例输出发出show diagnostics module命令。但由于许多测试都以最小模式执行,因此输出结果并不确定。输出显示如何打开诊断级别,然后再次发出show diagnostics module命令以查看完整结果。
注意:示例模块中未安装千兆接口转换器(GBIC)。因此,未执行完整性测试。GBIC完整性测试仅对铜缆GBIC (WS-G5483=)执行。
cat6native#show diagnostic module 3 Current Online Diagnostic Level = Minimal Online Diagnostic Result for Module 3 : PASS Online Diagnostic Level when Module 3 came up = Minimal Test Results: (. = Pass, F = Fail, U = Unknown) 1 . TestGBICIntegrity : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- U U U U U U U U U U U U U U U U 2 . TestLoopback : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- . . . . . . . . . . . . . . . . 3 . TestDontLearn : U 4 . TestConditionalLearn : . 5 . TestStaticEntry : U 6 . TestCapture : U 7 . TestNewLearn : . 8 . TestIndexLearn : U 9 . TestTrap : U 10. TestIpFibShortcut : . 11. TestDontShortcut : U 12. TestL3Capture : U 13. TestL3VlanMet : . 14. TestIngressSpan : . 15. TestEgressSpan : . 16. TestAclPermit : U 17. TestAclDeny : U 18. TestNetflowInlineRewrite : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- U U U U U U U U U U U U U U U U !--- Tests that are marked "U" were skipped because a minimal !--- level of diagnostics was enabled. cat6knative#configure terminal Enter configuration commands, one per line. End with CNTL/Z. cat6knative(config)#diagnostic bootup level complete !--- This command enables complete diagnostics. cat6knative(config)#end cat6knative# *Feb 18 13:13:03 EST: %SYS-5-CONFIG_I: Configured from console by console cat6knative# cat6knative#hw-module module 3 reset Proceed with reload of module? [confirm] % reset issued for module 3 cat6knative# *Feb 18 13:13:20 EST: %C6KPWR-SP-4-DISABLED: power to module in slot 3 set off (Reset) *Feb 18 13:14:12 EST: %DIAG-SP-6-RUN_COMPLETE: Module 3: Running Complete Online Diagnostics... *Feb 18 13:14:51 EST: %DIAG-SP-6-DIAG_OK: Module 3: Passed Online Diagnostics *Feb 18 13:14:51 EST: %OIR-SP-6-INSCARD: Card inserted in slot 3, interfaces are now online cat6knative#show diagnostic module 3 Current Online Diagnostic Level = Complete Online Diagnostic Result for Module 3 : PASS Online Diagnostic Level when Module 3 came up = Complete Test Results: (. = Pass, F = Fail, U = Unknown) 1 . TestGBICIntegrity : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- U U U U U U U U U U U U U U U U !--- The result for this test is unknown ("U", untested) !--- because no copper GBICS are plugged in. 2 . TestLoopback : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- . . . . . . . . . . . . . . . . 3 . TestDontLearn : . 4 . TestConditionalLearn : . 5 . TestStaticEntry : . 6 . TestCapture : . 7 . TestNewLearn : . 8 . TestIndexLearn : . 9 . TestTrap : . 10. TestIpFibShortcut : . 11. TestDontShortcut : . 12. TestL3Capture : . 13. TestL3VlanMet : . 14. TestIngressSpan : . 15. TestEgressSpan : . 16. TestAclPermit : . 17. TestAclDeny : . 18. TestNetflowInlineRewrite : Port 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ---------------------------------------------------- . . . . . . . . . . . . . . . .
发出show tech-support命令和show logging命令。查找与此模块相关的任何其他消息,以便进一步排除故障。
如果模块仍无法联机,请向 Cisco 技术支持提出服务请求以进一步排除故障。提供您收集的交换机输出的日志以及之前步骤的信息。
Supervisor引擎可引发指示带内通信故障的消息。交换机记录的消息类似于以下内容:
InbandKeepAliveFailure:Module 1 not responding over inband InbandKeepAlive:Module 2 inband rate: rx=0 pps, tx=0 pps ProcessStatusPing:Module 1 not responding over SCP ProcessStatusPing:Module 1 not responding... resetting module
当交换机的管理接口处理大量数据流时,会显示交换机日志InbandKeepAliveFailure错误消息。这可能是由以下原因造成的:
Supervisor 引擎繁忙
生成树 (spanning tree) 协议环路
ACL和QoS策略器已限制或丢弃带内通信信道上的流量
端口 ASIC 同步问题
交换矩阵模块问题
为了解决此问题,请使用以下说明:
使用show process cpu 确定导致此问题的进程。请参阅Catalyst 6500/6000交换机CPU使用率过高以清除根本原因。
如果Supervisor模块安装错误或发生故障,可能会引发这些通信故障消息。要从此错误消息中恢复,请安排一个维护窗口并重新安装Supervisor模块。
运行Cisco IOS软件的Cisco Catalyst 6500/6000可能因以下重置原因显示为重新加载:
System returned to ROM by power-on (SP by abort)
具有允许中断(例如 0x2)的 SP 配置寄存器的 Catalyst 6500/6000 在收到控制台中断信号时将进入 ROMmon 诊断模式。系统似乎崩溃了。SP和RP上的配置寄存器设置不匹配可能会导致这种类型的重新加载。具体而言,您可以将Supervisor引擎交换处理器(SP)配置寄存器设置为不忽略中断的值,而将多层交换功能卡(MSFC)路由处理器(RP)配置寄存器设置为不忽略中断的正确值。例如,您可能将 Supervisor 引擎 SP 设置为 0x2,而将 MSFC RP 设置为 0x2102。 有关详细信息,请参阅Cisco IOS Catalyst 6500/6000重置并出现错误“System returned to ROM by power-on (SP by abort)”。
无论运行配置中的BOOT变量配置如何,运行Cisco IOS软件的Cisco Catalyst 6500/6000都会在sup-bootdisk中启动旧映像。即使BOOT变量配置为从外部闪存引导,它交换机也仅引导sup-bootdisk中的旧映像。此问题的原因是SP和RP上的配置寄存器设置不匹配。
在RP中,发出命令show bootvar。
Switch#show boot BOOT variable = sup-bootdisk:s72033-advipservicesk9_wan-mz.122-18.SXF7.bin,1; CONFIG_FILE variable = BOOTLDR variable = Configuration register is 0x2102
在SP中,发出命令show bootvar。
Switch-sp#show boot BOOT variable = bootdisk:s72033-advipservicesk9_wan-mz.122-18.SXF7.bin,1; CONFIG_FILE variable does not exist BOOTLDR variable does not exist Configuration register is 0x2101
这会导致交换机启动以前的映像,而不管运行配置中的BOOT变量配置如何。要解决此问题,请发出命令switch(config)#config-register 0x2102,然后确认SP和RP具有相同的config-register值。将配置写入启动配置后,重新加载交换机。
此错误消息指示 NVRAM 有问题。如果清除NVRAM并重新加载交换机,则它会恢复NVRAM。 如果这不能解决问题,请格式化NVRAM以帮助解决问题。在这两种情况下,建议备份NVRAM内容。此错误消息仅在启用NVRAM调试时显示。
错误消息CRIT_ERR_DETECTED Module 7 - Error: Switching Bus FIFO counter stuck表明模块未在数据交换总线上看到活动。 出现此错误的原因可能是新插入的模块最初没有牢固地插入机箱或推入速度太慢。
重新拔插模块以解决问题。
Catalyst 6500 vss群集遇到以下错误消息:
%CONST_DIAG-4-ERROR_COUNTER_WARNING: Module [dec] Error counter exceeds threshold, system operation continue.
TestErrorCounterMonitor检测到指定模块中的错误计数器已超过阈值。有关错误计数器的特定数据可以在单独的系统消息中发送。TestErrorCounterMonitor是一个非破坏性运行状况监控后台进程,定期轮询系统中每个板卡或管理引擎模块的错误计数器和中断计数器。
%CONST_DIAG-4-ERROR_COUNTER_DATA: ID:[dec] IN:[dec] PO:[dec] RE:[dec] RM:[dec] DV:[dec] EG:[dec] CF:[dec] TF:[dec]
TestErrorCounterMonitor检测到指定模块中的错误计数器已超过阈值。此消息包含有关错误计数器的特定数据,以及有关计数器的ASIC和寄存器以及错误计数器的信息。
当板卡上的ASIC收到包含错误CRC的数据包时,会收到此错误消息。此问题可能属于此模块本地,也可能由机箱中的某个其他故障模块触发。
例如:
%CONST_DIAG-SW1_SP-4-ERROR_COUNTER_WARNING: Module 2 Error counter exceeds threshold, system operation continue.
出现此错误的原因可能是新插入的模块未牢固插入。 重新拔插模块以解决问题。
当达到软件接口描述符块(SWIDB)的最大数量时,收到此错误消息:
%INTERFACE_API-SP-1-NOMORESWIDB:无法再分配SWIDB,允许的最大12000限
有关IDB限制的详细信息,请参阅Cisco IOS平台的最大接口子接口数目:IDB限制。
当您尝试将非交换机端口接口转换为交换机端口时,会返回错误。
Switch(config)#interface gigabit ethernet 7/29 Switch(config-if)#switchport %Command rejected: Cannot convert port. Maximum number of interfaces reached. Output of idb: AMC440E-SAS01#show idb Maximum number of Software IDBs 12000. In use 11999. HWIDBs SWIDBs Active 218 220 Inactive 11779 11779 Total IDBs 11997 11999 Size each (bytes) 3392 1520 Total bytes 40693824 18238480
此示例显示IDB总数(在SWIDB列下)已经达到IDB最大数量限制。当您删除子接口时,SWIDB列中的Active 和Inactive 编号将会更改;但是,IDB总数将保留在内存中。 要解决此问题,请重新加载交换机以清除IDB数据库。否则,一旦用完,您需要重新使用已删除的子接口。
当Cisco Catalyst 6500交换机无法使用指定的Cisco IOS软件版本启动时,也会报告类似的错误消息。
00:00:56: %SYS-SP-2-MALLOCFAIL: Memory allocation of 2177024 bytes failed from 0x40173D8C, alignment 8 Pool: Processor Free: 1266272 Cause: Not enough free memory Alternate Pool: None Free: 0 Cause: No Alternate pool -Process= "TCAM Manager process", ipl= 0, pid= 112 -Traceback= 4016F4D0 40172688 40173D94 40577FF8 4055DB04 4055DEDC SYSTEM INIT: INSUFFICIENT MEMORY TO BOOT THE IMAGE! %Software-forced reload
当闪存中的映像没有足够的DRAM可供解压时,通常会发生此问题。
要解决此问题,请执行以下选项之一:
升级 DRAM。
请参阅如何选择Cisco IOS软件版本的内存要求(示例4)部分。 这将计算您的图像所需的DRAM大小。
加载适合当前内存大小的映像。
要确定安装在Catalyst 6500/6000上的Supervisor的类型,请参阅如何确定安装在Catalyst 6500/6000系列交换机上的Supervisor模块的类型。
要了解Catalyst 6500/6000中可用的默认内存选项,请参阅Catalyst交换机平台中支持的内存/闪存大小。
要选择和下载合适的软件,请使用下载-交换机页。
注意:只有思科注册用户才能访问思科内部信息和工具。
当您使用 WS-X6548-GE-TX 或 WS-X6148-GE-TX 模块时,单个端口的使用率有可能导致周围接口的连接问题或数据包丢失。特别是当您在这些线卡中使用EtherChannel和远程交换端口分析器(RSPAN)时,可能会看到由于数据包丢失而导致响应缓慢。这些线卡是超订用卡,旨在将千兆位扩展至桌面,并不适合服务器群连接。在这些模块上,有一个来自端口 ASIC 的单条 1 千兆以太网上行链路,该链路支持八个端口。这些卡在一组端口(1-8、9-16、17-24、25-32、33-40和41-48)之间共享1 Mb的缓冲区,因为八个端口的每个块都超订用8:1。这八个端口块的总吞吐量不可超过 1 Gbps。Cisco Catalyst 6500系列10/100-和10/100/1000-Mbps以太网接口模块中的表4显示了不同类型的以太网接口模块以及每个端口支持的缓冲区大小。
由于多个端口合并到一个Pinnacle ASIC中,会发生超订用。Pinnacle ASIC是直接内存访问(DMA)引擎,可在背板交换总线和网络端口之间传输数据包。如果此范围内的任何端口以超出其带宽的速率接收或传输流量,或者使用大量缓冲区来处理突发流量,则同一范围内的其他端口可能会出现数据包丢失的情况。
SPAN目的地是一个非常常见的原因,因为将流量从整个VLAN或多个端口复制到单个接口的情况并不少见。在带有单个接口缓冲区的卡上,超过目标端口带宽的数据包将以静默方式丢弃,其他端口不会受到影响。对于共享缓冲区,这会导致该范围内的其他端口出现连接问题。在大多数情况下,共用缓冲区不会造成任何问题。即使连接了8个千兆位的工作站,也很少会超过提供的带宽。
在交换机中配置本地SPAN时,尤其是当交换机监控大量源端口时,交换机可能会出现服务降级。如果它监控某些VLAN并且为这些VLAN中的任意一个VLAN分配了大量的或端口,则此问题依然存在。
即使SPAN在硬件中完成,也会对性能产生影响,因为现在交换机承载的流量是原来的两倍。由于每个线卡在入口复制流量,因此每当端口受到监控时,所有入口流量都会在到达交换矩阵时翻倍。从线卡上大量繁忙端口捕获流量可能会填满交换矩阵连接,尤其是使用WS-6548-GE-TX卡,该卡只有8千兆交换矩阵连接。
WS-X6548-GE-TX、WS-X6548V-GE-TX、WS-X6148-GE-TX 和 WS-X6148V-GE-TX 模块对 EtherChannel 进行了限制。就 EtherChannel 而言,来自链路捆绑中所有链路的数据都会转入端口 ASIC,即使这些数据发往另一条链路也是如此。这些数据会消耗该 1 千兆以太网链路中的带宽。就这些模块而言,EtherChannel 上所有数据的总和不能超过 1 千兆。
检查此输出以验证模块是否遇到与过度使用的缓冲区相关的丢包:
本地Cisco IOS
Cat6500# show counters interface gigabitEthernet <mod/port> | include qos3Outlost
51. qos3Outlost = 768504851
多次运行show命令,以检查asicreg是否稳步递增。每次运行asicreg输出后,记录都会被清除。如果asicreg输出保持非零,则表示活动丢弃。根据流量的速率,此数据需要在几分钟内收集才能获得显著增量。
请完成以下步骤:
隔离始终超订用到自己端口范围的所有端口,以最大程度降低丢弃对其他接口的影响。
例如,如果服务器连接到端口1(接口),则 oversubscribing
如果将多个其他服务器连接到范围2-8内的端口,则会导致响应缓慢。在这种情况下,请将 oversubscribing< /code> server to port 9 in order to free up the buffer in the first block of ports 1-8. On newer software versions, SPAN destinations have the buffering automatically moved to the interface, so it does not impact the other ports in its range. Cisco bug ID CSCin70308 (accessible only to registered Cisco clients) for more information.
禁用使用接口缓冲区而不是共享缓冲区的线路头阻塞(HOL)。
这会导致仅从单个过度使用的端口丢弃数据包。由于接口缓冲区(32 k)比1 Mb共享缓冲区小得多,因此各个端口可能会出现更多丢包。只有在客户端或SPAN端口不能移至提供专用接口缓冲区的其他线卡的极端情况下,才建议这样做。
本地Cisco IOS
Router(config)# interface gigabitethernet <mod/port>
Router(config-if)# hol-blocking disable
一旦禁用此功能,丢弃会移动到接口计数器,并且可以使用show interface gigabit <mod/port> 命令查看。其他端口不再受影响,前提是它们不是单独的bursting
。由于建议保持启用HOL阻塞,因此,此信息可用于查找超出端口范围中缓冲区的设备,并将其移至另一个卡或卡上的隔离范围,以便可以重新启用HOL阻塞。
配置SPAN会话时,请确保目标端口未报告该特定接口上的任何错误。要检查目标端口上是否有任何可能的错误,请检查Cisco IOS的show interface <interface type> <interface number>命令的输出,看是否存在任何输出丢包或错误。连接到目的端口的设备与端口本身必须具有相同的速度和双工设置,以避免目的端口上出现任何错误。
考虑迁移到没有超订用端口的以太网模块。有关受支持模块的详细信息,请参阅Cisco Catalyst 6500系列交换机-相关接口和模块。
在交换机上运行的协议可能导致初始连接延迟。如果在接通或重新启动客户端计算机时观察到以下任何症状,则可能会出现此问题:
Microsoft networking
Client显示No Domain Controllers Available。
DHCP 报告 No DHCP Servers Available。
Novell 互联网分组交换 (IPX) 网络工作站在启动时不显示 Novell Login 屏幕。
AppleTalk客 networking
户端显示Access to your AppleTalk network has been interrupted.To re-establish your connection, open and close the AppleTalk control panel.也有可能 AppleTalk 客户端选择器应用程序不显示区域列表或者显示的区域列表不完整。
IBM 网络站会显示下列消息之一:
NSB83619--Address resolution failed
NSB83589--Failed to boot after 1 attempt
NSB70519--Failed to connect to a server
接口延迟会导致工作站启动期间无法登录网络/无法获取DHCP地址部分列出的症状。以下是接口延迟的常见原因:
生成树协议 (STP) 延迟
EtherChannel 延迟
中继延迟
自动协商延迟
有关这些延迟和解决方案的详细信息,请参阅使用 PortFast 和其他命令修复工作站启动连接延迟问题。
如果在查阅和使用该过程后仍有问题,请与Cisco技术支持联系。
如果存在以下任何问题,则交换机可能会出现网络接口卡(NIC)兼容性或配置错误问题:
服务器/客户端无法连接到交换机。
您有自动协商问题。
端口上发生错误。
出现这些症状的原因可能有:
已知的 NIC 驱动程序问题
速度/双工不匹配
自动协商问题
电缆问题
要进一步排除故障,请参阅排除Cisco Catalyst交换机与NIC的兼容性故障。
如果show interface status命令输出中的接口状态为errdisable,则表示接口由于错误条件已被禁用。以下为处于errdisable状态的接口示例:
cat6knative#show interfaces gigabitethernet 4/1 status Port Name Status Vlan Duplex Speed Type Gi4/1 err-disabled 100 full 1000 1000BaseSX
或者,如果接口因错误条件而被禁用,您会看到类似以下内容的消息:
%SPANTREE-SP-2-BLOCK_BPDUGUARD: Received BPDU on port GigabitEthernet4/1 with BPDU Guard enabled. Disabling port. %PM-SP-4-ERR_DISABLE: bpduguard error detected on Gi4/1, putting Gi4/1 in err-disable state
此示例消息显示主机端口何时收到网桥协议数据单元(BPDU)。实际消息取决于错误情况的原因。
有多种原因可导致接口处于 errdisable 状态。原因可能是:
双工不匹配
端口信道配置错误
BPDU 防护违规
UDLD 条件
延迟冲突检测
链路抖动检测
安全违规
端口聚合协议 (PAgP) 抖动
第二层隧道协议 (L2TP) 防护
DHCP 监听速率限制
要启用状态为 errdisable 的端口,请完成以下步骤:
从连接的一端拔下电缆。
重新配置接口。
例如,如果接口由于Etherchannel配置错误而处于errdisabled状态,请重新配置Etherchannel的接口范围。
关闭两端的端口。
将电缆插入两台交换机。
在接口上发出no shutdown命令。
还可以发出errdisable recovery cause cause enable 命令以设置超时机制,该机制会在配置的计时器时段后自动重新启用端口。
注意:如果您不能解决问题的根本原因,错误情况将再次出现。
要确定出现errdisable状态的原因,请发出show errdisable recovery命令。
cat6knative#show errdisable recovery ErrDisable Reason Timer Status ----------------- -------------- udld Enabled bpduguard Enabled security-violatio Enabled channel-misconfig Enabled pagp-flap Enabled dtp-flap Enabled link-flap Enabled l2ptguard Enabled psecure-violation Enabled Timer interval: 300 seconds Interfaces that will be enabled at the next timeout: Interface Errdisable reason Time left(sec) --------- ----------------- -------------- Gi4/1 bpduguard 270
在查明了errdisable e的原因之后,请对问题进行故障排除,并纠正问题的根源。例如,可能是因为在启用了PortFast的接入端口上收到BPDU而导致errdisable(如示例所示)。您可以排除交换机是否意外连接到该端口或集线器是否连接创建了环路的问题。要对其他情况进行故障排除,请参阅产品文档中的特定功能信息。 有关可错误状态的更全面信息,请参阅Cisco IOS平台上的Errdisable端口状态恢复。 如果根据此信息执行审查和故障排除后仍有问题,请与Cisco技术支持联系以寻求进一步帮助。
如果在show interface命令输出中看到错误,请检查出现问题的接口的状态和运行状况。同时请检查是否有流量通过该接口。请参阅对运行Cisco IOS系统软件的Catalyst 6500/6000上的WS-X6348模块端口连接进行故障排除的步骤12。
cat6knative#show interfaces gigabitethernet 1/1 GigabitEthernet1/1 is up, line protocol is up (connected) Hardware is C6k 1000Mb 802.3, address is 0001.6416.042a (bia 0001.6416.042a) Description: L2 FX Trunk to tpa_data_6513_01 MTU 1500 bytes, BW 1000000 Kbit, DLY 10 usec, reliability 255/255, txload 1/255, rxload 1/255 Encapsulation ARPA, loopback not set Full-duplex mode, link type is autonegotiation, media type is SX output flow-control is unsupported, input flow-control is unsupported, 1000Mb/s Clock mode is auto input flow-control is off, output flow-control is off ARP type: ARPA, ARP Timeout 04:00:00 Last input 00:00:01, output 00:00:28, output hang never Last clearing of "show interface" counters never Input queue: 0/2000/0/0 (size/max/drops/flushes); Total output drops: 0 Queueing strategy: fifo Output queue :0/40 (size/max) 5 minute input rate 118000 bits/sec, 289 packets/sec 5 minute output rate 0 bits/sec, 0 packets/sec 461986872 packets input, 33320301551 bytes, 0 no buffer Received 461467631 broadcasts, 0 runts, 0 giants, 0 throttles 0 input errors, 0 CRC, 0 frame, 137 overrun, 0 ignored 0 input packets with dribble condition detected 64429726 packets output, 4706228422 bytes, 0 underruns 0 output errors, 0 collisions, 2 interface resets 0 babbles, 0 late collision, 0 deferred 0 lost carrier, 0 no carrier 0 output buffer failures, 0 output buffers swapped out cat6knative#
此外,您会在show interfaces <interface-id> counters errors 命令输出中看到错误。如果是这样,请检查是否有与接口相关的错误。请参阅对运行Cisco IOS系统软件的Catalyst 6500/6000上的WS-X6348模块端口连接进行故障排除的步骤14。
cat6knative#show interfaces gigabitethernet 3/1 counters errors Port Align-Err FCS-Err Xmit-Err Rcv-Err UnderSize OutDiscards Gi3/1 0 0 0 0 0 0 Port Single-Col Multi-Col Late-Col Excess-Col Carri-Sen Runts Giants Gi3/1 0 0 0 0 0 0 0 Port SQETest-Err Deferred-Tx IntMacTx-Err IntMacRx-Err Symbol-Err Gi3/1 0 0 0 0 0
接口显示错误的原因可能是物理层问题,例如:
电缆/NIC 有故障
配置问题,例如速度-双工不匹配
性能问题,如超订用
要了解问题并排除故障,请参阅排除交换机端口及接口问题。
有时,由于软件Bug或硬件限制,错误计数器会错误地增加。下表列出了运行Cisco IOS软件的Catalyst 6500/6000平台的一些已知计数器问题:
注意:只有已注册的思科客户端才能访问内部站点和漏洞信息。
症状 | 描述 | 修复程序 |
---|---|---|
基于Supervisor引擎720的交换机上IEEE 802.1Q中继接口上的巨型帧。 | Catalyst 6500系列交换机可以报告超过1496字节的数据包大小的巨型帧,并且通过Supervisor引擎720端口在中继上收到标记的数据包。67xx 线路卡上也会发生此问题。此问题是表面问题,且交换机转发数据包。ISL 1中继也出现此问题。有关详细信息,请参阅Cisco Bug ID CSCec62587 和Cisco Bug ID CSCed42859。 | 思科IOS软件版本12.2(17b)SXA及更高版本思科IOS软件版本12.2(18)SXD及更高版本 |
基于Supervisor引擎2的交换机上802.1Q TRUNK接口上的巨型帧。 | 交换机将802.1Q TRUNK端口上非本地VLAN上1497到1500范围内的数据包视为巨型帧。这是表面问题,数据包由交换机转发。有关详细信息,请参阅Cisco Bug ID CSCdw04642(仅限注册用户)。 | 当前不可用 |
在千兆接口的show interface命令输出中看到过多的输出丢弃计数器,即使存在低流量条件也是如此。 | 当存在低流量条件时,在千兆接口的show interface命令输出中看到过多的输出丢弃计数器。请参阅Cisco Bug ID CSCdv86024 了解详细信息。 |
Cisco IOS软件版本12.1(8b)E12及更高版本Cisco IOS软件版本12.1(11b)E8及更高版本Cisco IOS软件版本12.1(12c)E1及更高版本Cisco IOS软件版本12.1(13)E1及更高版本 |
对于bps 1 和pps 2,端口信道接口在show interface命令的输出中有不正确的统计信息。 | 当您使用Cisco IOS软件时,在两个快速以太网端口上定义了端口通道,并且流量通过端口通道生成时,物理接口具有正确的速率统计信息。但是,端口通道接口的统计数据不正确。有关详细信息,请参阅Cisco Bug ID CSCdw23826(仅限注册用户)。 | 思科IOS软件版本12.1(8a)EX思科IOS软件版本12.1(11b)E1思科IOS软件版本12.1(13)E1 |
1 ISL =交换机间链路。
2 bps =每秒位数。
3 pps =每秒数据包数。
如果根据此部分提到的文档执行审查和故障排除后仍有问题,请与Cisco技术支持联系以寻求进一步帮助。
在低于Cisco IOS软件版本12.1(13)E的软件版本中运行的GBIC在升级后会失败。
使用Cisco IOS软件版本12.1(13)系统软件时,具有GBIC EEPROM校验和错误的GBIC的端口不能出现up。这是1000BASE-TX(铜缆)和粗波分复用器(CWDM) GBIC的预期行为。但对于其他 GBIC 而言并不正常。在早期版本中,允许带有其他校验和错误的GBIC的端口进入工作状态。
当Cisco IOS软件版本12.1(13)E中出现此错误时,会显示以下错误消息:
%PM_SCP-SP-3-GBIC_BAD: GBIC integrity check on port 1/2 failed: bad key
发出show interface命令以显示此输出:
Router#show interface status Port Name Status Vlan Duplex Speed Type Gi2/1 faulty routed full 1000 bad EEPROM
此问题可在Cisco IOS软件版本12.1(13)E1、12.1(14)E及更高版本中解决。
有关此问题的详细信息,请参阅Field Notice:Catalyst 6000的Cisco IOS®软件版本12.1(13)E中的GBIC EEPROM错误不正确。
可以在Syslog或show log命令输出中看到以下一条或多条错误消息:
Coil Pinnacle Header Checksum
Coil Mdtif State Machine Error
Coil Mdtif Packet CRC Error
Coil Pb Rx Underflow Error
Coil Pb Rx Parity Error
如果连接WS-X6348模块或其他10/100模块上的主机时遇到连接问题,或者您看到类似本节列出的错误信息,并且您有一组12个端口停滞不前且无法传递流量,请执行以下步骤:
禁用然后再启用接口。
发出命令以对模块进行软重置。
执行以下操作之一,以对模块进行硬重置:
将卡完全重新安装。
发出no power enable module module_# 全局配置命令和 power enable module module_# 全局配置命令。
执行以下步骤后,如果您遇到一个或多个此类问题,请与Cisco技术支持< /a>联系并提供相关信息:
模块未联机。
模块联机,但一组12个接口未通过诊断。
可以在show diagnostic module <module_number> 命令的输出中看到此信息。
当您启动时,模块停滞在other状态。
模块上的所有端口 LED 都变为琥珀色。
所有接口都处于errdisabled状态。
发出show interfaces status module module_# 命令时可以看到这一点。
有关详细信息,请参阅对运行Cisco IOS系统软件的Catalyst 6500/6000上的WS-X6348模块端口连接进行故障排除。
如果WS-X6348模块或者其他10/100模块上的主机的连接存在问题,请参阅对运行Cisco IOS系统软件的Catalyst 6500/6000上的WS-X6348模块端口连接进行排除故障,了解详细信息。 如果在查阅文档排除运行Cisco IOS系统软件的Catalyst 6500/6000上的WS-X6348模块端口连接故障并进行故障排除后仍有问题,请与Cisco技术支持联系以寻求进一步帮助。
生成树相关问题可能导致交换网络中的连接问题。有关如何防止生成树问题的指南,请参阅对运行Cisco IOS系统软件的Catalyst交换机上的STP进行故障排除。
与每台Cisco IOS设备一样,Catalyst 6500交换机也仅允许有限数量的Telnet会话。如果达到此限制,交换机将不允许进一步的vty会话。要验证您是否遇到此问题,请连接到Supervisor引擎的控制台。发出show user命令。此命令的命令行界面(CLI)输出显示当前占用了多少行:
Cat6500#show user Line User Host(s) Idle Location 0 con 0 10.48.72.118 00:00:00 1 vty 0 10.48.72.118 00:00:00 10.48.72.118 2 vty 1 10.48.72.118 00:00:00 10.48.72.118 3 vty 2 10.48.72.118 00:00:00 10.48.72.118 4 vty 3 10.48.72.118 00:00:00 10.48.72.118 *5 vty 4 idle 00:00:00 10.48.72.118
请完成以下步骤:
根据show user命令的输出,发出clear line line_number命令以清除过时的会话。
Cat6500#show user Line User Host(s) Idle Location 0 con 0 10.48.72.118 00:00:00 1 vty 0 10.48.72.118 00:00:00 10.48.72.118 2 vty 1 10.48.72.118 00:00:00 10.48.72.118 3 vty 2 10.48.72.118 00:00:00 10.48.72.118 4 vty 3 10.48.72.118 00:00:00 10.48.72.118 *5 vty 4 idle 00:00:00 10.48.72.118 Cat6500#clear line 1 Cat6500#clear line 2 !--- Output suppressed.
配置 vty 会话和控制台线路的空闲超时,以便清除所有非活动会话。本示例显示了将空闲超时设置为 10 分钟所需使用的配置:
Cat6500#configure terminal Enter configuration commands, one per line. End with CNTL/Z. Cat6500(config)#line vty 0 4 Cat6500(config-line)#exec-timeout ? <0-35791> Timeout in minutes Cat6500(config-line)#exec-timeout 10 ? <0-2147483> Timeout in seconds <cr> Cat6500(config-line)#exec-timeout 10 0 Cat6500(config-line)#exit Cat6500(config)#line con 0 Cat6500(config-line)#exec-timeout 10 0 Cat6500(config-line)#exit Cat6500(config)#
也可以增加可用 vty 会话的数量。请使用line vty 0 6 命令而非line vty 0 4 命令。
某些情况下,show user命令输出可能显示没有活动的vty处于会话状态,但仍然无法使用telnet命令连接到交换机,并返回以下错误消息:
% telnet connections not permitted from this terminal
在这种情况下,请验证 vty 的配置是否正确。要允许 vty 传输所有内容,请发出 transport input all 命令。
问题
6500交换机在VSS集群中堆叠;当您尝试将其控制台连接到备用交换机时,会失败,并显示以下Radius日志消息:
%RADIUS-4-RADIUS_DEAD: RADIUS服务器10.50.245.20:1812,1813没有响应。
通过Telnet对此备用Supervisor进行身份验证可以正常工作,并且活动Supervisor上的控制台登录也可以正常工作。连接到备用Supervisor的控制台时出现问题。
解决方案
无法对备用设备的控制台进行RADIUS身份验证。备用路由器没有用于AAA身份验证的IP连接。您需要使用回退选项,例如本地数据库。
有时,即使没有巨型数据包通过系统发送,VSL接口上的巨型数据包计数器也会增加。
通过VSL接口的数据包在正常的MAC报头之外携带32字节的VSL报头。理想情况下,此报头在数据包大小分类中会被排除,但端口ASIC实际上在此类分类中包括此报头。因此,接近常规大小数据包1518大小限制的控制数据包最终可以分类为巨型数据包。
目前,此问题尚无解决方法。
您可以看到交换机上以前没有的多个VLAN。例如:
Vlan982 unassigned YES unset administratively down down Vlan983 unassigned YES unset administratively down down Vlan984 unassigned YES unset administratively down down Vlan985 unassigned YES unset administratively down down Vlan986 unassigned YES unset administratively down down Vlan987 unassigned YES unset administratively down down Vlan988 unassigned YES unset administratively down down Vlan989 unassigned YES unset administratively down down Vlan990 unassigned YES unset administratively down down Vlan991 unassigned YES unset administratively down down Vlan992 unassigned YES unset administratively down down Vlan993 unassigned YES unset administratively down down Vlan994 unassigned YES unset administratively down down Vlan995 unassigned YES unset administratively down down Vlan996 unassigned YES unset administratively down down Vlan997 unassigned YES unset administratively down down Vlan998 unassigned YES unset administratively down down Vlan999 unassigned YES unset administratively down down Vlan1000 unassigned YES unset administratively down down Vlan1001 unassigned YES unset administratively down down Vlan1002 unassigned YES unset administratively down down Vlan1003 unassigned YES unset administratively down down Vlan1004 unassigned YES unset administratively down down Vlan1005 unassigned YES unset administratively down down
作为解决方案,vlan filter Traffic-Capture vlan-list 1 ― 700 命令已添加到配置中。任何尚未配置的VLAN都可以添加为第3层VLAN。
如果在打开电源开关后电源的INPUT OK LED不亮,请发出show power status all命令。查找电源状态,如本示例所示:
cat6knative#show power status all Power-Capacity PS-Fan Output Oper PS Type Watts A @42V Status Status State ---- ------------------ ------- ------ ------ ------ ----- 1 WS-CAC-2500W 2331.00 55.50 OK OK on 2 none Pwr-Requested Pwr-Allocated Admin Oper Slot Card-Type Watts A @42V Watts A @42V State State ---- ------------------ ------- ------ ------- ------ ----- ----- 1 WS-X6K-S2U-MSFC2 142.38 3.39 142.38 3.39 on on 2 WSSUP1A-2GE 142.38 3.39 142.38 3.39 on on 3 WS-X6516-GBIC 231.00 5.50 231.00 5.50 on on 4 WS-X6516-GBIC 231.00 5.50 231.00 5.50 on on 5 WS-X6500-SFM2 129.78 3.09 129.78 3.09 on on 6 WS-X6502-10GE 226.80 5.40 226.80 5.40 on on cat6knative#
如果状态不是OK(如本示例所示),请使用文档故障排除(Catalyst 6500系列交换机)的电源故障排除部分指示的步骤进一步排除故障。
如果在日志中收到此消息,则此消息表明没有足够的电源来打开模块。消息中的[dec]表示插槽编号:
%OIR-SP-6-REMCARD: Card removed from slot 9, interfaces disabled C6KPWR-4-POWERDENIED: insufficient power, module in slot 9 power denied C6KPWR-SP-4-POWERDENIED: insufficient power, module in slot 9 power denied
发出show power命令,以查找电源冗余的模式。
cat6knative#show power system power redundancy mode = redundant system power total = 27.460A system power used = 25.430A system power available = 2.030A FRU-type # current admin state oper power-supply 1 27.460A on on power-supply 2 27.460A on on module 1 3.390A on on module 2 3.390A on on module 3 5.500A on on module 5 3.090A on on module 7 5.030A on on module 8 5.030A on on module 9 5.030A on off (FRU-power denied).
此输出显示电源模式为冗余模式,并且一个电源不足以为整个机箱供电。您可以执行以下两个选项之一:
使用较高功率的电源。
例如,如果当前电源是1300W交流电源,则获取2500W交流电源或4000W交流电源。
将电源冗余模式设置为combined。
例如:
cat6knative(config)#power redundancy-mode combined cat6knative(config)# %C6KPWR-SP-4-PSCOMBINEDMODE: power supplies set to combined mode.
在复合模式下,两个电源同时提供功率。但是,在此模式下,如果一个电源发生故障,您将再次失去模块的电源,因为剩余的电源无法向整个机箱供电。
因此,更好的选择是使用更高功率的电源。
为空槽预留的功率不能重新分配。例如,如果插槽6为空,而插槽2只有68瓦可用,那么为了让插槽2有更多的可用瓦数,您不能将用于插槽6保留的282瓦重新分配给插槽2。
每个插槽都有自己的可用电源,如果未使用,则无法将其重新分配给其他插槽。没有命令禁用为空插槽预留的电源。
注:确保交换机连接到220VAC而不是110VAC(如果电源支持220VAC),以使用电源的全部电源容量。有关电源管理的详细信息,请参阅Catalyst 6000系列交换机的电源管理。
如果发出show environment status命令并且看到风扇装置出现故障,请执行文档故障排除(Catalyst 6500系列交换机)的风扇装置故障排除部分中的步骤以识别问题。
例如:
cat6knative#show environment status backplane: operating clock count: 2 operating VTT count: 3 fan-tray 1: fan-tray 1 fan-fail: failed !--- Output suppressed.
版本 | 发布日期 | 备注 |
---|---|---|
2.0 |
22-Sep-2023 |
重新认证 |
1.0 |
28-May-2002 |
初始版本 |