此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档简要说明了运行 Cisco IOS® 系统软件的 Cisco Catalyst 6500/6000 系列交换机上常见的 syslog 和错误消息。如果您有错误消息未出现在本文档中,请使用Cisco CLI分析器(仅限注册客户)。通过该工具,可以了解 Cisco IOS 软件和 Catalyst OS (CatOS) 软件生成的错误消息的含义。
注意:本文档描述的系统日志和错误消息的确切格式可能稍有不同。不同之处取决于 Supervisor 引擎上运行的软件版本。
注意:建议在Catalyst 6500/6000上使用此最低日志记录配置:
设置交换机上的日期和时间,或者将交换机配置为使用网络时间协议 (NTP),以从 NTP 服务器获得日期和时间。
确保已启用日志记录和日志记录时间戳,即默认设置。
如有可能,将交换机配置为登录到 syslog 服务器。
本文档没有任何特定的要求。
本文档不限于特定的软件和硬件版本。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
交换机报告以下错误消息:
C6KPWR-SP-4-UNSUPPORTED:插槽[num]中不支持模块,不允许通电:[chars]
以下示例显示了发生该问题时所显示的控制台输出:
Oct 14 16:50:13: %C6KPWR-SP-4-UNSUPPORTED: unsupported module in slot 2, power not allowed: Unknown Card Type Oct 14 16:50:20: %C6KPWR-SP-4-UNSUPPORTED: unsupported module in slot 2, power not allowed: Unknown Card Type
该消息表示指定插槽内的模块不受支持。[num] 是插槽编号,[chars] 提供关于错误的详细信息。
将 Supervisor 引擎软件升级到支持该硬件模块的版本。请参阅 Cisco Catalyst 6500 系列交换机发行版本注释的支持的硬件 部分,了解相关版本。要解决该消息描述的问题,请执行这些操作之一:
插入或替换交换矩阵模块。
将不支持的模块移到其他插槽中。
交换机报告以下错误消息:
%DUAL-3-INTERNAL: IP-EIGRP 1:内部错误
该错误消息表示在 Cisco IOS 软件中有一个内部 bug。该 bug 已在以下版本中得到修复:
Cisco IOS 软件版本 12.2(0.4)
Cisco IOS 软件版本 12.1(6.1)
Cisco IOS 软件版本 12.2(0.5)T
Cisco IOS 软件版本 12.1(6.5)E
Cisco IOS 软件版本 12.1(6.5)EC
Cisco IOS 软件版本 12.1(6)E02
Cisco IOS 软件版本 12.2(0.18)S
Cisco IOS 软件版本 12.2(2)B
Cisco IOS 软件版本 12.2(15)ZN
将 Cisco IOS 软件升级到以下版本之一,或者升级到最新版本。
交换机报告以下错误消息:
%EARL_L3_ASIC-SP-4-INTR_THROTTLE:限制“IP_TOO_SHRT”
以下示例显示了发生该问题时所显示的控制台输出:
Jul 25 12:00:40.228 AEST: %EARL_L3_ASIC-SP-4-INTR_THROTTLE: Throttling "IP_TOO_SHRT"Intr. Exceeded permitted 1000/100 intrs/msec
该消息表示交换机转发引擎收到的 IP 数据包长度比允许的最短长度还短。交换机丢弃了该数据包。在旧版本中,这样的数据包都会被静默丢弃,并计入转发引擎统计数据中。在更高版本中,会每隔 30 分钟在 syslog 中记录一次该错误消息。以下这些问题会造成交换机转发引擎收到这种类型的 IP 数据包:
网络接口卡 (NIC) 驱动程序出错
NIC 驱动程序 bug
应用程序出错
交换机仅报告收到了这些“错误”数据包,并打算将其丢弃。
问题根源来自于交换机外部。遗憾的是,转发引擎并不记录这些错误数据包发送设备的源 IP 地址。检测该设备的唯一方式是使用嗅探器找到源,然后替换该设备。
交换机报告以下错误消息:
EARL_L3_ASIC-SP-3-INTR_WARN:EARL L3 ASIC:非致命中断[chars]
以下示例显示了发生该问题时所显示的控制台输出:
Apr 20 17:53:38: %EARL_L3_ASIC-SP-3-INTR_WARN: EARL L3 ASIC: Non-fatal interrupt Packet Parser block interrupt Apr 20 19:13:05: %EARL_L3_ASIC-SP-3-INTR_WARN: EARL L3 ASIC: Non-fatal interrupt Packet Parser block interrupt
错误消息 %EARL_L3_ASIC-SP-3-INTR_WARN 表示增强地址识别逻辑 (EARL) 第 3 层 (L3) 专用集成电路 (ASIC) 检测到非致命意外情况。这表示已收到并丢弃错误数据包,其中可能包含第 3 层 IP 校验和错误。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:
NIC 出错
NIC 驱动程序出错
应用程序出错
在旧的 Cisco IOS 软件版本中,通常会丢弃这些数据包,不进行日志记录。Cisco IOS 软件版本 12.2SX 及更高版本提供记录有关该平台错误消息的功能。
该消息仅用于提供信息。请使用以下两个选项之一作为解决方法:
使用网络嗅探器识别发送错误数据包的源。然后,解决源设备或源应用程序的问题。
在交换机硬件中禁用针对以下错误的第 3 层错误检查:
数据包校验和错误
数据包长度错误
数据包源 IP 地址和目标 IP 地址相同
如以下示例所示,使用 no mls verify 命令停止这些错误检查:
Switch(config)#no mls verify ip checksum !--- This configures the switch to discontinue checks for packet
!--- checksum errors.
Switch(config)#no mls verify ip length {consistent | minimum} !--- This configures the switch to discontinue checks for packet
!--- length errors.
Switch(config)#no mls verify ip same-address !--- This configures the switch to discontinue checks for packets that have the
!--- same source and destination IP addresses.
交换机报告以下错误消息:
EARL_NETFLOW-4-TCAM_THRLD:已超过Netflow TCAM阈值,TCAM利用率[[dec]%]
以下示例显示了发生该问题时所显示的控制台输出:
Aug 24 12:30:53: %EARL_NETFLOW-SP-4-TCAM_THRLD: Netflow TCAM threshold exceeded, TCAM Utilization [97%] Aug 24 12:31:53: %EARL_NETFLOW-SP-4-TCAM_THRLD: Netflow TCAM threshold exceeded, TCAM Utilization [97%]
注意:如果要过滤掉此特定错误消息,请注意将过滤具有相同严重性级别的所有错误消息。无法过滤特定日志消息而不影响其他日志,这些日志在相同的严重性级别下。
该消息表示 NetFlow 三重内容可寻址存储器 (TCAM) 几乎已满。将临时启用主动老化。如果将 NetFlow 掩码更改为完整模式,则 NetFlow 的 TCAM 会因为有过多条目而溢出。发出 show mls netflow ip count 命令查看此信息。
Supervisor 引擎 720 会每 30 秒钟检查一次 NetFlow 表的占用情况。当表大小几乎达到 90% 时,Supervisor 引擎会打开主动老化。主动老化的原理是,表即将全满,所以无法创建新的活动流。因此,应该对表内的低活动流(或非活动流)进行主动老化,为高活动流创造空间。
对于 PFC3a 和 PFC3b,每个 Policy Feature Card (PFC) NetFlow 表 (IPv4) 的容量是 128,000 个流。对于 PFC3bXL,容量是 256,000 个流。
要防止此问题,请禁用完整 NetFlow 模式。发出 no mls flow ip 命令。
注意:通常,no mls flow ip命令不会影响数据包转发,因为用于数据包转发的TCAM和用于NetFlow记帐的TCAM是分开的。
要从此问题恢复为正常状态,请启用 MLS 快速老化。启用 MLS 快速老化时间时,最初请设置值为 128 秒。如果 MLS 缓存的大小继续增长至超过 32K 个条目,请减小设置,直至缓存大小小于 32 K。如果缓存继续增长至超过 32K 个条目,请减小正常的 MLS 老化时间。任何不是 8 秒倍数的老化时间值都会调整到最接近的 8 秒倍数值。
Switch#configure terminal Switch(config)#mls aging fast threshold 64 time 30
另一种解决方法是,如果已启用,则禁用内部服务;如果不需要完整流,则删除mls flow ip interface-full。
Switch(config)#no service internal Switch(config)#mls flow ip interface-full
交换机报告以下错误消息,且端口被强制执行链路关闭:
%ETHCNTR-3-LOOP_BACK_DETECTED :在[chars]上检测到Keepalive数据包环回
以下示例显示了发生该问题时所显示的控制台输出:
Oct 2 10:40:13: %ETHCNTR-3-LOOP_BACK_DETECTED: Keepalive packet loop-back detected on GigabitEthernet0/1 Oct 2 10:40:13: %PM-4-ERR_DISABLE: loopback error detected on Gi0/1, putting Gi0/1 in err-disable state
发生该问题的原因是 keepalive 数据包环回到了发送 keepalive 数据包的端口。Keepalive 数据包在 Catalyst 交换机上发送,目的是防止网络中形成环路。默认情况下,在所有接口上启用 Keepalive。您会在检测到并中断环路的设备上发现此问题,而不是在引起环路的设备上。
发出 no keepalive 接口命令以禁用 keepalive。禁用 Keepalive 可以防止因错误而禁用接口,但是不能删除环路。
注意:在基于Cisco IOS软件版本12.2(x)SE的版本及更高版本中,默认情况下不会在光纤和上行链路接口上发送keepalive。
交换机报告以下错误消息:
loadprog: error - on file open boot: cannot load "bootflash:c6msfc2-boot-mz.121-8a.EX"
该问题仅在向设备非对齐写入(接近 64 字节内部边界)时发生。以下情况下可能会发生该问题:
在写入崩溃转储文件期间
由于某些原因,导致系统在写入文件时发生崩溃。
从 CatOS 迁移到 Cisco IOS 软件过程中代码损坏时
解决方法是修改设备驱动程序,使其能够正确处理非对齐访问。如果发生错误的原因是从 CatOS 迁移到 Cisco IOS 软件过程中代码损坏,请清除闪存并下载新的有效 CatOS 软件映像。
交换机报告以下错误消息:
%L3_ASIC-DFC3-4-ERR_INTRPT:中断TF_INT:FI_DATA_INT在EARL %Layer 3 ASIC中发生
该错误消息表示在第 3 层 (L3) 转发专用集成电路 (ASIC) 中出现错误。基本上,交换机会在某些瞬时数据流通过 ASIC 时显示这一消息,而软件仅报告发生中断情况。一旦遇到这一情况,通过 show earl statistics 命令显示的计数器会有所增加。每次软件尝试从这样的状态中恢复时,交换机都会生成该 syslog 消息。通常情况下,如果发生率一直较低,则该消息仅为提供信息之用。但若错误消息频繁出现,则可能是硬件出现问题。
检查 show earl statistics 命令输出中的计数器值。如果计数器迅速增加,表明硬件可能出现了问题。
交换机报告以下错误消息:
%MLS_STAT-SP-4-IP_LEN_ERR: MAC/IP长度不一致
以下示例显示了发生该问题时所显示的控制台输出:
May 29 21:54:14 JST: %MLS_STAT-SP-4-IP_LEN_ERR: MAC/IP length inconsistencies May 29 23:10:44 JST: %MLS_STAT-SP-4-IP_LEN_ERR: MAC/IP length inconsistencies
这些消息表示收到的数据包中,IP 长度与该数据包的 MAC 长度不匹配。Supervisor 引擎丢弃了这些数据包。因为交换机丢弃了数据包,因此对交换机没有负面影响。交换机报告这一消息是用于提供信息。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:
NIC 出错
NIC 驱动程序出错
应用程序出错
使用网络嗅探器找到发送错误数据包的源。然后,解决源设备或源应用程序的问题。
另一种解决方法是将交换机配置为停止检查以下内容:
数据包校验和错误
数据包长度错误
数据包源 IP 地址和目标 IP 地址相同
使用这些命令停止交换机检查:
Switch(config)#no mls verify ip checksum !--- This configures the switch to discontinue checks for packet checksum errors.
Switch(config)#no mls verify ip length !--- This configures the switch to discontinue checks for packet length errors.
Switch(config)#no mls verify ip same-address !--- This configures the switch to discontinue checks for packets that have the
!--- same source and destination IP addresses.
交换机报告以下错误消息:
%MLS_STAT-SP-4-IP_CSUM_ERR: IP校验和错误
以下示例显示了发生该问题时所显示的控制台输出:
Jan 20 12:48:52: %MLS_STAT-SP-4-IP_CSUM_ERR: IP checksum errors Jan 20 14:49:53: %MLS_STAT-SP-4-IP_CSUM_ERR: IP checksum errors
这些消息表示交换机收到的 IP 数据包具有无效校验和值。因为交换机丢弃了数据包,因此对交换机没有负面影响。交换机报告这一消息是用于提供信息。这一问题的原因是网络上的设备发送了错误数据包。以下这些问题及其他问题可能会导致产生错误数据包:
NIC 出错
NIC 驱动程序出错
应用程序出错
请使用以下两个选项之一作为解决方法:
使用网络嗅探器识别发送错误数据包的源。然后,解决源设备或源应用程序的问题。
在交换机硬件中禁用针对以下内容的第 3 层错误检查:
数据包校验和错误
数据包长度错误
要停止这些错误检查,请使用 no mls verify 命令,如以下示例所示:
Switch(config)#no mls verify ip checksum !--- This configures the switch to discontinue checks for packet
!--- checksum errors.
Switch(config)#no mls verify ip length {consistent | minimum} !--- This configures the switch to discontinue checks for packet
!--- length errors.
交换机报告以下错误消息:
%MCAST-SP-6-ADDRESS_ALIASING_FALLBACK:
以下示例显示了发生该问题时所显示的控制台输出:
%MCAST-SP-6-ADDRESS_ALIASING_FALLBACK: Address Aliasing detected for group 0100.5e00.0001 on vlan 632 from possible source ip 10.158.132.185 source mac 0000.bea6.82e0
该消息表示交换机收到过量多播数据流,且数据流目标地址为 01-00-5e-00-00-xx 范围内的多播 MAC 地址。该多播地址范围是预留给 Internet 组管理协议 (IGMP) 控制数据流的,例如:
枝叶
联接
一般查询
通常,交换机 CPU 处理所有的 IGMP 控制数据流。因此,Cisco IOS 软件提供了一种机制,用于忽略发往预留地址的过量 IGMP 多播数据流。该机制确保了 CPU 不会过度使用。这一机制的使用称为“后退模式”。
找到非法多播数据流的源。然后停止传输或修改流特性,使传输不再侵占 IGMP 控制数据空间。此外,可利用问题部分中的错误消息,通过该消息可找到引起该问题的潜在网络源。
交换机报告以下错误消息:
c6k_pwr_get_fru_present():找不到fru类型6的fru_info,#
以下示例显示了发生该问题时所显示的控制台输出:
Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #38 Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #38 Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #43 Mar 10 08:30:53: SP: c6k_pwr_get_fru_present(): can't find fru_info for fru type 6, #43
出现该错误消息的原因是,交换机向 Flex WAN 模块所使用端口适配器的简单网络管理协议 (SNMP) 轮询发出了错误的响应。该错误消息本质上为表面问题,并无有害的交换机性能问题。该问题已在以下版本中得到修复:
Cisco IOS 软件版本 12.1(11b)E4
Cisco IOS 软件版本 12.1(12c)E1
Cisco IOS 软件版本 12.1(13)E
Cisco IOS 软件版本 12.1(13)EC
更高版本
交换机报告以下错误消息:
%MROUTE-3-TWHEEL_DELAY_ERR:
以下示例显示了发生该问题时所显示的控制台输出:
%MROUTE-3-TWHEEL_DELAY_ERR: Exceeded maximum delay (240000 ms) requested: 7200000
当交换机收到通告高保持时间值的独立于协议的多播 (PIM) 加入/修剪数据包时,会出现该消息。该数据包通告的保持时间值高于交换机 OS 允许的最大延迟,即 4 分钟。这些数据包为多播控制数据包,如 PIM、距离矢量多播路由协议 (DVMRP) 以及其他类型。
用于 Catalyst 6500/6000 的 Cisco IOS 软件的更高版本已将这一最大延迟增加至 65,535 秒。该问题已在以下版本中得到修复:
Cisco IOS 软件版本 12.1(12c)E
Cisco IOS 软件版本 12.2(12)T01
Cisco IOS 软件版本 12.1(13)E
Cisco IOS 软件版本 12.1(13)EC
更高版本
对生成 PIM 数据包的第三方设备进行配置,使其使用协议标准推荐的计时器。
交换机报告以下错误消息:
%MCAST-SP-6-GC_LIMIT_EXCEEDED
以下示例显示了发生该问题时所显示的控制台输出:
%MCAST-SP-6-GC_LIMIT_EXCEEDED: IGMP snooping was trying to allocate more Layer 2 entries than what=allowed (13000)
当交换机上的 IGMP 监听功能创建的第 2 层 (L2) 条目达到允许的最大数量时,将会记录该错误消息。默认情况下,交换机可以为多播组创建的 L2 条目最大数量为 15,488。在 Cisco IOS 软件的更高版本中,只有安装了硬件的 L2 多播条目才会计入这一限制。有关详细信息,请参阅Cisco Bug ID CSCdx89380(仅限注册客户)。在 Cisco IOS 软件版本 12.1(13)E1 和更高版本中该问题已得到修复。
可以手动提高 L2 限制。发出 ip igmp l2-entry-limit 命令。
交换机报告以下错误消息:
%MISTRAL-SP-3-ERROR:检测到错误条件: TM_NPP_PARITY_ERROR
以下示例显示了发生该问题时所显示的控制台输出:
Apr 19 22:14:18.237 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR Apr 19 22:14:25.050 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR Apr 19 22:15:20.171 EDT: %MISTRAL-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR
该错误消息表示在内部表管理器的下一页指针中存在奇偶校验错误。如果交换机运行的是 Cisco IOS 软件版本 12.1(8)E 或更高版本,则交换机会检测到奇偶校验错误并重置 Mistral ASIC。然后交换机就可以继续运行,无须重新加载。随机的静电放电或其他外部因素即可导致存储器奇偶校验错误。如果该错误消息仅出现一次或很少出现,请监控交换机 syslog,确认该错误是否为孤立事件。如果这些错误消息重复出现,请向 Cisco 技术支持提出服务请求。
交换机报告以下错误消息:
%MLS_STAT-4-IP_TOO_SHRT:收到的IP数据包太短
以下示例显示了发生该问题时所显示的控制台输出:
*Apr 1 10:30:35 EST: %MLS_STAT-SP-4-IP_TOO_SHRT: Too short IP packets received
该消息表示交换机转发引擎收到的 IP 数据包长度比允许的最短长度还短。交换机丢弃了该数据包。在旧版本中,这样的数据包都会被静默丢弃,并计入转发引擎统计数据中。这一情况适用于早于 7.x 或早于 Cisco IOS 软件版本 12.1(13E) 的软件版本。7.x 之后或 Cisco IOS 软件版本 12.1(13E) 之后的软件版本中,会每隔 30 分钟在 syslog 中记录一次该消息。
对交换机这一方面没有影响。交换机会丢弃错误数据包,接收设备最终也会丢弃此类数据包。唯一需要关注的是发送错误数据包的设备。可能的原因包括:
NIC 驱动程序出错
NIC 驱动程序 bug
应用程序出错
由于硬件限制,Supervisor 引擎不会记录发送错误数据包的源 IP 地址、MAC 地址或设备端口。要检测这些设备并找到源地址,必须使用数据包嗅探应用程序。
问题部分中的消息只是交换机提供的警告/信息性消息。消息中不包含有关源端口、MAC 地址或 IP 地址的任何信息。
在网络内部使用数据包嗅探应用程序。尝试关闭网络内的某个端口或从中删除某个设备,确定是否可以查明发生故障的设备。
交换机报告以下错误消息:
Processor [number] of module in slot [number] cannot service session requests
下列情况下,当您发出 session slot number processor number 命令尝试建立会话时会发生这一错误:
在登录到交换机的同时,尝试与一个其中已建立有会话的模块建立会话。
尝试为插槽中不可用的模块建立会话。
尝试为模块中不可用的处理器建立会话。
交换机报告以下错误消息:
%PM_SCP-1-LCP_FW_ERR:系统正在重置模块[dec]以从错误中恢复: [chars]
这些示例显示了发生这一问题时所显示的控制台输出:
%PM_SCP-SP-1-LCP_FW_ERR:系统正在重置模块13以从错误中恢复:线路卡收到系统异常
或
%PM_SCP-SP-1-LCP_FW_ERR:系统重置模块4以从错误中恢复:Coil Pb Rx奇偶校验错误 — 端口#14
该消息表示指定模块的固件已检测到错误。系统自动重置模块以从该错误中恢复。[dec] 为模块编号,[chars] 为错误。
重新安装模块或将模块放入不同的插槽中,并允许模块完成整个启动诊断测试。有关 Catalyst 6500 系列交换机联机诊断的详细信息,请参阅配置联机诊断。模块通过诊断测试后,请监控该错误消息是否再次出现。如果错误再次出现或诊断测试发现了任何问题,请向 Cisco 技术支持提出服务请求,以进行进一步的故障排除。
交换机报告以下错误消息:
%PM_SCP-2-LCP_FW_ERR_INFORM:模块[dec]遇到以下错误: [chars]
以下示例显示了发生该问题时所显示的控制台输出:
%PM_SCP-SP-2-LCP_FW_ERR_INFORM:模块4遇到以下错误: Bus Asic #0 transient Pb error
模块报告错误情况,其中[dec]是模块编号, [chars]是错误。此情况通常是由安装不当的线卡或硬件故障导致的。如果在所有线卡上看到错误消息,原因是模块安装不正确。
重新拔插并重置线卡或模块。然后发出show diagnostic result module module_#命令。"
如果在重置模块后错误消息仍然存在,请向Cisco技术支持提出服务请求以进行进一步的故障排除。
交换机报告以下错误消息:
%PM_SCP-SP-2-LCP_FW_ERR_INFORM:模块4遇到以下错误:端口或瞬时TX #36错误
此错误消息表示端口36的数据路径中的模块4上出现暂时性错误。在大多数情况下,这是一次性问题/临时问题。
关闭并取消关闭端口Gi4/36,然后监控问题是否再次出现。
如果错误再次出现,请使用diagnostic bootup level complete命令将诊断设置为完成。然后,以物理方式重新拔插线卡。
如果在重置模块后错误消息仍然存在,请通过Cisco技术支持创建服务请求,以便使用以下命令输出进行进一步故障排除:
交换机报告以下错误消息:
%PM_SCP-SP-4-UNK_OPCODE:收到来自模块[dec]、opcode [hex]的未知未经请求的消息
这些示例显示了发生这一问题时所显示的控制台输出:
10年12月10:12:44:18.117: %PM_SCP-SP-4-UNK_OPCODE:从模块2收到了未知的未经请求的消息,opcode 0x330
或
10年12月10日12:44:25.210: %PM_SCP-SP-4-UNK_OPCODE:从模块2收到了未知的未经请求的消息,opcode 0x114
该错误消息仅表示,由于交换机 Cisco IOS 软件版本不支持某些功能,Supervisor 引擎无法识别来自板卡的控制消息。
板卡向活动的 Supervisor 引擎发送控制消息,其中表明了软件支持的功能。但若软件不支持板卡的任何功能,将无法识别这些控制消息,从而显示该错误消息。该消息的出现是无害的,并不会影响 Supervisor 引擎或板卡的任何功能。
将 Supervisor 引擎软件升级到支持最多功能的最新版本。因为该错误消息并不影响生产或数据流,因此可以忽略该消息。
交换机报告以下错误消息:
%PM_SCP-SP-3-TRANSCEIVER_BAD_EEPROM: LAN端口5/2中收发器的完整性检查失败:密钥错误
出现此错误消息的原因是使用了不受支持的非Cisco SFP GBIC。
Cisco SFP GBIC具有唯一的加密代码(Quality ID),可使Cisco IOS/CAT操作系统识别思科可插拔部件。普通GBIC没有此功能,因此它们可能正常工作。有关详细信息,请参阅%PM_SCP-SP-3-TRANSCEIVER_BAD_EEPROM。
交换机报告以下错误消息:
%PM_SCP-SP-3-LCP_FW_ABLC:来自模块3的延迟冲突消息,端口:035
延迟冲突 — 如果两台设备同时传输,并且连接两端均未检测到冲突,则会发生延迟冲突。发生这种冲突的原因是从网络的一端向另一端传播信号的时间长于将整个数据包放在网络上的时间。导致延迟冲突的两台设备互相看不到对方正在发送数据,直至将整个数据包放在网络上。在第一个 64 字节时隙之前,发射器未检测到延迟冲突。这是因为只有在传输大于 64 字节的数据包时才会检测到这种冲突。
可能原因 — 延迟冲突是由于网络中存在双工不匹配、电缆不正确或不符合规定的集线器数量造成的。NIC 损坏也可能导致延迟冲突。
交换机报告以下错误消息:
%PM-3-INVALID_BRIDGE_PORT: Bridge Port number is out of range
此问题看似表面问题,是由于mib dot1dTpFdbEntry的SNMP轮询。
您可以阻止在此设备上轮询OID。此缺陷从Cisco IOS版本12.2(33)SRD04及更高版本修复。
交换机报告以下错误消息:
%QM-4-TCAM_ENTRY:超出硬件TCAM条目容量
TCAM 是供 ACL 和 QoS 引擎用于快速表查询的专用存储器。该消息表示 TCAM 资源耗尽,软件正在交换数据包。这意味着每个端口在 TCAM 中都有自己对应的 ID,因此占用了更多的 TCAM 资源。此问题很有可能是由 mls qos marking statistics 命令引起的,或是在硬件 TCAM 没有容量处理所有已配置 ACL 时发生的。
请禁用 mls qos marking statistics 命令,因为默认情况下该命令处于启用状态。
尝试在多个接口间共享同样的 ACL,以减少 TCAM 资源争用。
交换机报告以下错误消息:
%slot_earl_icc_shim_addr:插槽[num]既不是SuperCard也不是Supervisor — 插槽无效
当 SNMP 管理器向没有任何 TCAM 信息的板卡轮询 TCAM 数据时,会出现该消息。这一情况仅会发生在运行 Cisco IOS 软件的 Catalyst 6500 交换机板卡上。在 SNMP 轮询期间,如果板卡有 TCAM 信息,则数据将提供给网络管理系统 (NMS) 进行进一步的处理。有关详细信息,请参阅Cisco Bug ID CSCec39383(仅限注册客户)。该问题已在 Cisco IOS 软件版本 12.2(18) 中得到修复。
作为解决方法,您可以通过 NMS 阻止 TCAM 数据查询。提供 TCAM 使用数据的 MIB 对象为 cseTcamUsageTable。要避免反向追踪,请在路由器上完成这些步骤:
发出 snmp-server view tcamBlock cseTcamUsageTable exclude 命令。
发出 snmp-server view tcamBlock iso included 命令。
发出 snmp-server community public view tcamBlock ro 命令。
发出 snmp-server community private view tcamBlock rw 命令。
交换机报告以下错误消息:
%SYSTEM_CONTROLLER-SP-3-ERROR:检测到错误条件: TM_NPP_PARITY_ERROR
以下示例显示了发生该问题时所显示的控制台输出:
Feb 23 21:55:00: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR Feb 23 22:51:32: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR Feb 23 23:59:01: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_NPP_PARITY_ERROR
在 MSFC 上来自 Mistral ASIC 的最常见错误是 TM_DATA_PARITY_ERROR、SYSDRAM_PARITY_ERROR、SYSAD_PARITY_ERROR 和 TM_NPP_PARITY_ERROR。导致这些奇偶校验错误的可能原因是随机静电放电或其他外部因素。该错误消息表示存在奇偶检验错误。处理器内存奇偶校验错误(PMPE)分为两种类型:单事件颠倒(SEU)和重复错误。
当数据字中的某一位因为外部事件(例如导致 0 自发更改为 1 的事件)发生意外更改时,就会发生此类单个位错误。SEU 是一种与供应商和技术无关的普遍现象。SEU 发生频率很低,但所有计算机和网络系统,甚至是 PC 都有可能发生这样的问题。SEU 也称为软错误,它由噪声产生,会在数据中导致瞬时、不一致的错误,这与组件故障无关 - 大多数情况下是宇宙辐射产生的结果。
重复错误(常称为硬错误)是由故障组件造成的。硬错误是由故障组件或电路板级问题造成的,例如制造不当的印刷电路板会导致同一错误的重复发生。
如果该错误消息仅出现一次或很少出现,请监控交换机 syslog,确认该错误是否为孤立事件。如果这些错误消息重复出现,请重新安装 Supervisor 引擎刀片。如果错误停止,则这是硬奇偶校验错误。如果这些错误消息继续重复出现,请通过技术支持中心建立案例。
交换机报告以下错误消息:
%SYSTEM_CONTROLLER-SW2_SPSTBY-3-ERROR:检测到错误条件:TM_NPP_PARITY_ERROR
此错误消息表示存在奇偶校验错误,可能的原因是随机静态放电或其他外部因素,这些因素导致内存奇偶校验错误,例如瞬时后面板连接或可能由于电源问题而发生,有时线路卡无法访问模块上的串行PROM(SPROM)内容以确定线路卡的标识。
所有计算机和网络系统都极易发生单事件颠覆(SEU),有时被称为奇偶校验错误。当数据字中的一个位由于外部事件而意外改变时,会发生这些单个位错误,例如,导致零自发地改变为1。SEU是一种普遍现象,与供应商和技术无关。SEU 发生频率很低,但所有计算机和网络系统,甚至是 PC 都有可能发生这样的问题。SEU也称为软错误,由噪声引起,导致数据中出现瞬时的、不一致的错误,与组件故障无关。
重复错误(通常称为硬错误)是由组件故障导致的。硬错误是由组件故障或导致同一错误的重复出现的板级问题(如印刷电路板制造不当)导致的。
如果再次出现这些错误消息,请在维护时段重新安装Supervisor模块。
交换机报告以下错误消息:
SP:信道14的线卡端点失去同步。到较低交换矩阵,正在尝试立即恢复!
错误消息通常指向一个安装不当的板卡。大多数情况下,您可以实际重新安装这一板卡以解决该问题。在某些情况下,模块存在故障。
发出 show fabric fpoe map 命令,以识别导致该错误消息的模块。
Switch#configure terminal Switch(config)#service internal Switch(config)#end Switch#show fabric fpoe map Switch#configure terminal Switch(config)#no service internal Switch(config)#end
以下示例是 show fabric fpoe map 命令的结果。从输出信息中,您可以确定此错误消息是由插槽 12 中的模块导致的。
switch#show fabric fpoe map slot channel fpoe 12 0 14 << There are also related errors in "show fabric channel-counters" : slot channel rxErrors txErrors txDrops lbusDrops 1 0 1 0 0 0 2 0 16 0 0 0 3 0 16 0 0 0
重新安装导致错误消息的模块。
Cisco Catalyst 6000/6500 交换机启动时,它会给出类似以下的错误消息:
%SYSTEM-1-INITFAIL: Network boot is not supported. Invalid device specified Booting from default device Initializing ATA monitor library... monlib.open(): Open Error = -13 loadprog: error - on file open boot: cannot load "bootdisk:s72033-ipservicesk9-mz.122-18.SXF7.bin"
在未正确配置启动变量以从有效闪存设备中启动交换机时,通常会出现此错误。
注意以上示例消息的最后一行:
boot: cannot load "bootdisk:s72033-ipservicesk9-mz.122-18.SXF7.bin"
其中提及的闪存设备名称为 bootdisk,并且通过 IOS 文件名的第一部分 s72033 可以看出,该 IOS 用于 Supervisor 模块 720。Supervisor 720 模块没有或不支持名为 bootdisk 的闪存设备。因为 Supervisor 720 模块没有符合该名称的本地闪存,交换机认为您希望从网络启动,所以它显示了这一错误消息。
使用正确的闪存设备名称和有效的软件文件名配置启动变量。
Supervisor 模块支持以下这些闪存设备:
Supervisor 引擎 1 和 Supervisor 引擎 2
闪存设备名称 | 描述 |
---|---|
bootflash: | 板载闪存 |
slot0: | 线性闪存 PC 卡(PCMCIA 插槽) |
disk0: | ATA 闪存 PC 卡(PCMCIA 插槽) |
Supervisor 引擎 720
闪存设备名称 | 描述 |
---|---|
bootflash: | 板载闪存 |
disk0: | 仅 CompactFlash II 型卡(disk 0 插槽) |
disk1: | CompactFlash II 型卡(disk 1 插槽) |
Supervisor 引擎 32
闪存设备名称 | 描述 |
---|---|
启动磁盘: | 板载闪存 |
disk0: | 仅 CompactFlash II 型卡(disk 0 插槽) |
如果该方法无法解决问题,请参阅从损坏或丢失的启动加载程序映像或 ROMmon 模式中恢复运行 Cisco IOS 系统软件的 Catalyst 6500/6000。
交换机报告以下错误消息:
CPU_MONITOR-3-TIMED_OUT: CPU monitor messages have failed, resetting system CPU_MONITOR-6-NOT_HEARD: CPU monitor messages have not been heard for [dec] seconds
这些消息表示已有很长时间未侦听 CPU 监控消息。很可能发生了超时,使得系统重置。[dec] 为秒数。
问题的发生可能是由于以下这些原因:
板卡或模块安装不当
ASIC 或底板受损
软件 Bug
奇偶校验错误
以太网带外信道 (EOBC) 信道中流量过高
EOBC 信道是一种半双工信道,供其他多种功能使用,其中包括发往交换机的简单网络管理协议 (SNMP) 数据流和数据包。如果因 SNMP 流量激增而导致 EOBC 信道充满消息,便会发生信道冲突。发生这种情况时,EOBC 可能会无法传输 IPC 消息。这就导致交换机显示该错误消息。
重新安装板卡或模块。如果可以安排维护窗口,请重置交换机以清除所有瞬时问题。
运行 Cisco IOS 系统软件的 Catalyst 6500 系列交换机会收到 %Invalid IDPROM image for linecard 错误消息。
该错误消息看起来可能会与这些消息类似:
% Invalid IDPROM image for daughterboard 1 in slot 4 (error = 4) % Invalid IDPROM image for linecard in slot 5 (error = 4) % Invalid IDPROM image for daughterboard 1 in slot 5 (error = 4)
该错误消息表示由于 Supervisor 在控制总线上生成了错误信号,导致安装的板卡未得到正确启动。某些情况下可以看到,安装不当也会导致 Cat6500 机箱无法识别 Supervisor 或板卡。有关详细信息,请参阅Cisco Bug ID CSCdz65855(仅限注册客户)。
如果冗余 Supervisor 设置可用,请执行强制切换并且重新安装原始活动 Supervisor。
如果是单个 Supervisor 设置,请安排停机时间,并且完成这些步骤:
将 Supervisor 模块移到另一个插槽中。
重新安装所有的板卡,并确保板卡安装到位。
有关模块在线插拔的详细信息,请参阅 Cisco Catalyst 交换机中模块的在线插拔 (OIR)。
交换机报告以下错误消息:
%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 61 seconds [2/0] %CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 151 seconds [2/0] %CPU_MONITOR-SP-3-TIMED_OUT: CPU_MONITOR messages have failed, resetting module [2/0] %OIR-SP-3-PWRCYCLE: Card in module 1, is being power cycled off (Module not responding to
Keep Alive polling) %OIR-SP-3-PWRCYCLE: Card in module 2, is being power-cycled off (Heartbeat Messages Not
Received From Module)
Supervisor每2秒向每个线卡发送一次SCP ping。如果在3次ping(6秒)后未收到响应,则视为第一次失败。在25次这样的连续故障后,或者在150秒内未收到来自线路卡的响应后,管理引擎会关闭该线路卡的电源。每30秒后,交换机上会出现以下错误消息:
%CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 61 seconds [2/0] %CPU_MONITOR-SP-6-NOT_HEARD: CPU_MONITOR messages have not been heard for 151 seconds [2/0]
150秒后,模块将使用以下系统日志重新通电:
%CPU_MONITOR-SP-3-TIMED_OUT: CPU_MONITOR messages have failed, resetting module [2/0] %OIR-SP-3-PWRCYCLE: Card in module 1, is being power-cycled off (Module not responding to
Keep Alive polling) %OIR-SP-3-PWRCYCLE: Card in module 2, is being power-cycled off (Heartbeat Messages Not
Received From Module)
交换机报告以下错误消息:
%C6KPWR-4-DISABLED: Power to module in slot [dec] set [chars]
以下示例显示了发生该问题时所显示的控制台输出:
%C6KPWR-SP-4-DISABLED: power to module in slot 10 set off (Fabric channel errors) %C6KPWR-SP-4-DISABLED: power to module in slot 2 set off (Module Failed SCP dnld) %C6KPWR-SP-4-DISABLED: power to module in slot 9 set off (Module not responding to Keep
Alive polling)
该消息表示在所示插槽中的模块由于所示原因而被断电。[dec] 为插槽编号,[chars] 表示电源状态。
交换机存在正常振动,随着时间的推移,这些振动会导致模块轻微脱离底板。发生这一情况时,Supervisor keepalive 轮询将无法在分配的时间内收到来自该模块的响应,Supervisor 会重新启动该模块以尝试获得与该模块建立更好的连接。如果模块仍然不响应轮询,Supervisor 将连续重新启动模块,并最终将其置为 error disable,且不允许为该模块提供电源。
简单地重新安装该模块可在 90% 的时间修复这一问题。如果重新安装该模块,则可重新对齐交换矩阵并确保与底板稳固连接。
如果有问题的模块是内容交换模块 (CSM),请考虑将 CSM 软件升级至版本 4.1(7) 或更高版本。此问题记录在Cisco Bug ID CSCei85928(针对CSM软件)(仅限注册客户)和Cisco Bug ID CSCek28863(针对Cisco IOS软件)(仅限注册客户)上。
最新的 CSM 软件可以从 Cisco Catalyst 6000 内容交换模块软件下载页下载。
交换机报告以下错误消息:
ONLINE-SP-6-INITFAIL: Module [dec]: Failed to [chars]
以下示例显示了发生该问题时所显示的控制台输出:
%ONLINE-SP-6-INITFAIL: Module 5: Failed to synchronize Port asic
崩溃的原因是 Pinnacle ASIC 同步失败。这通常是由于接触不良或卡安装不当造成的。
无需用户干涉,系统将会恢复。如果该错误消息重复出现,请重新安装有问题的板卡或模块。
交换机报告以下错误消息:
%FM_EARL7-4-FLOW_FEAT_FLOWMASK_REQ_FAIL: Flowmask request for the flow based feature [chars] for protocol [chars] is unsuccessful, hardware acceleration may be disabled for the feature
以下示例显示了发生该问题时所显示的控制台输出:
%FM_EARL7-4-FLOW_FEAT_FLOWMASK_REQ_FAIL: Flowmask request for the flow based feature Reflexive ACL for protocol IPv4 is unsuccessful, hardware acceleration may be disabled for the feature
基于流的功能的流掩码请求不成功。发生这种情况的原因可能是 TCAM 资源异常、流掩码寄存器资源异常,或与其他基于 NetFlow 的功能存在无法解决的流掩码冲突。在这种情况下,可能会禁用该功能的 NetFlow 快捷方式安装和硬件加速,并在软件中应用该功能。
如果仅有入口自反 ACL,并在不同接口的入口方向配置反射和评估,则自反 ACL 流掩码要求将基于入口自反 ACL。只要配置自反 ACL 的接口与 QoS 微流策略不同,或在同一接口上但自反 ACL 与微流策略策略 ACL 无重叠,两者就可以在硬件中共存。如果两者在同一接口上,且自反 ACL 和 QoS 策略重叠,则自反 ACL 将禁用 NetFlow 快捷方式安装,流量匹配自反 ACL 将使用软件进行交换。这是因为流掩码请求相互冲突。
对于出口自反 ACL,因为只有入口 NetFlow,所以自反 ACL 流掩码请求在所有接口上是全局性的。如果在这种情况下配置基于 QoS 用户的微流策略,自反 ACL 将禁用 NetFlow 快捷方式安装,流量匹配自反 ACL 将使用软件进行交换。
发出 show fm fie flowmask 命令,确定该功能的 NetFlow 快捷方式安装启用/禁用状态。如果该功能的 NetFlow 快捷方式安装和硬件加速处于禁用状态,请仅使用入口自反访问列表和微流策略,确保微流监察器与自反访问列表无重叠。重新应用该功能,以使流掩码请求成功,并重新启用该功能的 NetFlow 快捷方式安装。
交换机报告以下错误消息:
%MCAST-2-IGMP_SNOOP_DISABLE:IGMP Snooping disabled due to excessive events/packets, [dec]/[dec]; auto reenable in about 2 mins
以下示例显示了发生该问题时所显示的控制台输出:
%MCAST-2-IGMP_SNOOP_DISABLE:IGMP Snooping disabled due to excessive events/packets, 0/19880; auto reenable in about 2 mins
IGMP 监听已禁用,但是系统收到了多播数据流。这种情况将强制多播数据包发往路由处理器,可能会导致路由处理器泛洪。IGMP 监听会因为多播数据流过量而自动禁用。基本上,IGMP 监听会查看在路由器和主机之间交换的这些控制数据包,并根据加入、离开和查询更新收到多播数据流的端口。
出现该消息的原因通常是,路由处理器收到的发往预留第 3 层/第 2 层多播地址范围的 IGMP 加入数据包或正常多播数据包远远高于预期比率。因此交换机耗尽了资源,正如日志消息所报告的,交换机将在短时期内减少和禁用 IGMP 监听。
可以启用多播速度限制功能,并将阈值设置为更大的数值。
速度限制是一个较理想的方法,它使队列无法溢出,同时也意味着有效 IGMP 数据包被丢弃的机会更小,因此交换机上的监听进程仍可以适当更新。
要对此问题进行故障排除,请执行以下步骤:
使用命令 no ip igmp snooping 禁用 IGMP 监听。
在 Catalyst 6500 的管理 VLAN 接口上设置 SPAN 会话,以确定 MAC 地址属于过量数据流源。
查看 CAM 表,以识别并删除该源。
重新启用 IGMP 监听。
交换机报告以下错误消息。错误消息可以是以下两种类型之一:
C6KERRDETECT-2-FIFOCRITLEVEL: System detected an unrecoverable resources error on the
active supervisor pinnacle
C6KERRDETECT-2-FIFOCRITLEVEL: System detected unrecoverable resources error on active
supervisor port-asic
该错误的根本原因可能是有缺陷的模块或安装不当的模块。也可能是该特定插槽有问题的机箱。如果是因为模块安装不当,则该问题可能是个瞬时问题。
这些消息表明系统检测到了不可恢复的资源,原因在于所示 Pinnacle ASIC 或指定端口 ASIC 上存在先进先出 [FIFO] 问题。
发出remote command switch show platform hardware asicreg pinnacle slot 1 port 1 err命令以解决此错误,并将交换机配置为通过以下步骤运行增强型硬件测试:
注意:键入整个命令并按Enter键键。您无法使用 Tab 键写入命令。
发出 diagnostic bootup level complete 命令将诊断级别设置为完成,并保存配置。
重新安装 Supervisor 并将其牢固插入
一旦 Supervisor 联机,请发出 show diagnostic 命令监控交换机,检查错误消息是否仍然存在
交换机报告以下错误消息:
%C6KERRDETECT-SP-4-SWBUSSTALL:交换总线遇到停顿3秒
%C6KERRDETECT-SP-4-SWBUSSTALL_RECOVERED:交换总线停止已恢复,数据流量交换继续
%C6KERRDETECT-SP-4-SWBUSSTALL消息指示交换总线已停止且数据流量丢失。
%C6KERRDETECT-SP-4-SWBUSSTALL_RECOVERED消息指示交换总线不再停止,并且数据流量可以继续。
基本上,如果系统总线上的任何一个模块挂起,则Supervisor会检测超时并尝试自行恢复。如果模块正在安装,则很可能是因为安装过程中出现这些消息,因为当模块插入背板时,这可能会导致总线停止。
当带内测试 ping 由于 CPU 使用率过高而失败时,就会收到这一错误消息:
SP-RP Ping Test[7]: Test skipped due to high traffic/CPU utilization
SP-RP 带内 ping 是一种联机诊断测试,SP-RP ping test failed 消息纯粹用于提供信息。它表示 CPU 使用率过高,可能是过量数据流通过路由处理器的结果,或是交换数据流流向交换机处理器的结果。这也可能在任何路由更新时发生。有时候路由处理器 CPU 使用率达到 100% 是正常的。
该错误消息纯粹用于提供信息,不会对设备性能产生任何影响。
交换机报告以下错误消息:
%SW_VLAN-4-MAX_SUB_INT : The number of sub-interfaces allocated for interface [chars] has exceeded recommended limits of [dec]
以下示例显示了发生该问题时所显示的控制台输出:
%SW_VLAN-4-MAX_SUB_INT: The number of sub-interfaces allocated for interface Gi1/1 has exceeded recommended limits of 1000
第 3 层子接口的数量受到交换机内部 VLAN 的限制。Catalyst 6500 系列有 4094 个 VLAN,用于多种目的。发出 show platform hardware capacity vlan 命令,以了解当前 VLAN 的可用性状态。
Switch#show platform hardware capacity vlan VLAN Resources VLANs: 4094 total, 9 VTP, 0 extended, 17 internal, 4068 free
推荐每个接口限制 1000 个子接口,每个模块限制 2000 个子接口。超出推荐的限制时,请减少为接口所分配的子接口数量。
注意:由于交换机重新加载时显示的大量消息,控制台可能会被锁定。此问题记录在Cisco Bug ID CSCek73741(仅限注册客户)中,该问题在Cisco IOS软件版本12.2(18)SXF10和Cisco IOS软件版本12.2(33)SXH或更高版本中已得到解决。
交换机报告以下错误消息:
MCAST-6-L2_HASH_BUCKET_COLLISION: Failure installing (G,C)->index: ([enet],[dec])->[hex] Protocol :[dec] Error:[dec]
以下示例显示了发生该问题时所显示的控制台输出:
%MCAST-SP-6-L2_HASH_BUCKET_COLLISION: Failure installing (G,C)->index: (0100.5e31.d522,802)->0xDA4 Protocol :0 Error:3
该错误消息通常与以下消息一同出现:
%MCAST-SP-6-GC_LIMIT_EXCEEDED: IGMP snooping was trying to allocate more Layer 2 entries than what allowed (15488)
该消息表示第 2 层条目未在硬件中安装,因为 Hash Bucket 内没有足够的空间。多播数据包在传入 VLAN 中泛洪,因为第 2 层条目安装失败。当超过限制时,其他的组 MAC 也将发生泛洪。
如果未使用多播,则可以禁用 IGMP 监听。否则,您可以使用ip igmp snooping l2-entry-limit命令增加散列条目限制。
交换机报告以下错误消息:
%QM-4-AGG_POL_EXCEEDED: QoS Hardware Resources Exceeded : Out of Aggregate policers
仅有限数量的聚合监察器可得到支持。在基于 EARL7 的交换机上,该限制为 1023。
您可以配置基于 VLAN 的 QoS,而不是基于端口的 QoS。请完成以下步骤:
对第 2 层交换机端口上配置的每个 VLAN 应用服务策略。
从属于特定 VLAN 的每个端口上删除服务策略。
使用 mls qos vlan-based 命令为每个第 2 层交换机端口配置基于 VLAN 的 QoS。
交换机报告以下错误消息:
%EC-SP-5-CANNOT_BUNDLE2:与Gi2/1不兼容,将被挂起(Gi2/2的MTU为1500,Gi2/1为9216)
此错误消息指示端口通道成员的MTU不同,因此会导致端口通道添加失败。默认情况下,所有接口使用MTU大小为1500。由于MTU值不匹配,端口无法添加到端口通道。
在这些成员端口上配置相同的MTU。
交换机报告以下错误消息:
%EC-SP-5-CANNOT_BUNDLE2: Gi1/4与Gi6/1不兼容,将被挂起(Gi1/4的流控制发送已关闭,Gi6/1已打开)
此错误消息指示速度或流量控制不匹配,因此原因是端口通道添加失败。
检验接口配置是否参与端口通道。
交换机报告以下错误消息:
%CFIB-7-CFIB_EXCEPTION: FIB TCAM exception, Some entries will be software switched
错误消息表明安装的路由条目数量即将达到硬件FIB容量或针对指定协议设置的最大路由限制。如果达到限制,则丢弃一些前缀。
重新加载路由器以退出异常模式。在全局配置模式下输入mls cef maximum-routes命令以增加协议的最大路由数。默认情况下,SUP上的一个PFC3具有192K条目的容量,但如果您使用mls cef maximum-routes 239命令,则此选项可以使用最大可用的TCAM条目。使用show mls cef maximum-routes命令检查最大路由。使用show mls cef summary命令(该命令显示CEF表信息的摘要)检查当前使用情况。
Module 5(supervisor)未通过show diagnostic result module module_# 的输出中指示的TestMatchCapture诊断测试:
TestMatchCapture ----------------> F Error code ------------------> 59 (DIAG_L2_INDEX_MISMATCH_ERROR) Total run count -------------> 1 Last test execution time ----> Jun 25 2011 04:49:10 First test failure time -----> Jun 25 2011 04:49:10 Last test failure time ------> Jun 25 2011 04:49:10 Last test pass time ---------> n/a Total failure count ---------> 1 Consecutive failure count ---> 1
TestMatchCapture测试是TestProtocolMatchChannel和TestCapture测试的组合,如下所述:
TestProtocolMatchChannel - TestProtocolMatchChannel测试用于验证匹配第2层转发引擎中的特定第2层协议的能力。当您在Supervisor引擎上运行测试时,诊断数据包将从Supervisor引擎的带内端口发送,并使用第2层转发引擎执行数据包查找。对于启用DFC的模块,诊断数据包通过交换矩阵从Supervisor引擎的带内端口发送,并从其中一个DFC端口环回。第2层转发引擎在诊断数据包查找期间会验证Match功能。
TestCapture - TestCapture测试验证第2层转发引擎的捕获功能是否正常工作。捕获功能用于组播复制。当您在Supervisor引擎上运行测试时,诊断数据包将从Supervisor引擎的带内端口发送,并使用第2层转发引擎执行数据包查找。对于启用DFC的模块,诊断数据包通过交换矩阵从Supervisor引擎的带内端口发送,并从其中一个DFC端口环回。第2层转发引擎在诊断数据包查找期间会验证捕获功能。
当您有机会时,请重新安装模块。由于这些是小错误,如果您看不到对性能的任何影响,可以忽略这些错误。
交换机报告以下错误消息:
%CONST_DIAG-SP-3-HM_PORT_ERR: Port [dec] on module [dec] failed [dec] consecutive times. Disabling the port.
以下示例显示了发生该问题时所显示的控制台输出:
%CONST_DIAG-SP-3-HM_PORT_ERR: Port 5 on module 2 failed 10 consecutive times. Disabling the port.
该错误消息表示与端口对应的数据路径出现故障。端口将处于errdisable状态。
重置线路卡以查看问题是否自行解决。
交换机报告以下错误消息:
%CONST_DIAG-SP-4-ERROR_COUNTER_WARNING: Module 7 Error counter exceeds threshold, system operation continue. %CONST_DIAG-SP-4-ERROR_COUNTER_DATA: ID:42 IN:0 PO:255 RE:200 RM:255 DV:2 EG:2 CF:10 TF:117
检查诊断结果:
TestErrorCounterMonitor ---------> . Error code ------------------> 0 (DIAG_SUCCESS) Total run count -------------> 33658 Last test execution time ----> Apr 15 2012 11:17:46 First test failure time -----> Apr 03 2012 20:11:36 Last test failure time ------> Apr 08 2012 19:24:47 Last test pass time ---------> Apr 15 2012 11:17:46 Total failure count ---------> 5 Consecutive failure count ---> 0 Error Records ---------------> n/a
TestErrorCounterMonitor通过定期轮询在板卡中维护的错误计数器来监控系统中每个模块上的错误/中断。
当线卡上的ASIC收到具有不良CRC的数据包时,此错误消息弹出。此问题可能属于此模块本地问题,也可能由机箱中的某个其它故障模块触发。这也可能是由于Pinnacle asic从DBUS接收的CRC错误帧引起的。即,错误消息暗示通过模块7上的总线接收了错误数据包。
出现错误消息的原因之一是由于模块安装不当,导致模块无法与机箱的底板正确通信。线卡(模块安装不正确)、管理引擎或数据总线有问题。但是,不可能说哪个组件损坏了数据并导致了错误的CRC。
首先,对模块7进行重新定位,并确保螺钉紧固良好。此外,在重新拔插之前,请使用diagnostic bootup level complete命令将诊断程序设置为完成。
重新安装完成后,将对模块运行完全诊断程序。然后,您可以确认模块7上没有硬件问题。
交换机报告以下错误消息:
%SYS-3-PORT_RX_BADCODE:Port [dec]/[chars] detected [dec] bad code errors in last 30 minutes
以下示例显示了发生该问题时所显示的控制台输出:
%SYS-3-PORT_RX_BADCODE: Port 3/43 detected 7602 bad code error(s) in last 30 minutes
此错误消息表示端口受到未知协议错误的影响。例如,Catalyst 6500系列交换机收到其不知道或无法识别的协议帧。第一个[dec]是模块编号, [chars]是端口号,第二个[dec]是在最近30分钟内遇到的未知协议的入站数据包的数量。
以下是错误消息的可能原因:
由于速度和双工设置不匹配。
CDP在一端启用,而在另一端未启用。
由于DTP,这在交换机接口上默认启用。由于路由器不理解DTP,因此可能导致一些问题。
检查接口上的残帧计数器。如果增加,则接口上可能存在双工不匹配问题。