简介
本文档介绍对MDS 9000平台执行自动运行状况和配置检查的过程和要求。
先决条件
要求
只有运行受支持的NX-OS®软件版本的MDS平台支持自动运行状况和配置检查。
支持以下硬件平台:
- 所有尚未达到最后支持日期的MDS 9000系列交换机:硬件请点击此处参阅MDS生命周期终止和销售终止通知:
生命周期终止和销售终止通知
使用的组件
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
规则
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
运行状况和配置检查过程
要对MDS交换机执行自动运行状况和配置检查,请在Cisco Support Case Manager上使用下列一组关键字提交常规TAC服务请求:
技术:数据中心和存储网络
子技术:MDS9000 -运行状况和配置检查(自动)
问题代码:运行状况和配置检查
对于打开的TAC SR,上传从交换机捕获的“show tech-support details”命令的输出,格式为.txt或.gz/.tar。 目前支持以ASCII和UTF-8文本格式捕获的show tech-support details文件。有关上传说明,请参阅TAC客户文件上传。
从NX-OS 8.4(2d)和9.2(1)开始,MDS tac-pac命令已得到增强,可在bootflash上快速创建包含show tech-support详细信息以及附加的show logging onboard的文件。对于任何需要显示技术支持详细信息(包括自动运行状况和配置检查案例)的TAC服务请求(SR),这是创建输入文件的首选方法。
在所需输出附加到SR后,Cisco Automation将分析日志,并在发送给您的邮件中提供报告(PDF格式)。报告包含检测到的问题的列表、排除问题的相关步骤以及建议的行动计划。
如果对报告的运行状况检查失败存在问题,建议用户打开一个包含适当关键字的单独服务请求以获取进一步帮助。强烈建议参考为自动运行状况和配置检查打开的服务请求(SR)编号以及生成的报告,以加快调查速度。
严重性级别
下表列出了下一个标准NX-OS严重性级别及其定义。
严重级别 |
描述 |
紧急(0) |
系统不可用. |
警报(1) |
危急情况,需要立即注意 |
关键信息 (2) |
主要情况。 |
错误(3) |
轻微情况。 |
警告(4) |
警告情况. |
通知(5) |
基本通知和参考消息。可能 无关紧要。 |
信息(6) |
表示返回到正常状态的正常事件。 |
运行状况和配置检查模块
自动MDS运行状况和配置检查版本1 (2023年5月版本)执行表1中列出的检查。
表1:运行状况检查模块和模块使用的相关CLI
索引 |
运行状况检查模块 |
单元简要说明 |
用于执行运行状况检查的CLI |
1 |
NX-OS版本检查 |
检查设备是否运行思科推荐的NX-OS软件版本。 |
show version |
2 |
MDS收发器检查EOL/EOS |
检查是否有任何收发器处于生命周期终止(EOL)或销售终止(EOS)状态。 |
show version show clock show hardware |
3 |
MDS交换机上FC接口的数据速率使用率 |
检查接口输入和输出速率。列出利用率高于80%的接口上的前10个接口和警报。 |
show version show interface brief show interface |
4 |
MDS交换机的收发器详细信息 |
检查接口温度、电压、电流、发射功率或接收功率的额定值。如果检测到故障,建议后续步骤。 |
show version show hardware 显示接口收发器详细信息 |
5 |
根据正在运行的NX-OS版本检查PSIRT缺陷 |
根据硬件/软件和配置与多种PSIRT进行匹配。这并非详尽无遗。 |
show version show running-config |
6 |
MDS检查时钟信息 |
检查建议的时钟配置,并提供建议的时钟配置示例。 |
show running-config show clock |
7 |
MDS硬件检查,以查找EOL/EOS |
确定MDS模块和机箱的寿命终止(EOL)和支持终止(EOS)日期。 |
show version show module show hardware show inventory |
8 |
MDS软件检查EOL/EOS |
确定MDS NX-OS版本的生命周期终止(EOL)和支持终止(EOS)日期。 |
show version show module |
9 |
MDS FCNS数据库和FLOGI数据库一致性检查 |
检查show FCNS数据库和show FLOGI数据库输出之间的一致性。 |
show version show hardware show flogi database show fcns database local vsan 1-4093 |
10 |
MDS检查所有VSAN在所有TF端口上处于启用和活动状态 |
检查以确保所有TF端口都允许所有VSAN处于活动状态,没有隔离或初始化状态的VSAN。 |
show version show hardware show interface show interface brief show port-channel database |
11 |
MDS检查所有VSAN在所有TE端口上处于启用和活动状态 |
检查以确保所有TE端口都允许所有VSAN处于活动状态,没有隔离或初始化状态的VSAN。 |
show version show module show interface show interface brief show port-channel database |
12 |
MDS OUI检查远程设备 |
检查以确保MDS识别通过中继和端口通道连接连接的OUI。 |
show flogi internal event-history errors show port internal event-history error show system internal fcfwd idxmap interface show flogi internal event-history debugs show accounting log |
13 |
MDS CFS锁定检查 |
检查CFS锁和清除锁的建议步骤。 |
show version show module show hardware show cfs lock show logging log show cfs internal session-history show cfs peers show fcdomain domain-list show cfs internal event-history errors show clock |
14 |
MDS检查活动的Supervisor Mgmt0链路 |
检查活动或仅supervisor mgmt0链路状态是否显示“up”。 |
show version show interface mgmt0 |
15 |
MDS 9700检查备用Supervisor Mgmt0链路 |
检查备用supervisor mgmt0链路状态是否显示“up”。仅对运行NX-OS 9.2(1)及更高版本的MDS 9700导向器有效。 |
show version show interface mgmt0 standby |
16 |
MDS次优PC成员分配检查 |
端口通道对于多交换机光纤通道SAN中的恢复能力非常重要。为最大容错和硬件资源利用率配置端口通道有助于提高SAN的恢复能力。此模块检查找到的每个光纤通道端口通道,以确保其成员接口在交换机的可用模块和转发引擎之间尽可能均匀地分布。 |
show version show interface brief |
17 |
MDS FSPF一致性检查 |
检查每个ISL上的FSPF开销,以确保相邻交换机具有相同/一致的开销。如果ISL两端的开销不同,则会发生意外的或不对称路由。此检查不适用于处于NPV模式的交换机,因为这些交换机中没有FSPF数据库。 |
show switchname show fspf database show fcs ie show npv internal info |
18 |
MDS高CPU利用率检查 |
通过检查多个命令输出,验证当前CPU利用率在预定限制内。如果利用率超过60%,则通知用户;如果利用率超过80%,则通知用户;如果利用率超过90%,则警告用户。 |
show processes cpu show processes cpu history show logging log |
19 |
MDS高内存利用率检查 |
检查几个不同的命令输出,以确定当前内存使用率是否小于配置的阈值,或者是否有任何进程在分配的内存限制内运行。如果使用率超过90%,请通知用户。 |
show version show processes memory show running-config |
20 |
MDS检查端口监控Tx-Datarate配置以检测过度使用 |
检查活动端口监控策略,确定tx-datarate和/或tx-datarate-burst计数器是否配置为正确检测过度利用。 |
show version show interface brief show running-config |
报告和警告
- 运行状况和配置检查SR自动执行,由虚拟TAC工程师处理。
- 报告(PDF格式)通常是在所有必要的日志附加到SR之后24个工作小时内生成。
- 报告通过邮件(源自Cisco TAC自动电邮<no-reply@cisco.com>)自动与服务请求相关的所有联系人(主要和辅助)共享。
- 该报告还附加到Service Request中,以备以后随时使用。
- 请注意,报告中列出的问题基于提供的日志,并且属于表1(之前所示)中列出的运行状况检查模块的范围。
- 所执行的运行状况和配置检查列表并不详尽,建议用户根据需要执行进一步的运行状况检查。
- 随着时间的推移,可以添加新的运行状况和配置检查。
常见问题解答
问题1:我可以在同一个SR中上传多台交换机的show tech-support详细信息,以获取所有交换机的运行状况检查报告吗?
A1:这是自动案例处理,运行状况检查由虚拟TAC工程师执行。仅对上传的第一个show tech-support details执行运行状况检查。
问题2:我是否可以为同一台设备上传多个show tech-support详细信息(相隔数小时捕获),以便对两种设备完成运行状况检查?
A2:这是由虚拟TAC工程师执行的自动无状态案例处理,对上传到SR的第一个show tech-support details文件执行运行状况和配置检查,无论上传的文件来自同一交换机还是不同交换机。
问题3:如果交换机的show tech-support details文件被压缩为单个rar/gz文件并上传到SR,我能否对交换机进行运行状况检查?
A3:否。如果多个show tech support详细信息作为单个rar/zip/gz文件上传,则只会处理存档中的第一个文件以进行运行状况检查。
问题4:如果对报告的运行状况检查失败之一有疑问,该怎么办?
解答4:请另外提交一个TAC服务请求,以获取有关特定运行状况检查结果的进一步帮助。强烈建议附加运行状况检查报告,并参阅为自动运行状况和配置检查打开的服务请求(SR)案例编号。
问题5:我是否可以使用为自动运行状况和配置检查打开的相同SR来排除所发现的问题?
A5:否。由于主动运行状况检查是自动进行的,请提交新的服务请求进行故障排除并解决报告的问题。请注意,为运行状况检查打开的SR在运行状况报告发布后的24小时内关闭。
问题6:自动运行状况和配置检查是否针对运行版本低于前面提到的版本的交换机的show tech-support details文件运行?
A6:为前面提到的平台和软件版本构建自动运行状况和配置检查。对于运行较旧版本的设备,这是尽力而为,并且不保证报告的准确性。
问题7:如何关闭为Health Check打开的SR?
A7:在发送第一份Health Check报告后的24小时内关闭SR。无需用户针对SR关闭执行任何操作。
问题8:我如何分享有关主动运行状况和配置检查的意见或反馈?
回答8:通过电子邮件发送到MDS-HealthCheck-Feedback@cisco.com共享这些信息
问题9.从交换机上捕获“show tech-support”或“show tech-support details”的推荐方法是什么?
A9:如本文档前面所述,从NX-OS 8.4(2d)和9.2(1)开始,MDS tac-pac命令已得到增强,可在bootflash上快速创建包含show tech-support详细信息以及附加show logging onboard的文件。对于任何需要显示技术支持详细信息(包括自动运行状况和配置检查)的TAC服务请求(SR),这是创建输入文件的首选方法。在终端应用中捕获到日志文件的CLI输出(例如,SecureCRT、PuTTY)可能为UTF-8-BOM格式(或类似格式),而自动运行状况检查不支持此格式。自动运行状况和配置检查仅支持ASCII或UTF-8格式的文件。
执行Nexus运行状况和配置检查
请参阅执行Nexus运行状况和配置检查。
反馈
非常感谢您就这些工具的操作提供任何反馈。 如果您有任何意见或建议(例如,关于生成的报告的易用性、范围、质量等),请在此处共享这些意见或建议MDS-HealthCheck-Feedback@cisco.com。