简介
本文档介绍主动RMA系统。利用互联产品的遥感勘测数据,思科能够在产品遇到某些故障时提供近乎轻松的客户体验。无需人工干预,即可主动批准服务请求(SR)和退货许可(RMA),从而显着减少从故障到更换的时间。本文档将介绍有关此计划的信息、客户必须执行的操作、此计划涉及的设备/问题以及可用的配置(退出、联系人配置)。
要求
- 必须直接或通过连接的虚拟设备(自2021年7月起支持的设备)将设备连接并申领到Intersight云。请参阅Intersight入门指南,以连接和申请设备。不支持专用虚拟设备。
- 对于连接的虚拟设备,必须启用主动RMA,请参阅此处了解如何启用此功能的更多信息。
- 设备必须包含在有效的支持合同中(例如智能网络支持服务 — SNTC)
- Intersight SaaS(无许可证层)无需许可证,互联虚拟设备(CVA)至少需要基本版
范围
满足上述要求的所有客户和设备都在范围内。此计划以选择退出方式运行,但要在连接的虚拟设备上运行,必须启用主动RMA功能。除以下故障类型外,本计划还考虑其他硬件故障场景/故障。
内存错误
UCS内存故障(DIMM不可操作故障F0185)。这些错误代表不可纠正的错误,以及位于同一通道的DIMM与遇到不可纠正错误(UECC)的DIMM。虽然处于同一通道中的DIMM会遇到F0185故障,但它们并非真正坏,也不会被更换。有关此行为的详细信息,请参阅CSCvt29521。注意:此故障类型支持所有管理模式(独立、UMM - UCSM托管模式、IMM - Intersight托管模式)。
注意事项:
- 如果服务器遇到多个降级DIMM故障,则不提供保护 — 客户应手动打开这些问题的案例。
- CSCvo48003(“M4刀片 — 使用4k边界巡逻洗涤器日志DIMM地址”)或CSCvo4806(“M4机架 — 使用4k边界巡逻洗涤器日志DIMM地址”)的实例将被排除
UCS驱动器故障
此功能涵盖了UCS磁盘故障(大多数磁盘故障F1732和F0181)。处于“预测性故障”或“失败”状态的驱动器会引发这些故障,应予以覆盖。
注意事项:
- 尚不支持IMM托管服务器
- 磁盘出现故障,但明显处于非故障状态(即:外部配置、回写、重建等)将被排除。
- 使用直通或非RAID HBA存储控制器的磁盘或JBOD模式下的磁盘在技术支持文件中可能没有充分的日志记录证据,因而无法确定磁盘是否出现故障以及是否无法更换。非RAID HBA上的磁盘故障子集确实会创建相应的故障,并且包含足够的日志证据。
Hyperflex驱动器故障
此功能涵盖了Hyperflex中永久失败的缓存和永久磁盘(有时称为:已列入黑名单/永久失败/已淘汰)。
注意:群集应在磁盘发生故障后立即自动修复并正常运行,在这种情况下,仍应更换磁盘。
注意事项:
- 出现多个驱动器故障的群集不会运行。
- 匹配FN70234的驱动器将被排除
- 与CSCvo58565影响的型号匹配的驱动器将被排除
- 通过Intersight Connected Virtual Appliance连接的HX群集尚未运行。
C系列风扇故障
支持独立或UMM(UCSM管理模式)C系列服务器中的风扇故障。故障代码:F0484、F0397、F0794在范围内。
注意事项:
- 尚不支持IMM托管服务器
- 同时发生多个风扇故障可能不是风扇硬件故障,目前不受支持
- 瞬时风扇故障不应生成主动RMA案例
交换矩阵互联风扇故障
支持处于UMM(UCSM管理模式)的交换矩阵互联中的风扇故障。故障代码:F0484、F0397在范围内。
注意事项:
- 尚不支持IMM托管服务器
- 同时发生多个风扇故障可能不是风扇硬件故障,目前不受支持
预计发生的情况
当发生覆盖的故障事件时,将生成SR和RMA。兴趣点:
- 电子邮件将来自sherholm@cisco.com,客户可能希望特别允许此地址。
- 案例将通过已配置的电子邮件(请参阅下面的高级配置部分)或登录Intersight的最后一个已授权用户创建。
- Intersight帐户中根据合同授权的其他用户将复制到电子邮件中。如果明确配置了用户(通过标记,请参阅下文),则只有配置的用户才会收到邮件。
- 任何授权用户均可拥有RMA并填写所需的详细信息。
- 思科的RMA工具将向创建案例的用户发送提醒,以填写RMA草案。
创建服务请求后,客户将收到一封类似于以下示例的电子邮件:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer.Customer Delivery
Cisco Customer Experience
好处
- 显着减少接收更换部件的工作量。
- 自动创建SR — 加快事件响应时间。
- RMA的预授权。
- 能够在联系后立即填写RMA详细信息。
- 自动收集目标诊断数据。
- 软件缺陷筛选 — 伪装成硬件故障的软件故障不会生成不必要的RMA。
其他详细信息
工作流程详细信息
高级配置(可选)
目前支持两个高级配置选项。配置选项使用Intersight中的标记进行设置。
下面讨论的标记可在以下任何级别配置:
- 帐户(通过GUI)
- 组织(通过API)
- 目标/注册设备(通过API)
对于使用互联虚拟设备的客户,可以在设备本身或Intersight Cloud上进行标记。
有关设置标签的详细信息,请参阅在Intersight中设置标签。
明确配置联系人
客户可以明确配置希望与SR和RMA关联的电子邮件地址。标记名称/密钥为“AutoRMAEmail”,该值是您希望通知并授权案例的CSV电子邮件列表。主动RMA将使用第一个匹配项,并以从左到右的方式分析电子邮件。例如,如果您使用“user@example.com,user2@example.com” user@example.com,将首先尝试,但会复制所有电子邮件。
警告:对于要打开的案例,CSV列表中的至少一封电子邮件必须与与设备序列号所涵盖的合同相关联的有效CCO帐户相关联。
请注意,Intersight的标记字符数限制为255个字符。因此,主动RMA支持任何以AutoRMAEmail开头的标记(例如:AutoRMAEmail1、AutoRMAEmail2),并将所有值串联在一起。
如果使用API配置标记,则标记需要类似于:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
有关讨论标记详细信息的文档的链接,请参阅上文。
选择不采用主动RMA
要选择退出,
如果使用API,则标记必须如下所示。
{"Key":"AutoRMA","Value":"False"}
要选择返回主动式RMA(如果选择退出),用户可以将标签更改为:
{"Key":"AutoRMA","Value":"True"}
或者,他们可以一起删除标记。请注意 — 如果用户未选择退出,则无需通过标签选择加入,除非他们选择退出,否则将自动启用这些用户。
常见问题
问:思科会收集哪些有关这些故障的信息?
答:故障详细信息(时间/设备/等)、资产信息(型号/串行/固件)、适用的诊断数据(例如:CIMC/UCSM/HX技术支持)。
问:反应时间是什么时候?
答:故障发生后1小时内,通常打开案例并创建RMA。这包括生成和处理相应的诊断数据所需的全部时间。
问:谁可以提交RMA?
答:设备所覆盖的合同上的任何授权用户都可以提交RMA,无需是TAC服务请求上的联系人同一人。RMA最初与一个特定的CCO帐户关联。希望填写RMA的用户可以点击RMA右上角的“Actions”按钮并选择“Transfer Assignment”。在后续屏幕中,将您的CCO填充在输入框中,然后点击“Submit”。
问:我在加载RMA时遇到错误,如何提交此RMA?
答:加载RMA时,偶尔会出现cookie/浏览器缓存过时的现象,请首先尝试在专用浏览窗口或其他浏览器中加载RMA。如果问题仍然存在,请发回电子邮件寻求帮助。