简介
本文档介绍主动RMA系统。利用互联产品的遥感勘测数据,思科能够在产品遇到某些故障时提供近乎轻松的客户体验。无需人工干预,即可主动批准服务请求(SR)和退货授权(RMA),从而显着减少从故障到更换的时间。本文档包含有关此计划的信息、客户必须执行的操作、此计划涉及的设备/问题以及可用配置(退出、联系人配置)。
要求
- 受影响的设备必须直接连接并申请到Intersight云,或通过连接的虚拟设备申请到(自2021年7月以来支持的设备)。 请参阅Intersight入门指南,以连接并申请设备。不支持专用虚拟设备。请阅读Nutanix特定部分,了解这些设备的注意事项和要求。
- 对于连接的虚拟设备,必须启用主动RMA,请参阅此处了解如何启用此功能的更多信息。
- 受影响设备必须包含在有效的支持合同中(例如:智能网络全面关护 — SNTC),可授权硬件更换。
- Intersight SaaS(无许可证层)无需许可证,互联虚拟设备(CVA)至少需要基本版。
范围
符合所述要求的所有客户和设备都在范围内。此计划以选择退出方式运行,但要在连接的虚拟设备上运行,必须启用主动RMA功能。除本文档中提到的故障类型外,本计划还考虑其他硬件故障场景/故障。
内存错误
UCS内存故障(DIMM不可操作故障F0185,IMM故障代码MemoryUnitUncorrectableError)。 这些错误代表不可纠正的错误,以及位于同一通道的DIMM与遇到不可纠正错误(UECC)的DIMM。 虽然同一通道中的DIMM在4.2(2a)之前会遇到F0185故障,但它们并未真正发生故障,也不会被更换。有关此行为的详细信息,请参阅Cisco Bug ID CSCvt29521。注意:此故障类型支持所有管理模式(独立、UMM - UCSM托管模式、IMM - Intersight托管模式)。
注意事项:
UCS驱动器故障
此功能涵盖UCS磁盘故障(UCS故障代码F1732、F0181、F0996和IMM故障代码StoragePhysicalDiskFailed、StoragePhysicalDiskOffline、StoragePhysicalDiskPredictiveFailure、StoragePhysicalDiskSelfTestFail和StoragePhysicalDiskUnConfiguredBad)。处于“预测性故障”或“失败”状态的驱动器会引发这些故障并受到覆盖。
注意事项:
- 出现故障但处于明显非故障状态的磁盘(例如:外部配置、回写、重建等)将被排除。
- 使用直通或非RAID HBA存储控制器的磁盘或处于JBOD模式的磁盘在技术支持文件中很少有充足的日志证据,以确定磁盘是否发生故障,如果找不到证据,则不会更换磁盘。非RAID HBA上的磁盘故障子集确实会创建相应的故障,并且包含足够的日志证据。如果支持HBA直通驱动器,请参阅Hyperflex驱动器故障和Nutanix驱动器故障部分。
Hyperflex驱动器故障
在Hyperflex中缓存和持久性磁盘永久失败(有时称为:已列入黑名单/永久失败/已报废)包含在此功能中。
注意:在磁盘出现故障后不久,群集将自动愈合并且处于正常状态,在这些情况下,仍然必须更换磁盘。
注意事项:
C系列风扇故障
支持处于独立、UMM(UCSM管理模式)或IMM(Intersight管理模式)的C系列服务器中的风扇故障。故障代码:F0484、F0397、F0794都在范围内。
注意事项:
- 同时发生多个风扇故障可能不是真正的风扇硬件故障,目前尚不支持
- 瞬时风扇故障不会生成主动RMA案例
交换矩阵互联风扇故障
支持处于UMM(UCSM管理模式)的交换矩阵互联中的风扇故障。故障代码:F0484、F0397都在范围内。
注意事项:
- 尚不支持IMM托管FI
- 同时发生多个风扇故障可能不是真正的风扇硬件故障,目前尚不支持
Nutanix驱动器故障
支持思科硬件上Nutanix集群中的故障驱动器。
注意事项:
- Nutanix群集必须连接到Nutanix云
- 必须配置Nutanix BreakFixContact电子邮件,或者必须将硬件连接到Intersight。
- 来自BreakFixContact或Intersight的用户必须有权为涵盖有问题的服务器的合同打开案例。
预计发生的情况
当发生覆盖的故障事件时,将生成SR和RMA。兴趣点:
- 电子邮件将来自sherholm@cisco.com。
- 案例将通过已配置的电子邮件(请参阅下面的高级配置部分)或登录Intersight的最后一个已授权用户创建。
- Intersight帐户中根据合同授权的其他用户将复制到电子邮件中。如果明确配置了用户(通过标记,请参阅高级配置(可选)部分),则只有配置的用户才会收到电子邮件。
- 任何授权用户均可拥有RMA并填写所需的详细信息。在RMA工具中有一个转让所有权选项。
- Cisco RMA工具(产品退货和更换 — PRR)将发送提醒以向提交案例的用户填写RMA草案。
创建服务请求后,客户将收到一封描述问题并提供可行步骤的电子邮件,下面是一个示例:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Server Name: HOSTNAME
Server Service Profile: org-root/SERVICEPROFILENAME
Server User Label: USER_LABEL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Hardware replacement guide available here:
<link to replacement guide for the specific server type>
For more information on this feature of Intersight see:
<link to this document>
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer, Virtual
Cisco Customer Experience
Email: sherholm@cisco.com
好处
- 显着减少接收更换部件的工作。
- 自动创建SR — 加快事件响应时间。
- RMA的预授权。
- 能够在联系后立即填写RMA详细信息。
- 自动收集目标诊断数据。
- 软件缺陷排除 — 显示为硬件故障的软件故障不会生成不必要的RMA。
其他详细信息
工作流程详细信息
高级配置(可选)
目前支持两个高级配置选项。配置选项通过Intersight中的标记进行设置。
本节中讨论的标记可以在Intersight中列出的任何对象上配置:
- 帐户(通过GUI)
- 组织(通过API)
- 目标/注册设备(通过API)
对于使用已连接虚拟设备的客户,可以在设备本身或Intersight云上配置标记。
有关设置标签的详细信息,请参阅在Intersight中设置标签。
明确配置联系人
客户可以明确配置希望与SR和RMA关联的电子邮件地址。标记名称/密钥为“AutoRMAEmail”,该值是您希望通知并授权案例的CSV电子邮件列表。主动RMA将使用第一个匹配项,并以从左到右的方式分析电子邮件。例如,如果您使用“user@example.com,user2@example.com” user@example.com,将首先尝试,但会复制所有电子邮件。
注意:警告:要打开案例,CSV列表中的至少一封电子邮件必须与与设备序列号所涵盖的合同相关联的有效CCO帐户相关联。
换句话说,如果合同中没有包含设备的AutoRMAEmail地址,则会忽略AutoRMAEmail地址。
主动RMA将退回到默认行为,即向拥有Intersight帐户且处于覆盖设备的合同中的所有人发送电子邮件。
请注意,Intersight的标记字符数限制为255个字符。因此,主动RMA支持任何以AutoRMAEmail开头的标记(例如:AutoRMAEmail1、AutoRMAEmail2)并将将所有值连接在一起。
如果使用API配置标记,则标记需要类似于:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
请参阅在Intersight中设置标签文档,讨论有关标签的详细信息。
选择不采用主动RMA
要选择退出,
如果使用API,则标记必须如图所示。
{"Key":"AutoRMA","Value":"False"}
要选择返回主动式RMA(如果选择退出),用户可以完全删除标签或将标签更改为:
{"Key":"AutoRMA","Value":"True"}
请注意 — 如果用户未选择退出,则无需通过标签选择加入,除非他们选择退出,否则将自动启用这些用户。
常见问题
问:思科会收集哪些有关这些故障的信息?
A:故障详细信息(时间/设备/等)、资产信息(型号/串行/固件)、适用的诊断数据(例如:CIMC/UCSM/HX技术支持)。
问:反应时间是什么时候?
A:案例通常在故障发生后1小时内打开并创建RMA。这包括生成和处理相应的诊断数据所需的全部时间。
问:谁可以提交RMA?
A:设备所覆盖的合同上的任何授权用户都可以提交RMA,无需是TAC服务请求中的联系人身份。RMA最初与一个特定的CCO帐户关联。希望填写RMA的用户可以点击RMA右上角的“Actions”按钮并选择“Transfer Assignment”。 在后续屏幕中,将您的CCO填充在输入框中,然后点击“Submit”。
问:我在加载RMA时遇到错误,如何提交此RMA?
A:有时,过期cookie/浏览器缓存可能会在加载RMA时引起问题,请首先尝试在专用浏览窗口或其他浏览器中加载RMA。如果问题仍然存在,请发回电子邮件寻求帮助。