簡介
本文檔介紹主動RMA系統。利用互聯產品的遙測資料,思科能夠在產品遇到某些故障時提供近乎輕鬆的客戶體驗。如果沒有人工干預,將主動批准服務請求(SR)和退貨授權(RMA),從而顯著減少從故障到更換的時間。本文檔包含有關此計畫的資訊、客戶必須採取的措施、此計畫涉及的裝置/問題以及可用配置(退出、聯絡人配置)。
需求
- 受影響裝置必須直接連線或通過連線的虛擬裝置(自2021年7月起受支援的裝置)申請到Intersight雲。 請參閱Intersight入門指南以連線並宣告裝置。不支援專用虛擬裝置。請閱讀Nutanix特定部分,瞭解這些裝置的注意事項和要求。
- 對於連線的虛擬裝置,必須啟用主動RMA,有關如何啟用此功能的詳細資訊,請參閱此處。
- 受影響的裝置必須包括在有效的支援合約中(例如:智慧網路全面關護 — SNTC),它有權進行硬體更換。
- Intersight SaaS(無許可證層)無需許可證,在連線的虛擬裝置(CVA)上至少需要基本版。
範圍
符合所述要求的所有客戶和裝置都在範圍內。此計畫以選擇退出方式運行,但要在連線的虛擬裝置上運行,必須啟用主動RMA功能。除本文檔中提到的故障型別外,本計畫還考慮了其他硬體故障場景/故障。
記憶體錯誤
UCS記憶體故障(DIMM不可操作故障F0185,IMM故障代碼記憶體單元不可更正錯誤)。 這些錯誤代表不可糾正的錯誤,以及同一通道中的DIMM與遇到不可糾正錯誤(UECC)的DIMM。 雖然同一通道中的DIMM在4.2(2a)之前會遇到F0185故障,但它們並未真正發生故障,也不會被更換。有關此行為的詳細資訊,請參閱思科錯誤ID CSCvt29521。附註:此故障型別支援所有管理模式(獨立、UMM - UCSM託管模式、IMM - Intersight託管模式)。
注意事項:
UCS驅動器故障
此功能涵蓋UCS磁碟故障(UCS故障代碼F1732、F0181、F0996和IMM故障代碼StoragePhysicalDiskFailed、StoragePhysicalDiskOffline、StoragePhysicalDiskPredictiveFailure、StoragePhysicalDiskSelfTestFail和StoragePhysicalDiskUnConfiguredBad)。處於「預測性故障」或「故障」狀態的驅動器會引發這些故障並已被覆蓋。
注意事項:
- 出現故障但明顯處於非故障狀態的磁碟(例如:排除外部配置、複製恢復、重建等)。
- 使用直通或非RAID HBA儲存控制器的磁碟或處於JBOD模式的磁碟在技術支援檔案中很少會有足夠的日誌證據,以確定磁碟是否發生故障,如果找不到證據,將不會進行更換。非RAID HBA上的磁碟故障子集確實會建立相應的故障,並且包含足夠的日誌證據。如果支援HBA通過驅動器,請參見Hyperflex驅動器故障和Nutanix驅動器故障部分。
Hyperflex驅動器故障
在Hyperflex中快取和永續性磁碟(有時稱為:已列入黑名單/永久失敗/已停用)包含在此功能中。
附註:在磁碟出現故障後不久,群集將自動愈合併正常運行,在這些情況下,仍然必須更換磁碟。
注意事項:
C系列風扇故障
支援處於獨立、UMM(UCSM託管模式)或IMM(Intersight託管模式)的C系列伺服器中的風扇故障。故障代碼:F0484、F0397、F0794都在範圍內。
注意事項:
- 同時發生多個風扇故障可能不是真正的風扇硬體故障,目前尚不支援
- 瞬時風扇故障不會生成主動RMA案例
交換矩陣互聯風扇故障
支援處於UMM(UCSM管理模式)的交換矩陣互聯中的風扇故障。故障代碼:F0484、F0397在範圍內。
注意事項:
- 尚不支援IMM託管FI
- 同時發生多個風扇故障可能不是真正的風扇硬體故障,目前尚不支援
Nutanix驅動器故障
支援思科硬體上Nutanix群集中的故障驅動器。
注意事項:
- Nutanix群集必須連線到Nutanix雲
- 必須配置Nutanix BreakFixContact電子郵件,或者必須將硬體連線到Intersight。
- 來自BreakFixContact或Intersight的使用者必須有權為涵蓋有問題的伺服器的合約開啟案例。
預期內容
當發生覆蓋的故障事件時,將生成SR和RMA。興趣點:
- 電子郵件將來自sherholm@cisco.com。
- 將使用已配置的電子郵件(請參閱下面的高級配置部分)或登入到Intersight的最後一個授權使用者建立案例。
- Intersight帳戶中根據合約授權的其他使用者將複製到電子郵件中。如果明確配置了使用者(通過標籤,請參閱高級配置(可選)部分),則只有配置的使用者才會收到電子郵件。
- 任何授權使用者可以擁有RMA並填寫所需的詳細資訊。在RMA工具中有一個轉讓所有權選項。
- 思科RMA工具(產品退貨與替換 — PRR)將傳送提醒給與開啟案例的使用者填寫草案RMA。
建立服務請求後,客戶將收到一封描述問題並提供可操作步驟的電子郵件,下面是一個示例:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Server Name: HOSTNAME
Server Service Profile: org-root/SERVICEPROFILENAME
Server User Label: USER_LABEL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Hardware replacement guide available here:
<link to replacement guide for the specific server type>
For more information on this feature of Intersight see:
<link to this document>
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer, Virtual
Cisco Customer Experience
Email: sherholm@cisco.com
優勢
- 明顯減少了接收替換部件的工作。
- 自動建立SR — 加快事件響應時間。
- RMA的預授權。
- 能夠在聯絡後立即填寫RMA詳細資訊。
- 自動收集目標診斷資料。
- 軟體缺陷排除 — 顯示為硬體故障的軟體故障不會生成不必要的RMA。
其他詳細資訊
工作流詳細資訊
高級配置(可選)
目前支援兩個高級配置選項。配置選項通過Intersight內的標籤設定。
本節中討論的標籤可以在Intersight內的任何列出的對象上配置:
- 帳戶(通過GUI)
- 組織(通過API)
- 目標/註冊裝置(通過API)
對於使用已連線虛擬裝置的客戶,可以在裝置本身或Intersight雲上配置標籤。
有關設定標籤的詳細資訊,請參閱在Intersight中設定標籤文檔。
顯式配置聯絡人
客戶可以明確配置希望與SR和RMA關聯的電子郵件地址。標籤名稱/金鑰為「AutoRMAEmail」,值為要通知並授權案例的CSV電子郵件清單。主動RMA將使用第一個匹配基礎並以從左到右的方式分析電子郵件。例如,如果您使用「user@example.com,user2@example.com」 user@example.com,將首先嘗試,但會複製所有電子郵件。
附註:警告:若要開啟案例,CSV清單中的至少一封電子郵件必須與與裝置序列號所涵蓋的合約相關聯的有效CCO帳戶相關聯。
換句話說,如果合約中沒有包含裝置的AutoRMAEmail地址,則會忽略AutoRMAEmail地址。
主動RMA將回退到預設行為,即向擁有Intersight帳戶且合約涵蓋該裝置的每個人都傳送電子郵件。
請注意,Intersight的標籤字元數限製為255個字元。因此,主動RMA支援任何以AutoRMAEmail開頭的標籤(例如:AutoRMAEmail1、AutoRMAEmail2)並將所有值連線在一起。
如果使用API配置標籤,則標籤需要類似於:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
請參閱在Intersight中設定標籤文檔,其中將討論有關標籤的詳細資訊。
選擇不使用主動式RMA
選擇退出,
如果使用API,則標籤必須如下所示。
{"Key":"AutoRMA","Value":"False"}
要選擇返回主動式RMA(如果選擇退出),使用者可以完全刪除標籤或將標籤更改為:
{"Key":"AutoRMA","Value":"True"}
請注意 — 如果使用者沒有選擇退出,則不需要通過標籤選擇加入,除非他們選擇退出,否則會自動啟用這些使用者。
常見問題
Q:思科會收集哪些有關這些故障的資訊?
A:故障詳細資訊(時間/裝置等)、資產資訊(型號/串列/韌體)、適用的診斷資料(例如:CIMC/UCSM/HX技術支援)。
Q:反應時間是什麼時候?
A:通常在故障發生後的一小時內開啟案例並建立RMA。這包括生成和處理相應的診斷資料所需的全部時間。
Q:誰可以提交RMA?
A:裝置所覆蓋的合約上的任何授權使用者都可以提交RMA,無需是TAC服務請求上的聯絡人。RMA最初與一個特定的CCO帳戶相關聯。希望填寫RMA的使用者可以按一下RMA右上角的「操作」按鈕並選擇「Transfer Assignment」。 在後續螢幕中,將您的CCO填充在輸入框中,然後點選「Submit」。
Q:載入RMA時我看到錯誤,如何提交此RMA?
A:有時,過早的cookie/瀏覽器快取會導致載入RMA時出現問題,請首先嘗試在專用瀏覽視窗或其他瀏覽器中載入RMA。如果問題仍然存在,請發回電子郵件尋求幫助。