はじめに
このドキュメントでは、プロアクティブRMAシステムについて説明します。接続された製品のテレメトリを活用することで、シスコは製品に特定の障害が発生しても、ほぼ簡単にカスタマーエクスペリエンスを提供できます。人手による作業が不要なため、サービスリクエスト(SR)と返品許可(RMA)を事前に承認し、障害から交換までの時間を大幅に短縮できます。このドキュメントでは、このプログラムに関する情報、お客様が実行する必要があるアクション、このプログラムでカバーされるデバイス/問題、および利用可能な構成(オプトアウト、連絡先構成)について説明します。
要件
- 影響を受けるデバイスは、Intersight Cloudに直接接続するか、接続された仮想アプライアンス(アプライアンスは2021年7月以降にサポート)経由で接続し、要求する必要があります。 デバイスを接続して使用できるようにするには、『Intersight導入ガイド』を参照してください。プライベート仮想アプライアンスはサポートされていません。これらのデバイスの注意事項と要件については、Nutanix固有のセクションを参照してください。
- 接続された仮想アプライアンスの場合、プロアクティブRMAを有効にする必要があります。これを有効にする方法の詳細については、ここを参照してください。
- 影響を受けるデバイスは、ハードウェア交換の権利を与える有効なサポート契約(例:Smart Net Total Care - SNTC)の対象である必要があります。
- Intersight SaaS(ライセンスなし階層)にはライセンスは必要なく、接続仮想アプライアンス(CVA)には最低限のEssentialsが必要です。
対象範囲
規定の要件を満たすすべてのお客様とすべてのデバイスが対象となります。このプログラムはオプトアウトベースで動作しますが、接続された仮想アプライアンスで動作するには、プロアクティブRMA機能を有効にする必要があります。このプログラムでは、このドキュメントで説明した障害タイプの他に、追加のハードウェア障害シナリオや障害を考慮に入れています。
メモリ エラー
UCSメモリ障害(DIMM Inoperable Fault F0185、IMM Fault code MemoryUnitUncorrectableError) これらは、修正不可能なエラーと、修正不可能なエラー(UECC)が発生したDIMMに対する同じチャネル内のDIMMを表します。 同じチャネル内にあるDIMMで4.2(2a)より前のF0185障害が発生しますが、実際には障害が発生しているわけではなく、交換は行われません。この動作の詳細については、Cisco Bug ID CSCvt29521を参照してください。注:この障害タイプでは、すべての管理モード(スタンドアロン、UMM - UCSMマネージドモード、IMM - Intersightマネージドモード)がサポートされています。
警告:
- 複数のDegraded/Inoperable DIMM障害が発生したサーバは対象外です。これらの問題については、お客様が手動でサービスリクエストをオープンする必要があります。
- Cisco Bug ID CSCvo48003(「M4ブレード – Patrol Scrubber logs DIMM address with 4k boundary」)またはCisco Bug ID CSCvo48006(「M4 Rack - Patrol Scrubber logs DIMM address with 4k boundary」)のインスタンスは除外されます。お客様はこれらに関するTACケースを開き、お客様の環境におけるバグの影響を評価できます。
UCSドライブの障害
この機能では、UCSディスク障害(UCS障害コードF1732、F0181、F0996、およびIMM障害コードStoragePhysicalDiskFailed、StoragePhysicalDiskOffline、StoragePhysicalDiskPredictiveFailure、StoragePhysicalDiskSelfTestFail、およびStoragePhysicalDiskUnConfiguredBad)が対象です。「Predictive Failure」または「Failed」状態のドライブでは、これらの障害が発生し、障害がカバーされます。
警告:
- 障害があるが、明らかに障害のない状態(外部構成、コピーバック、再構築など)のディスクは除外されます。
- パススルーまたは非RAID HBAストレージコントローラを使用しているディスク、あるいはJBODモードのディスクでは、ディスクに障害が発生したかどうかを判断するのに十分なログエビデンスがテクニカルサポートファイルに記録されることはほとんどなく、エビデンスが見つからない場合は交換されません。非RAID HBAのディスク障害のサブセットは、適切な障害を作成し、含める必要のある十分なログの証拠を持っています。HBAパススルードライブがサポートされる状況については、「Hyperflexドライブの障害」セクションと「Nutanixドライブの障害」セクションの両方を参照してください。
Hyperflexドライブの障害
Hyperflex内の永続的に失敗したキャッシュおよび永続的なディスク(ブラックリストに登録/永続的に失敗/リタイアと呼ばれることもあります)は、この機能の対象です。
注:ディスクに障害が発生した直後にクラスタが自動修復され、正常な状態になります。このような場合でも、ディスクを交換する必要があります。
警告:
Cシリーズファンの障害
スタンドアロン、UMM(UCSMマネージドモード)、またはIMM(Intersightマネージドモード)のCシリーズサーバ内でのファン障害がサポートされます。障害コード:F0484、F0397、F0794は範囲内です。
警告:
- 複数のファンの障害が同時に発生した場合は、真のファンハードウェア障害とはならないことが多く、現時点ではサポートされていません
- 一時的なファンの障害では、プロアクティブなRMAケースは生成されません
ファブリックインターコネクトファンの障害
UMM(UCSM管理モード)のFabric Interconnect内でのファン障害はサポートされています。障害コード:F0484、F0397は範囲内です。
警告:
- IMM管理対象FIはまだサポートされていません
- 複数のファンの障害が同時に発生した場合は、真のファンハードウェア障害とはならないことが多く、現時点ではサポートされていません
Nutanixドライブの障害
Ciscoハードウェア上のNutanixクラスタで障害が発生したドライブがサポートされます。
警告:
- NutanixクラスタをNutanixクラウドに接続する必要がある
- Nutanix BreakFixContact電子メールを設定するか、ハードウェアをIntersightに接続する必要があります。
- BreakFixContactまたはIntersightのユーザは、対象のサーバを対象とする契約のケースをオープンする権限を持っている必要があります。
この処理による影響
カバー対象の障害イベントが発生すると、SRとRMAが生成されます。注目ポイント:
- 電子メールはsherholm@cisco.comから送信されます。
- ケースは、設定済みの電子メール(詳細な設定の項を参照)またはIntersightにログインした最後の資格ユーザで作成されます。
- 契約の下で権限を付与されたIntersightアカウントの他のユーザは、電子メールにコピーされます。ユーザが明示的に設定されている場合(タグを使用した場合は、「高度な設定(オプション)」セクションを参照)、設定されているユーザのみが電子メールを受信します。
- 資格を持つユーザであれば、RMAの所有権を取得して必要な詳細情報を入力できます。RMAツールには、所有権の移転オプションがあります。
- Cisco RMAツール(Product Returns and Replacement - PRR)は、ケースをオープンしたユーザに対して、RMAドラフトの記入を促す通知を送信します。
サービスリクエストを作成した後、お客様は問題を説明する電子メールを受け取り、実行可能な手順を示します。次に例を示します。
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Server Name: HOSTNAME
Server Service Profile: org-root/SERVICEPROFILENAME
Server User Label: USER_LABEL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Hardware replacement guide available here:
<link to replacement guide for the specific server type>
For more information on this feature of Intersight see:
<link to this document>
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer, Virtual
Cisco Customer Experience
Email: sherholm@cisco.com
利点
- 交換部品の受け取り作業が大幅に削減されました。
- SRの自動作成:イベントへの応答時間が短縮されます。
- RMAの事前承認。
- 問い合わせ後すぐにRMAの詳細を入力できます。
- ターゲット診断データの自動収集。
- ソフトウェア不具合の除外:ハードウェア障害として表示されるソフトウェア障害は、不要なRMAを生成しません。
その他の詳細事項
ワークフローの詳細
高度な設定(オプション)
現在、2つの高度な設定オプションがサポートされています。設定オプションは、Intersight内のタグを介して設定されます。
このセクションで説明するタグは、Intersight内のリストされている任意のオブジェクトで設定できます。
- アカウント(GUIを使用)
- 組織(API経由)
- ターゲット/登録済みデバイス(API経由)
接続仮想アプライアンスをご使用のお客様は、アプライアンス自体またはIntersight Cloudでタグを設定できます。
設定タグの詳細については、『Intersightでのタグの設定』を参照してください。
連絡先を明示的に設定する
お客様は、SRとRMAの両方に関連付ける電子メールアドレスを明示的に設定できます。タグ名/キーは「AutoRMAEmail」で、値は通知する電子メールのCSVリストで、ケースに対する権限を付与します。事前対応型RMAでは、最初の照合基準を使用して、電子メールを左から右へ分析します。たとえば、「user@example.com,user2@example.com」を使用すると、user@example.comが最初に試行されますが、すべての電子メールがコピーされます。
注:警告:サービスリクエストをオープンするには、CSVリスト内の少なくとも1つの電子メールが、デバイスのシリアル番号が対象とする契約に関連付けられている有効なCCOアカウントに関連付けられている必要があります。
つまり、デバイスを対象とする契約にAutoRMAEmailアドレスが含まれていない場合、AutoRMAEmailアドレスは無視されます。
プロアクティブRMAは、Intersightアカウントを持ち、デバイスを対象とする契約を結んでいるすべての人に電子メールを送信するというデフォルトの動作に戻ります。
Intersightでは、タグの文字数が255文字に制限されていることに注意してください。このため、Proactive RMAではAutoRMAEmailで始まるタグ(例:AutoRMAEmail1、AutoRMAEmail2)をサポートしており、すべての値を連結します。
APIを使用してタグを設定する場合、タグは次のように表示される必要があります。
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
タグの詳細については、『Intersightでのタグの設定』を参照してください。
プロアクティブRMAのオプトアウト
オプトアウトするには
APIを使用する場合、タグは次のように指定する必要があります。
{"Key":"AutoRMA","Value":"False"}
Proactive RMAに戻すには(オプトアウトされている場合)、タグを完全に削除するか、タグを次のように変更します。
{"Key":"AutoRMA","Value":"True"}
注:ユーザは、オプトアウトしていない場合、タグを使用してオプトインする必要はありません。オプトアウトしていない限り、自動的に有効になります。
FAQ
Q:これらの障害に関して、シスコはどのような情報を収集しますか。
A:障害の詳細(時間/デバイスなど)、インベントリ情報(モデル/シリアル/ファームウェア)、該当する診断データ(例:CIMC/UCSM/HXテクニカルサポート)。
Q:反応時間は何時ですか。
A:通常は、障害が発生してから1時間以内にケースがオープンし、RMAが作成されます。これには、適切な診断データの生成と処理に必要なすべての時間が含まれます。
Q:RMAの提出先はどこですか。
A:デバイスが対象とする契約の有資格ユーザであれば、RMAを提出できます。TACサービスリクエストの担当者と同じ担当者である必要はありません。RMAは最初は1つの特定のCCOアカウントに関連付けられます。RMAへの記入を希望するユーザは、RMAの右上にある「Actions」ボタンをクリックして「Transfer Assignment」を選択できます。 次の画面では、入力ボックスにCCOを入力したままにして、「Submit」をクリックします。
Q:RMAのロード時にエラーが表示されますが、このRMAを送信するにはどうしたらいいですか。
A:古いCookieやブラウザキャッシュが原因で、RMAのロード時に問題が発生する場合があります。まず、専用のブラウザウィンドウまたは別のブラウザでRMAをロードしてください。問題が解決しない場合は、電子メールでサポートを依頼してください。