はじめに
このドキュメントでは、UCS Managerに組み込まれた診断ツールを起動してサーバのメモリ診断を実行する方法について説明します。
前提条件
要件
使用するコンポーネント
Diag TestはUCS Manager 3.1で利用可能
この機能は、この機能に統合されているサーバ(BシリーズおよびCシリーズ)でのみ使用できます。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
手順/設定
Serversセクションに移動します。
1メイントポロジ
Policiesを選択します。
2つのポリシー
Policies内で、Diagnostics Policiesを選択して開きます。
3診断ポリシー
下部でAddをクリックして、新しい診断ポリシーを作成します。
4追加
新しいウィンドウで、診断ポリシーの名前を指定します。[Description] フィールドはオプションです。
5診断ポリシーの作成
メモリテストの詳細を設定し、ウィンドウの下部にあるAddをクリックします。
ポップアップウィンドウで、必要に応じてフィールドに入力します。
- 順序:テストの実行順序を定義します。
- CPU Filter:すべてのCPUを設定するか、特定のCPUを設定するかを選択します。
- Loop Count:テストの反復回数を設定します(最小値は1、最大値は1000)。
- メモリチャンクサイズ:メモリチャンクを「ビッグチャンク」または「5mb-chunk」に設定します。
- メモリサイズ:テストするメモリサイズを指定します。
- パターン:バタフライ、キラー、PRBS、PRBS-addr、またはPRBS-killerテストから選択します。
7メモリテストの作成
すべてのフィールドを入力したら、OKをクリックし、次にFinishをクリックします。
8メモリテストの終了
診断ポリシーを作成したら、ブレードサーバ、統合ラックサーバ、またはすべてのサーバに割り当てます。
ポリシーを特定のサーバに割り当てるには、Equipmentにアクセスし、目的のサーバに移動してからChassisにアクセスします。
9ステータス
画面の上部でDiagnosticsタブを開きます。
Diagnostic Policiesに移動し、ドロップダウンメニューから作成したポリシーを選択します。
10診断
診断テストを開始するには、Startボタンをクリックします。この診断によってサーバがリブートすることを示すポップアップアラートが表示されます。
注意:この作業は非常に侵入性が高く、すべてのサーバをリブートするので、メンテナンスの時間帯に実行する必要があります。
準備ができたら、Yesを押して続行するか、Noを押してキャンセルします。
11リブートアラート
StartボタンとStopボタンの下に、現在のタスクの説明と全体の進行状況を示す経過表示バーが表示されます。
診断をいつでも停止するには、Stopをクリックします。
12経過表示バー
診断が完了すると、Diagnostic Resultが表示されます。
このテストでは、メモリの問題は見つかりませんでした。結果がFailを返す場合、サーバのログを生成し、TACに連絡して支援を求めてください。
13全体の進捗状況
すべてのサーバの診断を実行するには、Equipmentにアクセスし、右端にあるDiagnosticsをクリックします。
注意:この作業は非常に侵入性が高く、すべてのサーバをリブートするので、メンテナンスの時間帯に実行する必要があります。
14メイントポロジ
新しい画面が開き、ここでブレードサーバまたはラックサーバの診断の実行を選択できます。
このプロセスにより、設定の異なるサーバ上で複数の診断テストを同時に実行できます。
15台のブレードサーバ
Startをクリックすると、サーバがリブートされることを通知するポップアップアラートが表示されます。
注意:この作業は非常に侵入性が高く、すべてのサーバをリブートするので、メンテナンスの時間帯に実行する必要があります。
診断テストを続行する場合はYesを、キャンセルする場合はNoを選択します。
16メンテナンスアラート
診断テストを確認した後、複数のサーバの進行状況がOperation State列とOverall Progress Percentage列に反映され、現在のテストのパーセンテージが示されます。
17サーバの進行状況
18動作状態
サーバをダブルクリックして、詳細を調査します。この操作により、その特定のサーバの診断結果が開きます。
19完了
ResultカラムにPassではなくFailと表示される場合は、TACでサービスリクエストをオープンしてください。
サーバログを収集するか、Intersightを使用できる場合はサーバのシリアル番号を収集します。
エンジニアがすぐに問題の調査を開始できるように、この情報をケースに含めてください。