はじめに
このドキュメントでは、MDS 9000プラットフォームの自動ヘルスチェックおよび設定チェックを実行するための手順と要件について説明します。
前提条件
要件
Automated Health and Configuration Checkは、サポートされているバージョンのNX-OS®ソフトウェアが稼働するMDSプラットフォームでのみサポートされます。
次のハードウェアプラットフォームがサポートされています。
- サポート終了日(HW)に達していないすべてのMDS 9000シリーズスイッチ。MDSのサポート終了および販売終了の通知については、次を参照してください。
サポート終了と販売終了の通知
使用するコンポーネント
このドキュメントの内容は、特定のソフトウェアやハードウェアのバージョンに限定されるものではありません。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
表記法
表記法の詳細については、『シスコ テクニカル ティップスの表記法』を参照してください。
状態と設定の確認手順
MDSスイッチの健全性と設定の自動チェックを実行するには、Cisco Support Case Managerで次のキーワードのセットを指定して通常のTACサービスリクエストをオープンします。
テクノロジー:データセンターおよびストレージネットワーキング
サブテクノロジー:MDS9000 – 状態と構成のチェック(自動)
問題コード:健全性と設定のチェック
開いているTAC SRについて、.txtまたは.gz/.tar形式でスイッチからキャプチャした「show tech-support details」コマンドの出力をアップロードします。 現在、ASCIIおよびUTF-8テキスト形式でキャプチャされたshow tech-support detailsファイルがサポートされています。アップロードの手順については、「TACカスタマーファイルアップロード」を参照してください。
NX-OS 8.4(2d)および9.2(1)以降では、MDS tac-pacコマンドが拡張され、追加のshow logging onboardコマンドを使用してshow tech-supportの詳細を含むファイルをブートフラッシュにすばやく作成できます。これは、自動ヘルスチェックや設定チェックケースなど、show tech-supportの詳細を必要とするTACサービスリクエスト(SR)の入力ファイルを作成する推奨方法です。
必要な出力をSRに添付した後、シスコオートメーションはログを分析し、レポート(PDF形式)を添付した電子メールを送信します。このレポートには、検出された問題、問題のトラブルシューティングに必要な手順、および推奨されるアクションプランのリストが含まれます。
報告されたヘルスチェックの失敗に関する質問がある場合は、適切なキーワードを指定して別のサービスリクエストを開き、サポートを受けることをお勧めします。調査を促進するために生成されたレポートとともに、Automated Health and Config Check用にオープンされたサービスリクエスト(SR)番号を参照することを強くお勧めします。
深刻度
次の表に、NX-OSの標準的な重大度とその定義を示します。
重大度 |
説明 |
緊急(0) |
システムが使用できない。 |
アラート(1) |
重大な状態です。早急な対応が必要です。 |
クリティカル(2) |
主な条件。 |
エラー(3) |
軽微な条件。 |
警告(4) |
警告状態。 |
通知(5) |
基本的な通知および情報メッセージ。可能な場合 独立して重要ではない。 |
情報(6) |
正常な状態への復帰を示す正常なイベント。 |
ヘルスと構成のチェックモジュール
Automated MDS Health and Configuration Check Version 1、2023年5月版リリースでは、表1に示されているチェックを実行します。
表1:ヘルスチェックモジュールおよびモジュールで使用される関連CLI
インデックス |
ヘルスチェックモジュール |
モジュールの簡単な説明 |
ヘルスチェックの実行に使用されるCLI |
1 |
NX-OSリリースの確認 |
デバイスがCisco推奨のNX-OSソフトウェアリリースを実行しているかどうかを確認します。 |
show version |
2 |
EOL/EOSのMDSトランシーバチェック |
トランシーバがサポート終了(EOL)か販売終了(EOS)かを確認します。 |
show version show clock show hardware |
3 |
MDSスイッチのFCインターフェイスのデータレート使用量 |
インターフェイスの入出力レートをチェックします。使用率が80 %を超えるインターフェイスの上位10個のインターフェイスとアラートを表示します。 |
show version show interface briefコマンド show interface |
4 |
MDSスイッチのトランシーバ詳細情報 |
インターフェイスの温度、電圧、電流、tx電力、またはrx電力の公称値をチェックします。障害が検出された場合は、次のステップを提案します。 |
show version show hardware インターフェイストランシーバの詳細を表示 |
5 |
実行しているNX-OSバージョンに基づいてPSIRT不具合を確認する |
ハードウェア/ソフトウェアおよび設定に従って、さまざまなPSIRTと照合します。これは完全なものではありません。 |
show version show running-config |
6 |
クロック情報のMDSチェック |
推奨クロック設定を確認し、推奨クロック設定のサンプルを提供します。 |
show running-config show clock |
7 |
EOL/EOSに関するMDSハードウェアチェック |
MDSモジュールおよびシャーシのサポート終了日(EOL)とサポート終了日(EOS)を特定します。 |
show version show module show hardware show inventory |
8 |
EOL/EOSに関するMDSソフトウェアチェック |
MDS NX-OSリリースのサポート終了日(EOL)とサポート終了日(EOS)を特定します。 |
show version show module |
9 |
MDS FCNSデータベースとFLOGIデータベースの整合性チェック |
show FCNS databaseとshow FLOGI database出力間の一貫性を確認します。 |
show version show hardware show flogi database show fcns database local vsan 1-4093 |
10 |
すべてのTFポート上でアップ状態でアクティブになっているすべてのVSANをMDSでチェックする |
すべてのTFポートで、許可されているすべてのVSANがactive状態であり、isolated状態またはinitializing状態のVSANがないことを確認します。 |
show version show hardware show interface show interface briefコマンド show port-channel database(隠しコマンド) |
11 |
すべてのTEポートでアップ状態でアクティブになっているすべてのVSANをMDSでチェックする |
すべてのTEポートで、許可されているすべてのVSANがactive状態であり、isolated状態またはinitializing状態のVSANがないことを確認します。 |
show version show module show interface show interface briefコマンド show port-channel database(隠しコマンド) |
12 |
MDS OUIによるリモートデバイスの確認 |
トランクおよびポートチャネル接続を介して接続されたOUIをMDSが認識していることを確認します。 |
show flogi internal event-history errors(flogi内部イベント履歴エラーの表示) show port internal event-history errors(ポート内部イベント履歴エラーの表示) show system internal fcfwd idxmap interface show flogi internal event-historyデバッグ show accounting log |
13 |
MDS CFSロックチェック |
CFSロックをチェックし、ロックを解除する推奨手順を確認します。 |
show version show module show hardware show cfs lock(隠しコマンド) show logging log show cfs internal session-history(隠しコマンド) show cfs peers(CFSピアの表示) show fcdomain domain-list(隠しコマンド) show cfs internal event-history errors(cfs内部イベント履歴エラーを表示) show clock |
14 |
MDSアクティブ側スーパーバイザmgmt0リンクのチェック |
アクティブまたはスーパーバイザmgmt0のみのリンクステータスが「up」を示しているかどうかを確認します。 |
show version show interface mgmt0 |
15 |
MDS 9700スタンバイスーパーバイザmgmt0リンクの確認 |
スタンバイ側のスーパーバイザmgmt0のリンクステータスが「up」かどうかを確認します。NX-OS 9.2(1)以降のバージョンを実行しているMDS 9700ダイレクタでのみ有効です。 |
show version show interface mgmt0 standby |
16 |
MDS最適でないPCメンバ割り当てのチェック |
ポートチャネルは、マルチスイッチのファイバチャネルSANの復元力にとって重要です。ポートチャネルを設定して耐障害性とハードウェアリソースの使用率を最大化することは、SANの復元力に貢献します。このモジュールは、検出された各ファイバ・チャネル・ポート・チャネルをチェックし、そのメンバー・インタフェースが、スイッチ内の使用可能なモジュールとfwdエンジンにできるだけ均等に分散されるようにします。 |
show version show interface briefコマンド |
17 |
MDS FSPFの整合性チェック |
各ISLのFSPFコストをチェックして、隣接スイッチのコストが同じで一貫していることを確認します。ISLの両側でコストが異なる場合、予期しないルーティングや非対称ルーティングが発生する可能性があります。これらのスイッチにはFSPFデータベースがないため、このチェックはNPVモードのスイッチには適用されません。 |
スイッチ名の表示 show fspf database(隠しコマンド) show fcs ieの実行 npv内部情報の表示 |
18 |
MDSの高CPU使用率のチェック |
複数のコマンド出力をチェックして、現在のCPU使用率が事前に設定された制限内であることを確認します。使用率が60 %を超えたらユーザに通知し、使用率が80 %を超えたらユーザに通知し、使用率が90 %を超えたらユーザに警告します。 |
show processes cpu show processes cpu history show logging log |
19 |
MDS高メモリ使用率のチェック |
いくつかの異なるコマンド出力を確認して、現在のメモリ使用量が設定されたしきい値を下回っているか、プロセスのいずれかが割り当てられたメモリ制限内で実行されているかどうかを判断します。使用率が90 %を超えた場合は、ユーザに通知します。 |
show version show processes memory(隠しコマンド) show running-config |
20 |
過剰な使用率を検出するためのMDSによるポートモニタTxデータレート設定の確認 |
アクティブなポートモニタポリシーを確認し、tx-datarateカウンタまたはtx-datarate-burstカウンタ(あるいはその両方)が超過使用を適切に検出するように設定されているかどうかを確認します。 |
show version show interface briefコマンド show running-config |
レポートおよび警告
- Health and Config Check SRは、仮想TACエンジニアによって自動化および処理されます。
- レポート(PDF形式)は、通常、SRに添付されているすべての必要なログの後、24営業時間以内に生成されます。
- レポートは、サービスリクエストに関連付けられたすべての連絡先(プライマリおよびセカンダリ)と電子メール(Cisco TAC自動Eメール<no-reply@cisco.com>から送信)で自動的に共有されます。
- レポートはサービスリクエストにも添付され、後から利用可能になります。
- このレポートに記載されている問題は、提供されたログに基づいており、表1(前述)に記載されているヘルスチェックモジュールの範囲内です。
- 実行されるヘルスチェックと設定チェックのリストは完全なものではないため、ユーザは必要に応じてさらにヘルスチェックを実行することをお勧めします。
- 新しい健全性チェックと設定チェックは、時間の経過とともに追加できます。
FAQ
Q1:同じSR内の複数のスイッチに関するshow tech-supportの詳細をアップロードして、すべてのスイッチに関するヘルスチェックレポートを取得することはできますか。
A1:これは自動ケース処理であり、ヘルスチェックは仮想TACエンジニアによって実行されます。ヘルスチェックは、アップロードされた最初のshow tech-supportの詳細に対してのみ実行されます。
Q2:数時間の間隔でキャプチャした同じデバイスに対して、show tech-supportの詳細を複数アップロードして、両方のヘルスチェックを行うことはできますか。
A2:これは仮想TACエンジニアによって実行される自動化されたステートレスなケース処理であり、SRにアップロードされた最初のshow tech-support detailsファイルの状態と設定のチェックは、アップロードされたファイルが同じスイッチからのものか異なるスイッチからのものかに関係なく行われます。
Q3:単一のrar/gzファイルとして圧縮され、SRにアップロードされたshow tech-support detailsファイルを持つスイッチのヘルスチェックを行うことはできますか。
A3:いいえ。複数のshow tech supportの詳細を1つのrar/zip/gzファイルとしてアップロードした場合、アーカイブの最初のファイルだけがヘルスチェックのために処理されます。
Q4:報告されたヘルスチェックの失敗に関する質問がある場合、どうすればよいですか。
A4:個別のTACサービスリクエストをオープンして、特定のヘルスチェック結果に関するサポートを受けてください。ヘルスチェックレポートを添付し、自動ヘルスチェックおよび設定チェック用にオープンされたサービスリクエスト(SR)ケース番号を参照することを強くお勧めします。
Q5:Automated Health and Config Check用に開いた同じSRを使用して、見つかった問題をトラブルシューティングできますか。
A5:いいえ。予防的なヘルスチェックが自動化されているため、新しいサービスリクエストをオープンして、報告された問題のトラブルシューティングと解決を行ってください。ヘルスチェックのためにオープンされたSRは、ヘルスレポートが公開されてから24時間以内にクローズされます。
Q6:前述のバージョンよりも古いバージョンを実行しているスイッチに対して、show tech-support detailsファイルに対して自動ヘルスチェックおよび設定チェックが実行されますか。
A6:健全性と設定の自動チェックは、前述のプラットフォームとソフトウェアリリースに対して行われます。古いバージョンを実行しているデバイスの場合はベストエフォートであり、レポートの精度は保証されません。
Q7:ヘルスチェック用にオープンされたSRを閉じるには?
A7:最初のヘルスチェックレポートが送信されてから24時間以内にSRがクローズされます。SRのクローズに対するユーザのアクションは不要。
Q8:予防的な健全性と設定のチェックに関するコメントやフィードバックを共有するにはどうすればよいですか。
A8:MDS-HealthCheck-Feedback@cisco.comに電子メールで送信してください。
Q9.スイッチから「show tech-support」または「show tech-support details」をキャプチャする推奨方法は何ですか。
A9:このドキュメントで前述したように、NX-OS 8.4(2d)および9.2(1)以降では、MDS tac-pacコマンドが拡張され、追加のshow logging onboardコマンドを使用してshow tech-supportの詳細を含むファイルをブートフラッシュにすばやく作成できます。これは、自動ヘルスチェックや設定チェックなど、show tech-supportの詳細を必要とするTACサービスリクエスト(SR)の入力ファイルを作成する推奨方法です。ターミナルアプリケーションのログファイル(SecureCRT、PuTTYなど)にキャプチャされたCLI出力は、UTF-8-BOM形式(または類似した形式)である可能性があります。これは、自動ヘルスチェックではサポートされていません。Automated Health & Configチェックは、ASCII形式またはUTF-8形式のファイルのみをサポートします。
Nexusの健全性と設定のチェックの実行
「Nexusの健全性と設定のチェックの実行」を参照してください。
フィードバック
これらのツールの動作に関するフィードバックは非常に高く評価されます。 見解や提案(たとえば、生成されるレポートの使いやすさ、範囲、品質など)がある場合は、MDS-HealthCheck-Feedback@cisco.comで共有してください。