この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。
この章では、Cisco Unified Computing System(Cisco UCS)に関する問題のトラブルシューティングに役立つ障害、イベント、およびその他の情報の入手先の概要について説明します。
• 「Cisco UCS Manager GUI のトラブルシューティング情報」
• 「Cisco UCS Manager CLI のトラブルシューティング情報」
• 「障害」
• 「イベント」
• 「監査ログ」
• 「Syslog」
Cisco UCS Manager GUI には、Cisco UCS インスタンスのトラブルシューティング情報の検索に使用できる複数のタブと、その他の領域があります。たとえば、特定のオブジェクトや、システムのすべてのオブジェクトの障害やイベントを表示できます。
[Navigation] ペインの [Admin] タブでは、問題のトラブルシューティングに役立つ障害、イベント、core ファイル、およびその他の情報にアクセスできます。
[Admin] タブの [Filter] フィールドで [Faults, Events and Audit Log] を選択すると、Cisco UCS Manager GUI によってツリー ブラウザが制限され、次のいずれかのみにアクセスできるようになります。
Cisco UCS Manager CLI には、Cisco UCS インスタンスのトラブルシューティング情報の検索を実行できる複数の show コマンドがあります。これらの show コマンドは、スコープを意識したコマンドです。たとえば、最上位のスコープから show fault コマンドを実行すると、システム内のすべての障害が表示されます。一方で、特定のオブジェクトのスコープに移動すると、 show fault はそのオブジェクトに関連する障害のみを表示します。
Cisco UCS では、障害は Cisco UCS Manager によって管理される可変オブジェクトです。障害は、Cisco UCS インスタンスの障害や、発生したしきい値のアラームを表します。障害のライフサイクルの間に、障害の状態または重大度が変化する場合があります。
各障害には、障害の発生時に影響を受けたオブジェクトの動作状態に関する情報が含まれます。障害の状態が移行して解決すると、そのオブジェクトは機能状態に移行します。次のいずれかの状態になるまで、障害は Cisco UCS Manager 内に残ります。
• 障害収集ポリシーの設定に従って、障害がクリアおよび削除される
Cisco UCS 内のすべての障害は、Cisco UCS Manager CLI または Cisco UCS Manager GUI を使用して表示できます。また、障害収集ポリシーを設定して、Cisco UCS インスタンスが障害を収集および保持する方法を決定することもできます。
• 「障害の重大度」
• 「障害の状態」
Cisco UCS インスタンスで発生した障害は、ライフサイクルの中で複数の重大度に移行する場合があります。 表 1-1 では、発生する可能性のある障害の重大度についてアルファベット順に説明します。
Cisco UCS インスタンスで発生した障害は、ライフサイクルの中で複数の重大度に移行します。 表 1-2 では、発生する可能性のある障害の状態についてアルファベット順に説明します。
|
|
---|---|
短い間隔で障害が発生してクリアされました。これはフラッピング間隔と呼ばれます。これは Flapping 状態の可能性があるため、障害の重大度は元のアクティブな値のままですが、この状態は障害が発生した状態がクリアされたことを示します。 |
Cisco UCS Manager では、Cisco UCS インスタンスで発生した各障害に関する詳細な情報を提供しています。 表 1-3 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。
|
|
---|---|
障害の現在の重大度。これは、表 1-1 で説明した重大度のいずれかになります。 |
|
障害の重大度が最後に変更された日時。障害が発生してから重大度が変更されていない場合、このプロパティは元の作成日を表します。 |
|
Cisco UCS の障害はステートフルです。各オブジェクトには、特定の障害のインスタンスが 1 つだけ存在できます。同じ障害が 2 度発生すると、Cisco UCS は発生回数を 1 つずつ増やします。
1. ある状態がシステム内で発生し、Cisco UCS が障害を発生させます。これはアクティブな状態です。
2. 障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたソーキング間隔になります。障害が断続的に何度も発生してクリアされると、フラッピングが発生します。フラッピング間隔のうち、障害収集ポリシーに指定されている期間は、障害の重要度が保持されます。
3. フラッピング間隔の間にその状態が再発すると、障害はアクティブな状態を返します。フラッピング間隔の間にその状態が再発しなかった場合は、その障害がクリアされます。
4. クリアされた障害は保持期間になります。この期間は、障害が発生した状態が緩和された場合でも管理者が障害に気付くようにしたり、障害が早々に削除されないようにするためのものです。保持期間のうち、障害収集ポリシーに指定された期間はクリアされた障害が保持されます。
5. 保持期間にその状態が再発すると、障害はアクティブな状態を返します。その状態が再発しなかった場合は、その障害が削除されます。
システム内の 1 つのオブジェクトの障害を表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Faults] タブをクリックします。システム内のすべてのオブジェクトの障害を表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Faults] ノードにナビゲートします。
また、Cisco UCS Manager GUI の左上の [Fault Summary] 領域には、Cisco UCS インスタンスのすべての障害の要約を表示できます。この領域には、Cisco UCS インスタンスで発生したすべての障害の要約が表示されます。
障害の重大度は、それぞれ異なるアイコンで表示されます。各アイコンの下の数字は、システム内でその重大度の障害が発生した回数を示します。アイコンをクリックすると、Cisco UCS Manager GUI によって [Work] 領域の [Faults] タブが開かれ、その重大度のすべての障害の詳細が表示されます。
システム内のすべてのオブジェクトの障害を表示する場合は、最上位レベルのスコープから show fault コマンドを実行します。特定のオブジェクトの障害を表示する場合は、そのオブジェクトのスコープに移動して、 show fault コマンドを実行します。
障害収集ポリシーは、フラッピング間隔や保持期間に障害を保持する時間など、Cisco UCS インスタンスでの障害のライフサイクルを制御します。
ヒント 障害収集ポリシーの設定方法については、『Cisco UCS B-Series Servers Documentation Roadmap』からアクセスできる Cisco UCS の設定ガイドを参照してください。
Cisco UCS では、イベントは Cisco UCS Manager によって管理される不変オブジェクトです。各イベントは、Cisco UCS インスタンスの非永続状態を表します。Cisco UCS Manager がイベントを作成してログに記録した後は、イベントは変更されません。たとえばサーバの電源を投入すると、Cisco UCS Manager は、その要求の始まりと終わりのイベントを作成して、ログに記録します。
Cisco UCS Manager CLI または Cisco UCS Manager GUI のいずれかを使用して、1 つのオブジェクトのイベントを表示したり、Cisco UCS インスタンスのすべてのイベントを表示できます。イベントは、イベント ログがいっぱいになるまで Cisco UCS に残ります。ログがいっぱいになると、Cisco UCS Manager はログおよびログの中のすべてのイベントを削除します。
• 「Cisco UCS Manager GUI のイベント」
• 「Cisco UCS Manager CLI のイベント」
Cisco UCS Manager では、Cisco UCS インスタンスで作成およびログ記録された各イベントの詳細情報を提供しています。 表 1-4 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。
|
|
---|---|
システム内の 1 つのオブジェクトのイベントを表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Events] タブをクリックします。システム内のすべてのオブジェクトのイベントを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Events] ノードにナビゲートします。
システム内のすべてのオブジェクトのイベントを表示する場合は、最上位レベルのスコープから show event コマンドを実行します。特定のオブジェクトのイベントを表示する場合は、そのオブジェクトのスコープに移動して、 show event コマンドを実行します。
Cisco UCS Manager や、ファブリック インターコネクトまたは I/O モジュールなどの Cisco UCS の一部のコンポーネントでの重大なエラーによって、システムに core ファイルが作成される場合があります。core ファイルには、障害発生時のシステムとコンポーネントに関する大量のデータが含まれます。
Cisco UCS Manager はすべてのコンポーネントの core ファイルを管理します。core ファイルが作成されたら、すぐに外部の TFTP サーバ上の場所に core ファイルのコピーをエクスポートするように、Cisco UCS Manager を設定できます。
• 「Cisco UCS Manager GUI での core ファイル」
• 「Cisco UCS Manager CLI での core ファイル」
Cisco UCS インスタンスのコンポーネントが core ファイルを生成したかどうかを確認するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Core Files] ノードにナビゲートします。
Cisco UCS インスタンスのコンポーネントが core ファイルを生成したかどうかを確認するには、次のコマンドを実行します。
Core File Exporter をイネーブルにすると、core ファイルが発生したらすぐに TFTP を使用してネットワーク上の指定された場所にエクスポートするように、Cisco UCS Manager を設定できます。この機能を使用して、core ファイルの内容を含む tar ファイルを、指定された場所にエクスポートすることもできます。
ヒント Exporter をイネーブルにする方法については、『Cisco UCS B-Series Servers Documentation Roadmap』からからアクセスできる Cisco UCS の設定ガイドを参照してください。
監査ログには、ユーザが Cisco UCS Manager で実行する処理(直接行う処理および間接的な処理を含む)が記録されます。監査ログの各エントリは、1 つの非永続処理を表します。たとえば、ユーザがログインまたはログアウトしたり、サービス プロファイルなどのオブジェクトを作成、変更、削除すると、Cisco UCS Manager はその処理のエントリを監査ログに追加します。
監査ログのエントリは、Cisco UCS Manager CLI、Cisco UCS Manager GUI、または show tech-support コマンドの出力で表示できます。
(注) 監査ログには、実行されたすべての処理の詳細が含まれない場合があります。たとえば、シャーシの電源ポリシーを変更した場合、監査ログのメッセージはシャーシが変更されたことだけを示し、実行された処理や変更された値は示されません。
• 「Cisco UCS Manager GUI の監査ログ」
• 「Cisco UCS Manager CLI の監査ログ」
Cisco UCS Manager では、監査ログの各エントリに関する詳細な情報を提供しています。 表 1-5 では、Cisco UCS Manager CLI または Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。
|
|
---|---|
監査ログ メッセージに関連付けられたユーザ処理の現在の重大度。これは、表 1-1 で説明した障害に使用される重大度と同じです。 |
|
監査ログを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Audit Log] ノードにナビゲートします。
System Event Log(SEL; システム イベント ログ)は BMC の NVRAM にあります。SEL には、電圧の上下、温度イベント、ファン イベント、BIOS からのイベントなど、サーバ関連のほとんどのイベントが記録されます。SEL は主にトラブルシューティングの目的で使用されます。
ヒント 各サーバの SEL を表示する方法や SEL ポリシーの設定方法などの SEL の詳細については、『Cisco UCS B-Series Servers Documentation Roadmap』からアクセスできる Cisco UCS の設定ガイドを参照してください。
SEL ファイルのサイズは約 40KB で、ファイルがいっぱいになるとそれ以上イベントを記録できません。それ以上のイベントを記録できるように、ファイルをクリアする必要があります。
SEL ポリシーを使用して、リモート サーバに SEL をバックアップできます。また、オプションで、バックアップ操作の実行後に SEL をクリアすることもできます。バックアップ操作は、特定の処理に基づいてトリガーすることができます。または、定期的に発生させることもできます。手動で SEL をバックアップしたり、クリアすることもできます。
Cisco UCS Manager は、SEL ポリシーの設定に従って、SEL のバックアップ ファイルを自動的に生成します。ファイル名の形式は sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。
たとえば、ファイル名は sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 のようになります。
Syslog は、主に、Cisco UCS インスタンスのトラブルシューティングや監査に使用できるシステム ログの収集と処理を行います。Cisco UCS Manager では、DCOS syslog メカニズムと API、およびプライマリ ファブリック インターコネクトの syslog 機能を使用して、syslog エントリを収集して処理します。
Cisco UCS Manager は Cisco UCS インスタンスの syslog コレクタを管理および設定し、その設定を 1 つまたは複数のファブリック インターコネクトに展開します。この設定は、DCOS または Cisco UCS Manager によって Cisco UCS インスタンスで生成されるすべての syslog エントリに影響します。
syslog および syslog エントリを、次のうちの 1 つまたは複数の場所に配置するように、Cisco UCS Manager を設定できます。
• syslog エントリをコンソールまたはモニタに表示する
• syslog エントリを Cisco UCS インスタンスの syslog が格納されている外部ログ コレクタに転送する(最大 3 つまで)
Cisco UCS コンポーネントによって生成される syslog エントリの形式は、次のとおりです。
Year month date hh:mm:ss hostname %facility-severity-MNEMONIC description
例:2007 Nov 1 14:07:58 excal-113 %MODULE-5-MOD_OK: Module 1 is online
表 1-6 では、各 syslog エントリに含まれる情報について説明します。
次の Cisco UCS コンポーネントでは、DCOS syslog サービスを使用して、システム情報とアラートに関する syslog エントリを生成します。
• I/O モジュール:syslogd を実行します。すべての syslog エントリは接続しているファブリック インターコネクトに送信されます。
• BMC:すべての syslog エントリは、クラスタ構成内のプライマリ ファブリック インターコネクトに送信されます。
• アダプタ:Nic-Tools/Syslog を実行します。すべての syslog エントリは、両方のファブリック インターコネクトに送信されます。
• Cisco UCS Manager:syslog の設定に従って、独自の syslog エントリをログに記録します。