この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。
この章は、次の項で構成されています。
Cisco UCS Managerの問題、またはそれが管理するコンポーネントの問題のトラブルシューティングを行うには、次の表に記載するガイドラインに従う必要があります。
ガイドライン |
説明 |
---|---|
リリース ノートをチェックして、この問題が既知の問題かどうかを確認する。 |
リリース ノートは、 から入手できます。http://www.cisco.com/go/unifiedcomputing/b-series-doc で入手可能な『Cisco UCS B-Series Servers Documentation Roadmap』 |
障害またはエラー メッセージのダイアログボックス、コンポーネントの FSM、およびその他の関連する領域のスクリーンショットを取得する。 |
これらのスクリーンショットは、問題が発生したときのCisco UCS Managerの状態に関する、目に見える手掛かりになります。コンピュータにスクリーンショットを撮るソフトウェアがない場合は、オペレーティング システムのマニュアルをチェックしてください。このような機能が含まれている場合があります。 |
問題が発生する前に自分が直接実行した手順を記録する。 |
画面またはキー入力を記録するソフトウェアにアクセスできる場合は、実行した手順を繰り返して、Cisco UCS Managerで発生した内容を記録します。 このようなソフトウェアを持っていない場合は、実行した手順を繰り返して、その手順およびそれぞれの手順の後に Cisco UCS Managerで発生した内容を詳しくメモします。 |
テクニカル サポート ファイルを作成する。 |
Cisco UCS ドメインの現在の状態に関する情報は、シスコ サポートにとって非常に役立ちます。そのため、問題の原因を識別するために必要な情報を頻繁に提供します。 |
Cisco UCSでは、障害はCisco UCS Manager によって管理される可変オブジェクトです。障害は、Cisco UCS ドメインの障害や、発生したしきい値のアラームを表します。障害のライフサイクルの間に、障害の状態または重大度が変化する場合があります。
各障害には、障害の発生時に影響を受けたオブジェクトの動作状態に関する情報が含まれます。障害の状態が移行して解決すると、そのオブジェクトは機能状態に移行します。
障害は、障害収集ポリシーの設定に従ってクリアおよび削除されるまで Cisco UCS Manager内に維持されます。
Cisco UCS ドメイン内のすべての障害は、Cisco UCS Manager CLI またはCisco UCS Manager GUI を使用して表示できます。また、障害収集ポリシーを設定して、Cisco UCS ドメインが障害を収集および保持する方法を決定することもできます。
(注) | すべての Cisco UCS障害は MIB に含まれ、SNMP によるトラップが可能です。 |
Cisco UCS ドメインで発生した障害は、ライフサイクルの中で複数の重大度に移行する場合があります。次の表に、発生する可能性がある障害の重大度を示します。
重大度 |
説明 |
---|---|
Critical |
サービスに影響する状態であり、すぐに修正処理が必要です。たとえばこの重大度は、管理対象オブジェクトがアウト オブ サービスであり、機能を回復させる必要があることを示している場合があります。 |
Major |
サービスに影響する状態であり、緊急の修正処理が必要です。たとえばこの重大度は、管理対象オブジェクトの機能が著しく低下しており、機能を完全に回復させる必要があることを示している場合があります。 |
Minor |
サービスには影響しない障害の状態であり、より深刻な障害が発生するのを防ぐために修正処理が必要です。たとえばこの重大度は、検出されたアラーム条件が、管理対象オブジェクトの能力を低下させていないことを示している場合があります。 |
警告 |
潜在的に、あるいは近い将来に発生する可能性のある、サービスに影響する障害であり、システムに大きな影響を与えていません。必要に応じて、さらに詳しく診断して問題を修正し、サービスに影響を与えるより深刻な障害が発生するのを防ぐ必要があります。 |
Condition |
状態に関する情報メッセージで、単独では重要ではありません。 |
Info |
基本的な通知または情報メッセージで、単独では重要ではありません。 |
Cisco UCS ドメインで発生した障害は、ライフサイクルの中で複数の状態に移行します。次の表に、発生する可能性がある障害の状態をアルファベット順に示します。
状態 |
説明 |
---|---|
クリア済み |
解決してクリアされた状態。 |
Flapping |
短い間隔で障害が発生し、クリアされ、再び発生しました。これはフラッピング間隔と呼ばれます。 |
Soaking |
短い間隔で障害が発生してクリアされました。これはフラッピング間隔と呼ばれます。この状態は Flapping 状態の可能性があるため、障害の重大度は元のアクティブな値のままですが、この状態は障害が発生した状態がクリアされたことを示します。 |
Cisco UCS ドメインで発生する障害は、次の表で説明する種類のいずれかになります。
タイプ |
説明 |
---|---|
fsm |
FSM タスクが正常に完了しなかったか、または Cisco UCS Managerが FSM のいずれかの段階を再試行しています。 |
equipment |
Cisco UCS Managerが、物理コンポーネントが動作不能であるか、または物理コンポーネントに別の機能上の問題があることを検出しました。 |
サーバ |
Cisco UCS Managerが、サーバ タスク(例:サービス プロファイルをサーバに関連付ける)を完了できません。 |
設定 |
Cisco UCS Managerがコンポーネントを正常に設定できません。 |
環境 |
Cisco UCS Managerが、電力問題、熱問題、電圧問題、CMOS 設定の喪失を検出しました。 |
管理 |
Cisco UCS Managerが、次のような重大な管理上の問題を検出しました。 |
接続性 |
Cisco UCS Managerが接続に関する問題(例:アダプタに到達できない)を検出しました。 |
network |
Cisco UCS Managerがネットワークに関する問題(例:リンクのダウン)を検出しました。 |
動作中 |
Cisco UCS Managerが動作に関する問題(例:ログ キャパシティの問題、サーバ ディスカバリの失敗)を検出しました。 |
Cisco UCS Managerは、Cisco UCS ドメイン で発生した各障害に関する詳細な情報を提供します。次の表では、Cisco UCS Manager CLIまたは Cisco UCS Manager GUI で表示できる障害のプロパティについて説明します。
プロパティ名 |
説明 |
---|---|
Severity |
障害の現在の重大度レベル。これは、障害の重大度に記載されている重大度のいずれかになります。 |
Last Transition |
障害の重大度が最後に変更された日時。障害が発生してから重大度が変更されていない場合、このプロパティは元の作成日を表します。 |
Affected Object |
障害が発生した状態によって影響を受けるコンポーネント。 |
説明 |
障害の説明。 |
ID |
障害に割り当てられた固有識別子。 |
タイプ |
発生した障害の種類。これは、障害の種類に記載されている種類のいずれかになります。 |
Cause |
障害を発生させた状態に関連付けられている固有識別子。 |
Created at |
障害が発生した日時。 |
コード |
障害に割り当てられた固有識別子。 |
Number of Occurrences |
障害が発生したイベントの発生回数。 |
Original Severity |
障害が最初に発生したときに割り当てられた重大度。 |
Previous Severity |
以前の重大度。このプロパティは、障害の重大度がライフサイクル中に変更された場合にのみ使用されます。 |
Highest Severity |
この問題で発生した一番深刻な重大度。 |
Cisco UCSの障害はステートフルです。各オブジェクトには、特定の障害のインスタンスが 1 つだけ存在できます。同じ障害が 2 度発生すると、Cisco UCSは発生回数を 1 つずつ増やします。
障害のライフサイクルは次のとおりです。
ある状況がシステムで発生し、Cisco UCS Managerで障害が発生します。これはアクティブな状態です。
障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたソーキング間隔になります。障害が発生し、すぐに何度かクリアされると、フラッピングが発生します。フラッピング間隔のうち、障害収集ポリシーに指定されている期間は、障害の重要度が保持されます。
フラッピング間隔中に同じ条件が再発生した場合は、障害がアクティブ状態に戻ります。フラッピング間隔中に同じ条件が再発生しない場合は、障害がクリアされます。
クリアされた障害は保持期間になります。この期間があるため、障害が発生した状態が改善され、さらに障害が早々に削除されていない場合でも管理者が障害に気付くことができます。保持期間のうち、障害収集ポリシーに指定された期間はクリアされた障害が保持されます。
この状況が保持間隔中に再発生する場合は、障害がアクティブ状態に戻ります。この状況が再発生しない場合は、障害が削除されます。
システム内の 1 つのオブジェクトの障害を表示する場合は、Cisco UCS Manager GUIでそのオブジェクトにナビゲートして、[Work] ペインの [Faults]タブをクリックします。システム内のすべてのオブジェクトの障害を表示するには、[Faults, Events and Audit Log]の下の [Admin] タブにある [Faults] ノードにナビゲートします。
また、Cisco UCS Manager GUIの左上の [Fault Summary] 領域には、Cisco UCS ドメインのすべての障害の要約を表示できます。この領域には、Cisco UCS ドメインで発生したすべての障害の要約が表示されます。
障害の重大度は、それぞれ異なるアイコンで表示されます。各アイコンの下の数字は、システム内でその重大度の障害が発生した回数を示します。アイコンをクリックすると、Cisco UCS Manager GUIによって [Work] ペインの [Faults] タブが開き、その重大度のすべての障害の詳細が表示されます。
システム内のすべてのオブジェクトの障害を表示する場合は、最上位レベルのスコープから show fault コマンドを入力します。特定のオブジェクトの障害を表示する場合は、そのオブジェクトのスコープに移動して、show fault コマンドを実行します。
障害について入手可能なすべての詳細を表示するには、show fault detail コマンドを入力します。
障害収集ポリシーは、フラッピング間隔や保持期間に障害を保持する時間など、Cisco UCS ドメインでの障害のライフサイクルを制御します。
ヒント | 障害収集ポリシーの設定方法については、Cisco UCS B-Series Servers Documentation Roadmap で、Cisco UCS Manager の設定ガイドを参照してください。 |
Cisco UCSでは、イベントはCisco UCS Manager によって管理される不変オブジェクトです。各イベントは、Cisco UCS ドメインインスタンスの非永続状態を表します。Cisco UCS Managerがイベントを作成してログに記録した後は、イベントは変更されません。たとえば、サーバの電源を投入すると、Cisco UCS Managerは、その要求の始まりと終わりのイベントを作成して、ログに記録します。
Cisco UCS Manager CLIまたは Cisco UCS Manager GUI を使用して、1 つのオブジェクトのイベントを表示したり、Cisco UCS ドメインのすべてのイベントを表示したりできます。イベントは、イベント ログがいっぱいになるまでCisco UCSに残ります。ログがいっぱいになると、Cisco UCS Managerはログおよびログの中のすべてのイベントを削除します。
Cisco UCS Managerでは、Cisco UCS ドメインで作成および記録された各イベントに関する詳細な情報が提供されます。次の表に、Cisco UCS Manager CLIまたは Cisco UCS Manager GUI で表示可能な障害のプロパティに関する説明を示します。
プロパティ名 |
説明 |
---|---|
Affected Object |
イベントを作成したコンポーネント。 |
説明 |
イベントの説明 |
Cause |
イベントに関連付けられた固有識別子。 |
Created at |
イベントが作成された日付と時刻。 |
User |
イベントを作成したユーザの種類。次のような種類があります。 |
コード |
イベントに割り当てられた固有識別子。 |
システム内の 1 つのオブジェクトのイベントを表示する場合は、Cisco UCS Manager GUI でそのオブジェクトにナビゲートして、[Work] ペインの [Events] タブをクリックします。システム内のすべてのオブジェクトのイベントを表示するには、[Faults, Events and Audit Log] の下の [Admin] タブにある [Events] ノードにナビゲートします。
システム内のすべてのオブジェクトのイベントを表示する場合は、最上位レベルのスコープから show event コマンドを入力します。特定のオブジェクトのイベントを表示する場合は、そのオブジェクトのスコープに移動して、show event コマンドを入力します。
イベントについて入手可能なすべての詳細を表示するには、show event detail コマンドを入力します。
監査ログには、ユーザが Cisco UCS Manager で実行するアクション(直接行うアクションおよび間接的なアクションを含む)が記録されます。監査ログの各エントリは、1 つの非永続処理を表します。たとえば、ユーザがログインまたはログアウトしたり、サービス プロファイルなどのオブジェクトを作成、変更、削除したりすると、Cisco UCS Manager はそのアクションのエントリを監査ログに追加します。
監査ログのエントリは、Cisco UCS Manager CLI、Cisco UCS Manager GUI、または Cisco UCS Manager から出力したテクニカル サポート ファイルで表示できます。
Cisco UCS Manager では、監査ログの各エントリに関する詳細な情報を提供しています。次の表では、Cisco UCS Manager GUIまたは Cisco UCS Manager CLI で表示できる障害のプロパティについて説明します。
プロパティ名 |
説明 |
---|---|
ID |
監査ログ メッセージに関連付けられた固有識別子。 |
Affected Object |
ユーザのアクションによって影響を受けるコンポーネント。 |
Severity |
監査ログ メッセージに関連付けられたユーザ アクションの現在の重大度。障害の重大度で説明しているように、これらの重大度は障害にも使用されます。 |
Trigger |
メッセージを発生したユーザに関連付けられているユーザの役割。 |
User |
イベントを作成したユーザのタイプ。次のタイプがあります。 |
説明 |
監査ログ メッセージが示す処理。次のいずれかの値をとります。 |
説明 |
ユーザ アクションの説明。 |
Cisco UCS Manager GUI では、[Faults, Events and Audit Log]ノードの下の [Admin] タブにある [Audit Log] ノードで監査ログを確認できます。
Cisco UCS Manager CLI で、次のコマンドを使用して監査ログを表示できます。
システム イベント ログ(SEL)は、NVRAM 内の CIMC に存在します。過不足の電圧、温度イベント、ファン イベント、BIOS からのイベントなど、ほとんどのサーバ関連イベントが記録されます。SEL は、主にトラブルシューティングのために使用します。
SEL ファイルのサイズは約 40KB で、ファイルがいっぱいになるとそれ以上イベントを記録できません。新たなイベントを記録できるようにするには、ファイルの中身をクリアする必要があります。
SEL ポリシーを使用して、SEL をリモート サーバにバックアップできます。また、必要に応じて、バックアップ操作後に SEL をクリアすることもできます。バックアップ操作は、特定のアクションに基づいて起動するか、定期的に実行できます。SEL のバックアップやクリアは、手動で行うこともできます。
バックアップ ファイルは、自動的に生成されます。このファイル名の形式は、sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。たとえば、sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 となります。
SEL ファイルのサイズは約 40 KB です。SEL ファイルがいっぱいになると、それ以上イベントを記録できません。新たなイベントを記録できるようにするには、ファイルの中身をクリアする必要があります。
SEL ポリシーを使用して、SEL をリモート サーバにバックアップできます。また、必要に応じて、バックアップ操作後に SEL をクリアすることもできます。バックアップ操作は、特定のアクションに基づいて起動するか、定期的に実行できます。SEL のバックアップやクリアは、手動で行うこともできます。
Cisco UCS Manager は、SEL ポリシーの設定に従って、SEL のバックアップ ファイルを自動的に生成します。ファイル名の形式は、sel-SystemName-ChassisID-ServerID-ServerSerialNumber-Timestamp です。
たとえば、ファイル名は sel-UCS-A-ch01-serv01-QCI12522939-20091121160736 のようになります。
syslog は、Cisco UCS ドメインのトラブルシューティングや監査に使用できるシステム ログの収集と処理を一元的に行います。Cisco UCS Managerでは、NX-OS syslog メカニズムと API、およびプライマリ ファブリック インターコネクトの syslog 機能を使用して、syslog エントリを収集して処理します。
Cisco UCS Managerは、Cisco UCS ドメインの syslog コレクタを管理および設定し、その設定を 1 つまたは複数のファブリック インターコネクトに展開します。この設定は、Cisco NX-OS または Cisco UCS Managerによって、Cisco UCS ドメインで生成されるすべての syslog エントリに影響します。
syslog および syslog エントリを使用して次の 1 つまたは複数の操作を実行するように Cisco UCS Managerを設定できます。
Cisco UCS コンポーネントによって生成される各 syslog エントリの形式は、次のとおりです。
Year month date hh:mm:ss hostname %facility-severity-MNEMONIC description
例:2007 Nov 1 14:07:58 excal-113 %MODULE-5-MOD_OK: Module 1 is online
syslog エントリには、Cisco UCS Manager によって Cisco UCS の重大度が割り当てられます。次の表に、Cisco UCS の重大度が syslog の重大度にどのようにマップされるかを示します。
Cisco UCS の重大度 |
Syslog の重大度 |
---|---|
CRIT |
CRIT |
MAJOR |
ERR |
MINOR |
WARNING |
WARNING |
NOTICE |
INFO |
INFO |
次の表に、各 syslog エントリに含まれる情報についての説明を示します。
名前 |
説明 |
---|---|
ファシリティ |
その syslog エントリを生成して送信したロギング ファシリティ。このファシリティは大きく分類され、整数で表されます。これらのソースは、次の Linux の標準的なファシリティのいずれかになります。 |
Severity |
syslog エントリが生成される原因となった、イベント、アラート、または問題の重大度。重大度は次のいずれかになります。 |
Hostname |
エントリの発生元となるコンポーネントに依存する syslog エントリに含まれるホスト名。次のようになります。 |
Timestamp |
syslog エントリが生成された日時。 |
メッセージ |
syslog エントリが生成される原因となった、イベント、アラート、または問題の説明。 |
次の Cisco UCS コンポーネントでは、Cisco NX-OS syslog サービスを使用して、システム情報とアラートに関する syslog エントリを生成します。
Cisco Technical Assistance Center(Cisco Technical Assistance Center)によるトラブルシューティングやサポートが必要な問題が発生した場合は、影響を受ける UCS ドメインに関して、できるだけ多くの情報を収集します。Cisco UCS Manager はこの情報をテクニカル サポート ファイルに出力します。このファイルをシスコに送信できます。
テクニカル サポート ファイルは、Cisco UCS ドメインの次のコンポーネントについて作成することができます。
UCSM:Cisco UCS ドメイン全体のテクニカル サポート データが含まれます。
UCSM 管理サービス:Cisco UCS Manager管理サービスのテクニカル サポート データが含まれます(ただし、ファブリック インターコネクトを除きます)。
シャーシ:特定のシャーシのブレード サーバ上の I/O モジュールまたは CIMC のテクニカル サポート データが含まれます。
ファブリック エクステンダ:特定の FEX のテクニカル サポート データが含まれます。
ラック サーバ:特定のラックマウント サーバまたはアダプタのテクニカル サポート データが含まれます。
サーバ メモリ:特定のラックマウント サーバとブレード サーバに関するサーバ メモリのテクニカル サポート データが含まれます。
(注) | Cisco UCS Manager Release 1.4(1) よりも前のリリースでは、Cisco UCS Manager CLI でのみテクニカル サポート ファイルを作成できました。 |
Cisco Technical Assistance Centerに送信できる、Cisco UCS ドメインに関する情報を出力するには、show tech-support コマンドを使用します。
コマンドまたはアクション | 目的 | |
---|---|---|
ステップ 1 | UCS-A# connect local-mgmt {a | b} |
ローカル管理モードを開始します。 |
ステップ 2 | UCS-A(local-mgmt) # show tech-support {chassischassis-id {all | cimcslot [adapteradapter-id] | iomiom-id} | fexfex-id | serverserver-id [adapteradapter-id] | server-memory {server-list | all} | ucsm | ucsm-mgmt} [brief | detail] |
選択したオブジェクトに関する情報をファイルに出力します。このファイルをCisco Technical Assistance Centerに送信できます。次のオプションを使用できます。
|
ステップ 3 | UCS-A (local-mgmt) # copyworkspace:techsupport/filename.tar {scp | ftp}: user_name@IP_address Enter username’s password: password |
SCP または FTP を使用して、出力ファイルを外部の場所にコピーします。 SCP および FTP コマンドにはコピー先の場所の絶対パスが必要です。home ディレクトリのパスには、「~」などの特殊記号を含めることはできません。 |
たとえば、計画停電の一環として、Cisco UCS ドメイン全体の稼働を中止できます。
ステップ 1 | 設定バックアップを作成します。
詳細については、使用しているCisco UCS Managerのリリース用のCisco UCS Manager コンフィギュレーション ガイドを参照してください。コンフィギュレーション ガイドは、http://www.cisco.com/go/unifiedcomputing/b-series-doc で入手可能な『Cisco UCS B-Series Servers Documentation Roadmap』から入手できます。 |
ステップ 2 | インストールされているオペレーティング システムから、すべてのブレードまたはラック サーバの電源を正常に切断します。
サーバ上の OS から、または Cisco UCS Managerを使用して、サーバの電源を切断できます。 |
ステップ 3 | すべてのサーバの電源を切断してから、シャーシの電源またはラック サーバの電源を取り外します。
サーバの電源を切断すると、電源 LED が緑色ではなくオレンジ色になります。 |
ステップ 4 | 次の順序で電源コードを取り外して、各ファブリック インターコネクトの電源を切断します。 |
(注) | この手順は、Cisco UCS Manager CLI を使用した場合にのみ実行できます。 |
Cisco UCS Manager CLI の test コマンドにより、Lightweight Directory Access Protocol(LDAP)プロバイダーまたは LDAP プロバイダー グループの設定が確認されます。
(注) | test aaa server ldap コマンドにより、LDAP グローバル設定に関係ない、サーバ固有の設定を確認できます。このコマンドでは、LDAP プロバイダー レベルで設定された、ベース DN、フィルタ、属性、およびタイムアウトの値を使用します。プロバイダー レベルのベース DN またはフィルが空である場合は、LDAP 検索が失敗します。 |
test aaa server ldap コマンドを入力すると、次のように Cisco UCS Manager が LDAP プロバイダーと通信できる場合には、次の情報を確認できます。
コマンドまたはアクション | 目的 |
---|
応答の例を次に示します。
UCS-A# /security # connect nxos UCS-A#(nxos)# test aaa server ldap 10.193.23.84 kjohn Nbv12345 user has been authenticated Attributes downloaded from remote server: User Groups: CN=g3,CN=Users,DC=ucsm CN=g2,CN=Users,DC=ucsm CN=group-2,CN=groups,DC=ucsm CN=group-1,CN=groups,DC=ucsm CN=Domain Admins,CN=Users,DC=ucsm CN=Enterprise Admins,CN=Users,DC=ucsm CN=g1,CN=Users,DC=ucsm CN=Administrators,CN=Builtin,DC=ucsm User profile attribute: shell:roles="server-security,power" shell:locales="L1,abc" Roles: server-security power Locales: L1 abc
(注) | test aaa group コマンドにより、LDAP グローバル設定に関係ない、グループ固有の設定を確認できます。 |
test aaa group コマンドを入力すると、次のように Cisco UCS Manager が LDAP グループと通信できる場合には、次の情報を確認できます。
コマンドまたはアクション | 目的 |
---|
応答の例を次に示します。
UCS-A# /security # connect nxos UCS-A#(nxos)# test aaa group grp-ad1 kjohn Nbv12345 user has been authenticated Attributes downloaded from remote server: User Groups: CN=g3,CN=Users,DC=ucsm CN=g2,CN=Users,DC=ucsm CN=group-2,CN=groups,DC=ucsm CN=group-1,CN=groups,DC=ucsm CN=Domain Admins,CN=Users,DC=ucsm CN=Enterprise Admins,CN=Users,DC=ucsm CN=g1,CN=Users,DC=ucsm CN=Administrators,CN=Builtin,DC=ucsm User profile attribute: shell:roles="server-security,power" shell:locales="L1,abc" Roles: server-security power Locales: L1 abc