障害、エラー、イベント、監査ログ
(注) |
障害、イベント、エラー、システム メッセージについては、Web ベースのアプリケーションである 『Cisco APIC Faults, Events, and System Messages Management Guide』 および 『Cisco APIC Management Information Model Reference』 を参照してください。 |
APIC は、MO の集合形式で ACI ファブリックシステムの管理および操作状態の包括的な現在のランタイム表現を維持します。システムは、これらのプロセスを管理するためにシステムとシステムおよびユーザーが作成するポリシーのランタイム状態に従って、障害、エラー、イベント、および監査ログ データを生成します。
APIC GUI を使用すると、ファブリック スイッチのカスタマイズされた「履歴レコード グループ」を作成できます。これに、カスタマイズされたスイッチ ポリシーを割り当てて、それらのグループのスイッチ用に維持する監査ログ、イベント ログ、正常性ログ、および障害ログのカスタマイズされたサイズと保持期間を指定できます。
APIC GUI を使用すると、このファブリック上のコントローラに対して維持される監査ログ、イベント ログ、正常性ログ、および障害ログのサイズと保持期間を指定するグローバル コントローラ ポリシーをカスタマイズすることもできます。
障害
システムの実行時の状態に基づいて、APIC は自動的に異常を検出し、障害を表す障害オブジェクトを作成します。障害オブジェクトには、ユーザが問題を診断してその影響を評価するのに役立ち、解決策を提供するように作られているさまざまなプロパティが含まれます。
ライフサイクルは問題の現在の状態を表します。サイクルは問題が最初に検出されると、そのソーク時間で開始され、提起された状態へと変わって、問題がまだ存在するとその状態のままになります。状態がクリアされると、「raised-clearing」と呼ばれるステータスに移行します。そのステータスでは、その状態がまだ存在する可能性があると見なされます。次に、「clearing time」に移行し、最終的に「retaining」に移行します。この時点で、問題は解決されたと見なされ、ユーザが最近解決された問題を確認できるようにする目的のために障害オブジェクトは保持されます。
ライフサイクルの移行が発生するたびに、システムは自動的にそれを記録する障害記録オブジェクトを作成します。障害レコードは、作成後は変更されることはなく、レコード数が障害保持ポリシーで指定された最大値を超えた場合にのみ削除されます。
シビラティ(重大度)は、サービスを提供するシステムの機能に対するその状態の影響の概算値です。考えられる値は、Warning(注意)、Minor、Major および Critical です。Warning(注意)に相当するシビラティ(重大度)の障害は、導入されているサービスには現在影響を与えていない潜在的な問題を示します(たとえば、不完全または矛盾した構成など)。Minor および Major の障害は、提供されるサービスが低下する可能性があることを示します。Critical は、大規模な停電がサービスを著しく低下させていたり、同時にサービスが悪化していることを意味します。説明には、追加情報を提供したりトラブルシューティングに役立てるために用意された人間に解読可能な問題の説明が含まれます。
次の図は、障害とイベントに関するレポートを作成するプロセスを示します。
-
プロセスが障害のある状態を検出します。
-
プロセスが Event and Fault Manager に通知します。
-
Event and Fault Manager は障害ルールに従って通知を処理します。
-
Event and Fault Manager は、MIM で障害インスタンスを作成し、障害ポリシーに従ってそのライフ サイクルを管理します。
-
Event and Fault Manager は、APIC および接続されたクライアントに状態遷移を通知します。
-
Event and Fault Manager は、追加のアクションをトリガーします(syslog や call home など)。
ログ レコード オブジェクト
ログ レコード オブジェクトについて
Cisco Application Centric Infrastructure(ACI)ファブリックのイベント(生成された障害、クリアされた障害など)、Cisco Application Policy Infrastructure Controller(APIC)またはスイッチのイベントなど、すべてのイベントがデータベースに記録されるため、ユーザはステータス遷移の履歴、イベントなどをレビューすることが可能です。Cisco APIC ノードおよびスイッチ ノードはどちらも、障害、イベントなどを自ら生成して保存します。ただし、スイッチ ノードからのログ レコードは Cisco APIC にも複製されるため、Cisco APIC ノードおよびスイッチ ノードを含むファブリック全体のログ レコードを Cisco APIC から表示できます。さらに、Cisco APIC データベースは、Cisco APIC をアップグレードした後でも、Cisco APIC ノードおよびスイッチ ノードの両方のログ レコードを保持します。対照的に、スイッチをアップグレードすると、スイッチのログ レコードは失われます。
ログ レコード オブジェクトはシステムによって作成され、ユーザが変更または削除することはできません。ログ レコード オブジェクトのライフサイクルは、保持ポリシーによって制御されます。クラスごとのログ レコード オブジェクトの数が保持ポリシーの最大制限に達すると、最も古いログ レコード オブジェクトがデータベースから削除され、新しいレコード用のスペースが確保されます。
ログ レコード オブジェクトは、次のログ レコード クラスに分類されます。
-
[障害記録(Fault Records)]:障害記録は、ライフサイクル変更の履歴を示します。障害ルールは、管理対象オブジェクト クラスで定義されます。管理対象オブジェクトに障害がある場合、障害が発生し、管理対象オブジェクトに関連付けられます。障害状態がなくなると、障害はクリアされます。障害が発生またはクリアされるか、ライフサイクル状態が変更されるたびに、FAULT 状態の変化を記録するために障害レコード オブジェクトが作成されます。
-
[イベント レコード(Event Records)]:Cisco APIC によって管理されるイベントです。各イベント レコードは、スイッチまたは Cisco APIC ノードで発生したイベントを表します。イベント ルールは、管理対象オブジェクト クラスで定義されます。管理対象オブジェクトの状態がイベント ルールに一致すると、イベント(または
eventRecord
オブジェクト)が作成されます。たとえば、スイッチからカードを抜くと、スイッチ イベント マネージャはユーザ操作のイベント通知を生成します。 -
[監査ログ(Audit Logs)]:監査ログは、管理対象オブジェクトが変更されたときに記録される履歴レコードであり、変更を行ったユーザが含まれます。監査ログには、システムによって内部的に変更された管理対象オブジェクトも記録されます。
-
[セッション ログ(Session logs)]:セッション ログは、ユーザが Cisco APIC または スイッチにログインまたはログアウトしたときに記録される履歴レコードであり、クライアントの IP アドレスが含まれています。
-
[正常性レコード(Health Records)]:正常性レコードは、管理対象オブジェクトの正常性スコア変更の履歴レコードです。管理対象オブジェクトの正常性スコアが 5 ポイント変化するたびに、正常性レコード オブジェクトが作成されます。
ファブリック内の各ログ レコード オブジェクトの最大数は、保持ポリシーによって定義されます。これは、ファブリック全体で数百万になる可能性があります。このような大量のデータをクエリすると、クエリへの応答が遅くなり、最悪の場合、クエリが失敗する可能性があります。これを防止するために、Cisco APIC リリース 5.1(1) 以降、ログ レコード オブジェクトの応答が大幅に高速化されるように、特にリーダー プロセスが強化されました。ただし、トレードオフとして、クエリ(ページ)間の並べ替えは保証されません。
クエリ パフォーマンスの向上と新しい制限は、このセクションで説明されているログ レコード オブジェクトのクエリにのみ適用されます。
Cisco APIC リリース 5.2(3) 以降、ログ レコード オブジェクトに対してのみサポートされる新しい API クエリ オプションの time-range
を使用すると、Cisco APIC はページ間のソートを維持しながら、ログ レコード オブジェクトの API クエリにはるかに高速に応答できます。Cisco APIC GUI はまた、time-range
オプションを使用することでパフォーマンスとソートを向上します。ログ レコード オブジェクトのクエリの詳細については、『Cisco APIC REST API 構成ガイド』リリース 4.2(x) 以降)を参照してください。
GUI を使用したログ レコード オブジェクトの表示
Cisco Application Policy Infrastructure Controller(APIC)GUI を使用して、Cisco APIC または スイッチのデータベースからログ レコード オブジェクトを表示できます。5.2(3) リリース以降、次のいずれかの方法を使用してログ レコード オブジェクトを表示します。
-
ファブリック内のすべての Cisco APIC およびスイッチについて、 タブに移動し、[作業(Work)] ペインでいずれかのログ レコード タブを選択します。
-
特定のスイッチについては、[ナビゲーション(Navigation)] ペインで、 に移動します。[作業(Work)] ペインで、[履歴(History)] タブを選択してから、ログ レコード サブタブの 1 つを選択します。
タブに移動します。
レコードは作成日時の降順で表示されます。[過去 x time_measurement 内の履歴(History within the last x time_measurement)] の右側にある下矢印をクリックして期間を選択することで、期間に基づいて表示されるログ レコードを絞り込むことができます。[カスタム(custom)] 選択により、任意の範囲の日付を指定できます。
1 つ以上のフィルタを作成して、表示されるログ レコードを絞り込むこともできます。[属性でフィルタ(Filter by attributes)] フィールドをクリックし、属性を選択し、演算子を選択してから、値を選択または入力します(属性に応じて)。作成するフィルタごとにこのプロセスを繰り返します。
または、レコードのテーブルの値にカーソルを合わせると、値の右側にフィルタ アイコン(じょうごで表される)が表示され、アイコンをクリックします。これで、適切なパラメータを持つフィルタが自動的に作成されます。たとえば、障害レコードを表示しているときに障害コード
F103824 のフィルタ アイコンをクリックすると、次のパラメータを使用してフィルタが作成されます。Code == F103824
自動作成されたフィルタは、==
演算子のみをサポートします。
[作業(Work)] ペインの下部にある [行(Rows)] ドロップダウン リストを使用して、1 ページに表示するレコードの数を選択します。[行(Rows)] の値を大きくすると、GUI の応答時間が遅くなる可能性があります。別のログ レコード クラスをクリックすると、[行(Rows)] の値はデフォルトの 10 にリセットされます。
[アクション(Actions)] メニューでは、次のアクションを実行できます。
-
[すべてダウンロード(Download All)]:選択したクラスのすべてのレコードをローカル システムにダウンロードします。指定した時間範囲とフィルタは無視されます。レコードは XML または JSON ファイルとしてダウンロードできます。
タブからログ レコード オブジェクトを表示している場合は、行の右端にある 3 つのドットをクリックして、その特定のレコードで追加のアクションを実行できます。 イベント レコードの場合、可能なアクションは次のとおりです。
-
[シビラティ(重大度)の変更(Change Severity)]:イベントのシビラティ(重大度)を選択するシビラティ(重大度)に変更します。同じイベント コードを持つすべての新しいイベントにも、選択したシビラティ(重大度)が適用されます。同じイベント コードを持つ他のすべての既存のイベントのシビラティ(重大度)は変更されません。
-
[イベントを無視(Ignore Event)]:イベントは表示されなくなり、同じイベント コードを持つすべての新しいイベントは表示されません。同じイベント コードを持つ他のすべての既存のイベントは引き続き表示されます。
-
[Object Store Browser で開く(Open in Object Store Browser)]:Object Store Browser の特定のレコードを新しい Web ブラウザ タブで開きます。
-
[名前を付けて保存(Save As)]:特定のレコードをローカル システムにダウンロードします。レコードは XML または JSON ファイルとしてダウンロードできます。
他のすべてのログ レコード クラスの場合、可能なアクションは次のとおりです。
-
[Object Store Browser で開く(Open in Object Store Browser)]:Object Store Browser の特定のレコードを新しい Web ブラウザ タブで開きます。
-
[名前を付けて保存(Save As)]:特定のレコードをローカル システムにダウンロードします。レコードは XML または JSON ファイルとしてダウンロードできます。
Errors
APIC エラー メッセージは通常、APIC GUI および APIC CLI に表示されます。これらのエラー メッセージは、ユーザが実行している処理、あるいはユーザが設定または管理しているオブジェクトに固有のものです。これらのメッセージには次のようなものがあります。
-
Informational(情報提供)メッセージ。実行しているアクションのヘルプおよびヒントを提供します。
-
警告メッセージ。ユーザが構成または管理しているオブジェクト(ユーザーアカウントやサービスプロファイルなど)に関連するシステムエラーの情報を提供します。
-
Finite State Machine(FSM)のステータスメッセージ。FSM 段階のステータスに関する情報を提供します。
多くのエラー メッセージには、1 つまたは複数の変数が含まれます。これらの変数を置き換えるために APIC が使用する情報は、メッセージのコンテキストによって決まります。一部のメッセージは、複数のタイプのエラーによって生成される場合があります。