グローバル障害ポリシー
グローバル障害ポリシーは、障害がクリアされた日時、フラッピング間隔(障害発生とクリア状態の間の時間)、および保持間隔(システムで障害が発生していた時間)など、Cisco UCS ドメイン 内の障害のライフサイクルを制御します。
Cisco UCS の障害には次のライフサイクルがあります。
-
ある状況がシステムで発生し、Cisco UCS Manager で障害が発生します。これはアクティブな状態です。
-
障害が軽減されると、フラッピングまたはフラッピングを防ぐことを目的としたソーキング間隔になります。障害が発生し、すぐに何度かクリアされると、フラッピングが発生します。フラッピング間隔の間、グローバル障害ポリシーに指定されている期間は、障害の重要度が保持されます。
-
フラッピング間隔中に同じ条件が再発生した場合は、障害がアクティブ状態に戻ります。フラッピング間隔中に同じ条件が再発生しない場合は、障害がクリアされます。
-
クリアされた障害は保持期間になります。この期間があるため、障害が発生した状態が改善され、さらに障害が早々に削除されていない場合でも管理者が障害に気付くことができます。保持期間のうち、グローバル障害ポリシーに指定された期間はクリアされた障害が保持されます。
-
この状況が保持間隔中に再発生する場合は、障害がアクティブ状態に戻ります。この状況が再発生しない場合は、障害が削除されます。
Configuring the Fault Collection Policy
SUMMARY STEPS
- UCS-A# scope monitoring
- UCS-A /monitoring # scope fault policy
- UCS-A /monitoring/fault-policy # set clear-action {delete | retain}
- UCS-A /monitoring/fault-policy # set flap-interval seconds
- UCS-A /monitoring/fault-policy # set retention-interval {days hours minutes seconds | forever}
- UCS-A /monitoring/fault-policy # commit-buffer
DETAILED STEPS
Command or Action | Purpose | |
---|---|---|
Step 1 |
UCS-A# scope monitoring |
Enters monitoring mode. |
Step 2 |
UCS-A /monitoring # scope fault policy |
Enters monitoring fault policy mode. |
Step 3 |
UCS-A /monitoring/fault-policy # set clear-action {delete | retain} |
Specifies whether to retain or delete all cleared messages. If the retain option is specified, then the length of time that the messages are retained is determined by the set retention-interval command. |
Step 4 |
UCS-A /monitoring/fault-policy # set flap-interval seconds |
Specifies the time interval (in seconds) the system waits before changing a fault state. Flapping occurs when a fault is raised and cleared several times in rapid succession. To prevent this, the system does not allow a fault to change state until the flapping interval has elapsed after the last state change. If the fault is raised again during the flapping interval, it returns to the active state, otherwise, the fault is cleared. |
Step 5 |
UCS-A /monitoring/fault-policy # set retention-interval {days hours minutes seconds | forever} |
Specifies the time interval the system retains all cleared fault messages before deleting them. The system can retain cleared fault messages forever, or for the specified number of days, hours, minutes, and seconds. |
Step 6 |
UCS-A /monitoring/fault-policy # commit-buffer |
Commits the transaction. |
Example
This example configures the fault collection policy to retain cleared fault messages for 30 days, sets the flapping interval to 10 seconds, and commits the transaction.
UCS-A# scope monitoring
UCS-A /monitoring # scope fault policy
UCS-A /monitoring/fault-policy # set clear-action retain
UCS-A /monitoring/fault-policy* # set flap-interval 10
UCS-A /monitoring/fault-policy* # set retention-interval 30 0 0 0
UCS-A /monitoring/fault-policy* # commit-buffer
UCS-A /monitoring/fault-policy #