はじめに
このドキュメントでは、ACI障害F3696 coop-ep-dampeningおよび修復手順について説明します。
背景説明
この特定の障害は、COOPエンドポイントダンプニング機能が原因でEPが「フリーズ」状態になるとトリガーされます。EPは一貫した移動動作を持つことが判明すると「フリーズ」状態になり、短時間でCOOPに複数の更新が行われます。
COOP EPダンプニングはCOOPプロセスの保護メカニズムであり、EPが発生した理由の特定にも役立ちます。
COOP EPダンプニングは、Cisco Application Policy Infrastructure Controller(APIC)リリース4.2(3)で導入され、デフォルトで有効になっています。
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
注:この障害の特性および関連するバーンダウンタイマーにより、障害がトリガーされ、自動的にクリアされる可能性があります。
Intersight接続ACIファブリック
このエラーは、プロアクティブACIエンゲージメントの一部としてアクティブに監視されます。
Intersightに接続されたACIファブリックがある場合、お客様に代わってサービスリクエストが生成され、このエラーのインスタンスがお客様のIntersightに接続されたACIファブリック内で検出されたことが示されました。
COOPエンドポイントダンプニング
Council of Oracle Protocol(COOP)は、エンドポイント(EP)マッピング情報(ロケーションおよびアイデンティティ)をスパインプロキシに伝えるために使用されます。リーフスイッチは、エンドポイントアドレス情報をCOOP経由でスパインスイッチに転送します。これにより、すべてのスパインノードが、エンドポイントアドレスおよびロケーション情報の一貫したコピーを維持できます。
インターフェイス間やデバイス間などでEPが一貫して移動すると、スパインに向けてエンドポイントが絶えず更新され、COOPデータベースが正確になります。進行中のエンドポイントの移動による更新のアグレッシブなボリュームは、COOPリソースの過剰使用を引き起こし、有効なエンドポイント更新の処理を妨げる可能性があります。
リーフスイッチの機能である不正エンドポイント検出は、移動が単一のリーフにスコープ設定されている限り、アグレッシブなEP更新がスパインスイッチに到達することを防止します。COOPを保護するために異なる保護メカニズムを必要とする他のEP移動シナリオ(クロスリーフEP移動など)もあります。ここで、COOPエンドポイントダンプニングが機能します。
EP移動の状況でCOOPへの圧力を緩和するために、スパインスイッチはすべてのリーフスイッチに対して、指定した期間、フラグが設定されたエンドポイントからの更新を無視するように要求します。これが発生すると、このようなエンドポイントのダンプニング状態が「フリーズ」し、障害F3696が生成されます。
ペナルティ値としきい値の詳細は、『設定ガイドのリンク、例4.2』に記載されています。
この機能の最新バージョンについては、バージョン固有の設定ガイドのリンクを参照してください。
注:不正EP制御やEPループ保護など、その他の積極的なEPアップデート保護機能は、明示的に有効にする必要があります。 これらの機能の詳細については、『ACIファブリックエンドポイントラーニングホワイトペーパー』を参照してください。
EPフリーズの考えられる原因
フィールドでこの動作が発生する一般的なシナリオは次の2つです。
- 単一の論理リンク(vPC)設定ではなく、アクティブ – アクティブを使用する2つの個別のリーフ接続を持つサーバ
- ダウンストリームネットワークデバイス上のループ
迅速な問題解決
- 「フリーズ」状態になったエンドポイントを特定します。
- (オプション)データプレーンへの影響が確認された場合は、一時的な影響を解決するために、フリーズしたEPをクリアします。
- EPが移動した理由と、それがネットワーク設計に必要であり、必要であるかどうかを特定して理解します。
- 不要な場合は、EP移動の原因となった基本条件に対処するアクションを実行します。
- 問題の動作がネットワーク設計に必要であり、必要な場合は、COOP EP Dampeningを無効にすることを検討してください。
注: COOP EPダンプニングは、COOPプロセスの保護メカニズムです。一般に、可能な限り不要なEP移動を軽減する措置を講じることが望ましい。
障害に対処するための詳細な手順
フリーズした端点を識別
スパインノードまたはリーフノードで減衰したすべてのエンドポイントを表示するには、このスイッチのCLI手順を使用します。
- スパインまたはリーフスイッチCLIにログインし、コマンドswitch# show coop internal info repo ep dampeningを入力します。
(オプション)フリーズした端点をクリア
GUI の使用
GUIを使用して実行すると、選択したノード上のすべてのフリーズされたEPがクリアされます。 この操作は、フリーズしたエンドポイントのソースリーフスイッチだけでなく、すべてのスパインスイッチでも実行する必要があります。
- メニューバーで、Fabric > Inventoryの順にクリックします。
- ナビゲーションペインで、ポッドとスパインまたはリーフノードを展開します。
- ノードを右クリックして、Clear Dampened Endpointsを選択します。
- Yesをクリックして、操作を確定します。
注:問題のEPがまだリーフスイッチのエンドポイントテーブルにある場合、エンドポイントはスパインスイッチのCOOPデータベースにパブリッシュされます。そうでない場合、減衰されたエンドポイントは2分後にスパインスイッチのCOOPデータベースから削除されます。
スイッチCLIの使用
スイッチCLIを介して実行される場合、この手順で一度にクリアされるエンドポイントは1つだけです。この操作は、すべてのスパインスイッチとエンドポイントのソースリーフスイッチで実行する必要があります。
- スパインスイッチまたはリーフスイッチのCLIにログインし、次のコマンドを入力します。 switch# clear coop internal info repo ep dampening key <bd_vnid> <mac>
注:問題のEPがまだリーフスイッチのエンドポイントテーブルにある場合、エンドポイントはスパインスイッチのCOOPデータベースにパブリッシュされます。そうでない場合、減衰されたエンドポイントは2分後にスパインスイッチのCOOPデータベースから削除されます。
COOP EPダンプニングの無効化
一般に、これは推奨されません。ただし、ネットワーク設計で問題のEP移動が必要であることが判明した場合は、COOP EPダンプニングを無効にすることができます。
disableEpDampening="true"を指定した/api/policymgr/mo/.xmlへのHTTP POSTは、COOP EPダンプニングを無効にします。
COOP EPダンプニングは、同じ要求でdisableEpDampening="false"を設定することで再度有効にできます。
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
APIC CLIの使用
APIC CLIで、icurlコマンドを使用して、必要なHTTP POSTを実行できます。
COOP EPダンプニングの無効化:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
COOP EPダンプニングが無効になっていることを確認します。
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
その他の詳細事項
COOP EPダンプニング – DampFactorのカスタマイズ
5.2.4d以降のリリースでは、dampFactorを変更してCOOP EPダンプニング機能に関連する特定の値を増やすことができます。
EPの特定のレベルの移動がデフォルトのしきい値の範囲外になることが予想され、COOP EPダンプニングを無効にしないシナリオでは、DampFactorを変更することを検討してください。
ダンプペナルティに関連するしきい値は3つあり、これらは並行して機能します。DampFactorを変更すると、次の3つの値がすべて変更されます。
しきい値名 |
説明 |
デフォルト値 |
dampReuseThreshold |
EPが「フリーズ」状態から通常状態に戻るときのしきい値を再利用 |
2500 |
dampSatThresh |
湿り気の彩度のしきい値。EPがこのペナルティ値を超えると、「フリーズ」状態になります |
10,000 |
湿り気 |
重大な状態のしきい値。EPがしきい値を10分間上回った場合、「フリーズ」状態になります |
4000 |
デフォルトのDampFactorは1に設定されています。dampFactorは1 ~ 5の値に変更できます。
COOP EP DampFactorの変更
APICで次の投稿を使用して、ダンプ係数を4倍の値に変更できます。
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
修正されたしきい値は、coopRepPクラスをチェックすることで、リポジトリごとにスパインごとに検証できます。
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000