簡介
本文檔介紹ACI故障F3696 coop-ep-dampening和補救步驟。
背景資訊
當EP由於COOP端點抑制功能而進入「凍結」狀態時,會觸發此特定故障。當發現環保部門具有一致的移動行為時,它們被置於「凍結」狀態,導致在較短時間間隔內多次更新COOP。
COOP EP dampening是COOP過程保護機制,也有助於辨識為什麼使用EP。
COOP EP抑制在思科應用策略基礎設施控制器(APIC)版本4.2(3)中引入,並且預設啟用。
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
注意:此故障的本質和相關燃盡計時器可能導致故障觸發,然後自行清除。
Intersight連線ACI網狀架構
此故障作為主動ACI活動的一部分受到主動監控。
如果您擁有Intersight連線的ACI交換矩陣,則會代表您生成一個服務請求,以指明在您的Intersight連線的ACI交換矩陣中找到此故障的例項。
COOP端點懲罰
Oracle協定委員會(COOP)用於將終端(EP)對映資訊(位置和身份)與主幹代理通訊。枝葉交換機透過COOP將終端地址資訊轉發到主幹交換機,然後確保所有主幹節點都維護終端地址和位置資訊的一致副本。
一致的EP移動(例如跨介面或裝置)會導致持續向主幹更新端點,以確保COOP資料庫準確。由於正在進行的終端移動,更新量過大可能會導致COOP資源過度使用,從而阻止有效終端更新的處理。
Rogue Endpoint Detection是枝葉交換機的一項功能,只要將移動範圍限定在單個枝葉上,即可防止主動的EP更新到達主幹交換機。還有其它環保運動場景,如跨葉環保運動,需要不同的保護機制來保護COOP。這就是COOP端點抑制的用武之地。
為減輕EP移動情況下的COOP壓力,主幹交換機要求所有枝葉交換機在指定時間段內忽略來自已標籤終端的更新。當發生這種情況時,任何此類端點的阻尼狀態為「凍結」,並生成故障F3696。
有關罰款值和閾值的詳細資訊,請參閱配置指南連結,示例4.2配置指南連結。
請參閱版本特定的配置指南連結瞭解關於此功能的最新資訊。
註:必須明確啟用其他主動EP更新保護功能,如惡意EP控制和EP環路保護。 有關這些功能的更多詳細資訊,請參閱ACI交換矩陣終端學習白皮書。
EP凍結的可能原因
在欄位中導致此行為的2個典型場景是:
- 具有2個獨立枝葉連線的伺服器,使用主用-主用配置,而不是單個邏輯鏈路(vPC)配置
- 下游網路裝置上的環路
快速入門解決故障
- 確定哪些終端進入「凍結」狀態。
- (可選)如果注意到資料平面影響,請清除凍結的EP以進行臨時影響解決。
- 確定並瞭解EP移動的原因,以及網路設計中是否應該這樣做以及是否需要這樣做。
- 如果不需要,請採取措施解決導致EP移動的底層情況。
- 如果網路設計需要或必須執行上述操作,請考慮停用COOP EP Dampening。
注意:「COOP EP懲罰」是COOP處理的保護機制。一般而言,最好在可能的情況下採取減少不必要的EP移動的動作。
解決故障的詳細步驟
辨識凍結端點
使用此交換機CLI過程檢視主幹或枝葉節點中的所有受抑制端點。
- 登入到主幹或枝葉交換機CLI並輸入命令switch# show coop internal info repo ep dampening
(可選)清除凍結端點
使用GUI
當使用GUI執行時,此操作將清除選定節點上所有凍結的EP。 此操作必須在所有主幹交換機以及凍結端點的源枝葉交換機上執行。
- 在選單欄上,按一下Fabric > Inventory。
- 在Navigation窗格中,展開Pod和主幹或枝葉節點。
- 按一下右鍵節點並選擇Clear Dampened Endpoints。
- 按一下Yes確認該操作。
註:如果所討論的EP仍然位於枝葉交換機的終端表中,則終端將發佈到主幹交換機COOP資料庫。否則,在兩分鐘後從主幹交換機COOP資料庫中刪除阻尼端點。
透過交換機CLI
透過交換機CLI執行時,此過程一次只能清除單個終端。此操作必須在終端的所有主幹交換機和源枝葉交換機上執行。
- 登入到主幹或枝葉交換機CLI並輸入命令: switch# clear coop internal info repo ep dampening key <bd_vnid> <mac>
註:如果所討論的EP仍然位於枝葉交換機的終端表中,則終端將發佈到主幹交換機COOP資料庫。否則,在兩分鐘後從主幹交換機COOP資料庫中刪除阻尼端點。
停用COOP EP懲罰
一般不建議這樣做。但是,如果您發現您的網路設計需要EP移動,則可以停用COOP EP懲罰。
/api/policymgr/mo/.xml的HTTP POST(如果使用disableEpDampening="true")將停用COOP EP懲罰。
可以透過相同的請求透過設定disableEpDampening="false"重新啟用COOP EP懲罰。
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
使用APIC CLI
在APIC CLI上,icurl命令有助於實現所需的HTTP POST。
停用COOP EP懲罰:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
驗證是否已停用COOP EP懲罰:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
其他詳細資料
COOP EP Dampening - DamnFactor定製
在5.2.4d和更新版本中,可以修改damnFactor以增加與COOP EP阻尼功能相關的特定值。
考慮修改DamnFactor,以處理EP移動達到特定水準時超出預設臨界值的情形,並且您不想停用COOP EP懲罰。
有3個閾值與阻尼罰分相關,它們協同工作。變更DamnFactor時,會修改以上所有3個值:
閾值名稱 |
說明 |
預設值 |
阻尼重用閾值 |
當EP從「凍結」狀態返回正常狀態時,重新使用閾值 |
2500 |
threshSatThresh |
濕飽和度閾值。當EP超過此罰款值時,它將被置於「凍結」狀態 |
10000 |
阻尼閾值 |
嚴重狀態閾值。如果EP高於閾值10分鐘,則進入「凍結」狀態 |
4000 |
預設的DamnFactor設定為1。可以將damnFactor修改為1到5之間的值。
修改COOP EP DamnFactor
若要將阻尼係數更改為值的4倍,您可以在APIC上使用此帖子:
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
透過檢查coopRepP類,可以驗證每個回放的主幹所修改的閾值:
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000