简介
本文档介绍ACI故障F3696 coop-ep-dampening和补救步骤。
背景信息
当EP由于COOP终端阻尼功能而进入“冻结”状态时,会触发此特定故障。如果发现终端具有一致的移动行为,则会进入“冻结”状态,从而导致在短时间内对COOP进行多次更新。
COOP EP阻尼是COOP过程保护机制,也有助于确定EP的原因。
在思科应用策略基础设施控制器(APIC)版本4.2(3)中引入并默认启用COOP EP惩罚。
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
注意:此故障的性质以及关联的燃尽计时器可能导致触发故障,然后自行清除。
Intersight互联ACI交换矩阵
此故障作为主动ACI活动的一部分主动进行监控。
如果您有Intersight连接的ACI交换矩阵,则会代表您生成服务请求,以指明在Intersight连接的ACI交换矩阵中找到此故障的实例。
COOP终端惩罚
Oracle Council of Oracle Protocol (COOP)用于将终端(EP)映射信息(位置和身份)传送到主干代理。枝叶交换机通过COOP将终端地址信息转发至主干交换机,然后确保所有主干节点保持终端地址和位置信息的一致副本。
一致的EP移动(例如跨接口或设备)会导致持续向主干更新终端,以确保COOP数据库准确。由于正在进行的终端移动,更新量过大可能会导致COOP资源过度利用,从而阻止有效终端更新的处理。
枝叶交换机的欺诈终端检测功能可防止主动EP更新到达主干交换机(只要移动范围是单个枝叶)。也有其他的EP移动场景,例如跨叶EP移动,需要不同的保护机制来保护COOP。这就是COOP终端阻尼发挥作用的地方。
为减轻EP移动情况下的COOP压力,主干交换机要求所有枝叶交换机在指定时间段内忽略来自已标记终端的更新。发生这种情况时,任何此类终端的阻尼状态为“冻结”,并生成故障F3696。
有关惩罚值和阈值的详细信息,请参阅配置指南链接(示例4.2配置指南链接)。
有关此功能的最新信息,请参阅特定版本的配置指南链接。
注意:必须明确启用其他主动EP更新保护功能,如恶意EP控制和EP环路保护。 有关这些功能的详细信息,请参阅ACI交换矩阵终端学习白皮书。
EP冻结的可能原因
在现场导致此行为的两个典型场景是:
- 具有2个独立枝叶连接的服务器,使用主用-主用配置,而不是单个逻辑链路(vPC)配置
- 下游网络设备上的环路
快速入门,解决故障
- 确定哪些终端进入“冻结”状态。
- (可选)如果注意到数据平面影响,请清除冻结的EP以临时解决影响。
- 确定并了解EP移动的原因,以及您的网络设计中是否需要执行此步骤。
- 如果不需要,请采取行动解决导致EP移动的底层情况。
- 如果网络设计需要而且必须执行相关移动,请考虑禁用COOP EP Dampening。
注意:COOP EP阻尼是COOP过程的保护机制。一般而言,最好在可能的情况下采取减少不必要的EP移动的操作。
解决故障的详细步骤
识别冻结的终端
使用此交换机CLI程序查看主干或枝叶节点中的所有阻尼终端。
- 登录到主干或枝叶交换机CLI并输入命令switch# show coop internal info repo ep dampening
(可选)清除冻结端点
使用GUI
使用GUI执行时,此操作将清除所选节点上的所有冻结EP。 此操作必须在所有主干交换机以及冻结端点的源枝叶交换机上执行。
- 在菜单栏上单击Fabric > Inventory。
- 在Navigation窗格中,展开Pod和主干或枝叶节点。
- 右键单击节点并选择Clear Dampened Endpoints。
- 单击Yes确认操作。
注意:如果所涉EP仍位于枝叶交换机上的终端表中,则终端会发布到主干交换机COOP数据库。否则,阻尼终端将在两分钟后从主干交换机COOP数据库中删除。
通过交换机CLI
通过交换机CLI执行时,此过程一次仅清除一个终端。此操作必须在终端的所有主干交换机和源枝叶交换机上执行。
- 登录到主干或枝叶交换机CLI并输入命令: switch# clear coop internal info repo ep dampening key <bd_vnid> <mac>
注意:如果所涉EP仍位于枝叶交换机上的终端表中,则终端会发布到主干交换机COOP数据库。否则,阻尼终端将在两分钟后从主干交换机COOP数据库中删除。
禁用COOP EP惩罚
通常,不建议这样做。但是,如果您发现网络设计需要相关的EP移动,则可以禁用COOP EP惩罚。
对/api/policymgr/mo/.xml执行disableEpDampening="true"的HTTP POST会禁用COOP EP惩罚。
可以使用同一请求通过设置disableEpDampening="false"重新启用COOP EP惩罚。
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
使用APIC CLI
在APIC CLI中,icurl命令可用于实现所需的HTTP POST。
禁用COOP EP惩罚:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
验证COOP EP阻尼已禁用:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
其他详细信息
COOP EP Dampening - DamgFactor定制
在5.2.4d及更高版本中,可以修改damnFactor以增加与COOP EP阻尼功能相关的特定值。
请考虑为需要超出默认阈值的一定EP移动水平且不想禁用COOP EP阻尼的情况修改DampingFactor。
有3个阈值与阻尼惩罚相关,它们串联工作。更改DamnFactor时,将修改以下所有3个值:
阈值名称 |
描述 |
默认值 |
threshReuseThresh |
当EP从“冻结”状态返回正常状态时,重新使用阈值 |
2500 |
threshSat |
阻尼饱和度阈值。当EP超过此惩罚值时,它将被置于“冻结”状态 |
10000 |
thresh |
严重状态阈值。如果EP在阈值以上保持10分钟,则将其置于“冻结”状态 |
4000 |
默认的DamnFactor设置为1。可以将damnFactor修改为介于1和5之间的值。
修改COOP EP DamnFactor
要将阻尼系数更改为值的4倍,可以在APIC上使用此公告:
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
通过检查coopRepP类,可验证修改后的阈值(每个主干的每个回购):
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000