简介
本文档介绍补救ACI故障F3274的后续步骤:fabric-encap-mismatch。
背景信息
此特定故障将检查VPC对等节点之间的封装VLAN VNID不匹配情况,因为这始终是一个问题。
对于非VPC节点,您预期会在整个ACI交换矩阵中重复使用VLAN,这最终将决定给定VLAN的非VPC节点之间的VNID不匹配是否会导致数据路径/环路问题。非VPC节点VNID验证不属于故障F3274的范围。
"Code" : "F3274",
"Description" : "VNID mismatch between peers detected for encap vlans (<vlanId>).",
"Dn" : "topology/pod-1/node-<leafNodeId>/sys/vpc/inst/dom-<domainId>/if-<ifId>/fault-F3274",
Intersight Connected ACI交换矩阵
此故障作为主动ACI活动的一部分进行主动监控。
如果您有与Intersight连接的ACI交换矩阵,则会代表您生成服务请求,以指明在Intersight连接的ACI交换矩阵中找到了此故障的实例。
快速入门视频
视频:地址ACI故障代码F3274:fabric-encap-mismatch
解决故障的快速入门
- 将ACI升级前验证脚本复制到标记此故障的ACI交换矩阵内的APIC
- 运行脚本
- 查找“重叠VLAN池”检查结果,以确定发现哪些EPG包含多个与不同但重叠的VLAN池相关的域
- 根据输出,规划中断窗口1以解决与每个已识别EPG上不同但重叠的VLAN池配置相关的多个域
- 在中断窗口时,更新与突出显示EPG上的重叠VLAN池配置相关联的访问策略。可通过以下任何一种方法获得更正的配置:
- 方法1 — 每个已识别的EPG的域都与一个包含不同VLAN集的不同VLAN池相关,重叠已删除
- 方法2 — 每个已识别的EPG的域已收敛到在非重叠VLAN上收敛的VLAN池
- 方法3 — 每个已识别的EPG及其关联域收敛到具有所有所需VLAN的单个域
- 如果访问策略更正导致交换机不再具有对给定VLAN池的引用,则会使用新的Fabric Encap自动从其余VLAN池重新部署VLAN。重新编程VLAN时,会短暂中断。否则,必须手动重新部署VLAN2以分配新的VXLAN ID。
1重新部署VLAN时会出现短暂的中断。
2重新部署VLAN声明配置时,会对VLAN进行重新编程;静态端口绑定、vmm域分配或AEP EPG绑定。这会导致在VLAN完成重新部署之前中断。如果需要在给定枝叶节点上重新编程大量绑定,则可以在纠正访问策略后,通过清空重新加载有问题的交换机,对所有VLAN重新编程。当您在重新加载前发出“acidiag touch clean”命令时,将执行全新重新加载。
ACI升级前验证脚本示例
在APIC上运行ACI升级前验证脚本时,在“重叠VLAN池”检查下标记已识别的EPG:
示例输出:
[Check 29/36] Overlapping VLAN Pools... FAIL - OUTAGE WARNING!!
Tenant AP EPG VLAN Pool (Domain) 1 VLAN Pool (Domain) 2
------ -- --- -------------------- --------------------
MY_T AP1 EPG1-1 VLAN_POOL_1 (DOM_1) VLAN_POOL_2 (DOM_2)
Reference Document: "Overlapping VLAN Pool" from from Pre-Upgrade Check Lists
[Check 30/37] VNID Mismatch... FAIL - OUTAGE WARNING!!
EPG Access Encap Node ID Fabric Encap
--- ------------ ------- ------------
uni/tn-MY_T/ap-AP1/epg-EPG1-1 vlan-768 101 vxlan-8660
uni/tn-MY_T/ap-AP1/epg-EPG1-1 vlan-768 103 vxlan-8492
Recommended Action: Remove any domains with overlapping VLAN Pools from above EPGs, then redeploy VLAN
Reference Document: "Overlapping VLAN Pool" from Pre-Upgrade Check Lists
根据示例输出,EPG EPG1-1必须同时评估DOM_1和DOM_2域,以确定VLAN_POOL_1和VLAN_POOL_2中的哪些VLAN块包含重叠和原因。
其他详细信息
请注意,此特定条件记录在思科APIC安装和ACI升级和降级指南中:Overlapping VLAN Pool部分。
由于此故障中概述的情况可能导致升级后出现数据路径问题,识别重叠的VLAN池的逻辑已经存在于当前在github上可用的ACI升级前验证脚本中。
交换矩阵封装不匹配导致的问题
如果ACI交换矩阵具有从VLAN块重叠衍生的交换矩阵封装不匹配,则可能会导致:
-
由于终端学习中的问题导致丢包
-
BPDU转发域不匹配导致生成树环路
在升级或全新重新加载受影响交换机之前,这些问题可能并不明显。枝叶交换机在升级或全新重新加载后从APIC获取策略,并且可能应用或不应用之前使用的同一池中的相同VLAN ID。因此,与其他交换机节点相比,VLAN ID可以映射到不同的VXLAN VNID。此问题的补救可消除VLAN重新编程事件中涉及的不确定性。
未来防御
确保交换矩阵中不存在重叠的VLAN池至关重要,除非这是为不同客户重复使用VLAN的有意设计选择。此类设计需要本文档未列出的其他配置注意事项。如果不确定,请考虑APIC GUI中 > > 下的“实施EPG VLAN验证”设置。在版本3.2(6)及更高版本中,此设置可防止最常见的问题配置:两个具有重叠的VLAN池的域关联到同一EPG。
相关信息
这些文档包含有关重叠VLAN池的其他信息、出现问题的原因以及发生此情况的方式: