簡介
本文檔介紹ACI故障F3545/F3544以及幫助緩解此問題的可能步驟。
F3545:合約政策CAM程式設計
當交換機由於硬體或軟體程式設計故障而無法啟用合約規則(分割槽規則)時,就會發生F3545故障。如果您看到這種情況,是因為策略內容可定址記憶體(CAM)已滿,無法在交換機上部署更多合約,並且可以在重新引導或升級後部署另一組合約。
這可能導致在升級之前工作的服務在升級或交換機全新重新載入後開始失敗。
請注意,由於其他原因(例如合約中不受支援的過濾器型別而不是策略CAM使用),也會發生相同的故障。例如,第一代ACI交換機支援EtherType IP,但不支援合約過濾器中的IPv4或IPv6。
存在此故障時,請檢查APIC GUI中的Operations > Capacity Dashboard > Leaf Capacity,瞭解策略CAM的使用情況。您也可以在枝葉上執行此命令,以便獲取當前策略計數。
vsh_lc -c "show plat internal hal health-stats" | grep -A 7 "Policy stats"
您也可以在任何APIC的CLI上運行moquery (moquery -c faultInst -f 'fault.Inst.code=="F3545"'),以檢查系統中是否存在這些故障。這些故障在GUI中也可以看到。
故障示例(F3545:分割槽規則程式設計失敗)
下一個輸出顯示節點101的示例,其中266個合約規則(zoneRuleFailed)的程式設計失敗。雖然它也顯示changeSet中L3Out子網(pfxRuleFailed)的程式設計故障,但是會引發另一個故障F3544。
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3545"'
Total Objects shown: 1
# fault.Inst
code : F3545
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.256-05:00
delegated : no
descr : 266 number of Rules failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3545
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3545
rule : actrl-stats-report-zone-rule-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
F3544:合約的L3Out子網程式設計(F3544)
當交換機由於硬體或軟體程式設計故障而無法啟用條目以將字首對映到pcTag時,就會發生F3544故障。
在L3Out中的外部EPG下,為L3Out子網配置這些條目具有「外部EPG的外部子網」範圍,用於將L3Out子網對映到L3Out EPG。
如果由於交換機上的LPM或主機路由容量而看到此消息,則此類交換機可以在重新引導或升級後啟用不同的條目集。
這可能會導致服務在升級失敗之前在啟動升級之後或在重新載入交換機後正常工作。
存在此故障時,請檢查APIC GUI中的Operations > Capacity Dashboard > Leaf Capacity以瞭解LPM和/32或/128路由使用情況。
您也可以在枝葉上執行此命令,以便獲取當前策略計數:
vsh_lc -c "show plat internal hal health-stats" | grep -A 55 "L3 stats"
您可以在任何APIC的CLI上運行moquery (moquery -c faultInst -f 'fault.Inst.code=="F3544"')以檢查系統中是否存在這些故障。這些故障在GUI中也可以看到。
故障示例(F3544: L3Out子網程式設計故障)
下一個輸出顯示節點101的示例,其中80個L3Out子網帶有「外部EPG的外部子網」(pfxRuleFailed),且程式設計失敗。雖然它也顯示changeSet中合約本身(zoneRuleFailed)的程式設計失敗,但是會引發另一個錯誤F3545。
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3544"'
Total Objects shown: 1
# fault.Inst
code : F3544
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.246-05:00
delegated : no
descr : 80 number of Prefix failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3544
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3544
rule : actrl-stats-report-pre-fix-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
如何排除故障?
1. 驗證操作容量控制台上的策略CAM使用情況/LPM或使用枝葉CLIvsh_lc -c "show plat internal hal health-stats"。
2. 檢查經驗證的可擴充性指南(google經驗證的可擴充性指南ACI),以便檢查版本和平台支援的限制。
3. 刪除應用於EPG的未使用合約和過濾器。
4. 收集包括枝葉交換機的按需技術支援,以供TAC進一步分析。
升級前檢查
升級前驗證程式指令碼會標籤故障F3545和F3544,以便在升級前未解決故障時提醒使用者此影響。
有關升級前指令碼的詳細資訊,請參閱以下章節:
https://www.cisco.com/c/en/us/td/docs/dcn/aci/apic/all/apic-installation-aci-upgrade-downgrade/Cisco-APIC-Installation-ACI-Upgrade-Downgrade-Guide/m-pre-upgrade-checklists.html?bookSearch=true#Cisco_Concept.dita_1f674dd5-9ea2-4062-826b-f3c1550552dc。