소개
이 문서에서는 ACI 결함 F3545/F3544 및 문제를 완화하는 데 도움이 되는 가능한 단계에 대해 설명합니다.
F3545: 계약에 대한 정책 CAM 프로그래밍
결함 F3545는 하드웨어 또는 소프트웨어 프로그래밍 장애로 인해 스위치가 계약 규칙(zoning rule)을 활성화하지 못할 때 발생합니다. 이 경우 정책 CAM(Content Addressable Memory)이 꽉 차서 스위치에서 더 이상 계약을 구축할 수 없으며 재부팅 또는 업그레이드 후 다른 계약 집합을 구축할 수 있기 때문입니다.
이로 인해 업그레이드 또는 스위치 정상 다시 로드 후 업그레이드가 실패하기 전에 작동하던 서비스가 실패할 수 있습니다.
동일한 결함은 정책 CAM 사용 대신 계약에 지원되지 않는 유형의 필터가 있는 경우와 같은 다른 이유로 발생할 수 있습니다. 예를 들어 1세대 ACI 스위치는 EtherType IP를 지원하지만 계약 필터에서는 IPv4 또는 IPv6를 지원하지 않습니다.
이 결함이 있는 경우, APIC GUI에서Operations > Capacity Dashboard > Leaf Capacity 정책 CAM 사용을 확인합니다. 현재 정책 카운트를 가져오기 위해 leaf에서 이 명령을 실행할 수도 있습니다.
vsh_lc -c "show plat internal hal health-stats" | grep -A 7 "Policy stats"
또한 APIC의 CLI에서 moquery(moquery -c faultInst -f 'fault.Inst.code=="F3545")를 실행하여 시스템에 이러한 결함이 있는지 확인할 수 있습니다. GUI 내에서도 fault가 표시됩니다.
결함 예(F3545: 조닝 규칙 프로그래밍 실패)
다음 출력은 266개의 계약 규칙(zoneRuleFailed)에 대한 프로그래밍 오류가 있는 노드 101의 예를 보여줍니다. 또한 changeSet에서 L3Out 서브넷(pfxRuleFailed)의 프로그래밍 실패도 표시되지만, 이를 위해 별도의 결함 F3544가 제기됩니다.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3545"'
Total Objects shown: 1
# fault.Inst
code : F3545
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.256-05:00
delegated : no
descr : 266 number of Rules failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3545
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3545
rule : actrl-stats-report-zone-rule-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
F3544: 계약에 대한 L3Out 서브넷 프로그래밍(F3544)
결함 F3544는 하드웨어 또는 소프트웨어 프로그래밍 오류로 인해 스위치에서 pcTag에 접두사를 매핑하기 위한 항목을 활성화하지 못할 때 발생합니다.
이러한 항목은 L3Out의 외부 EPG 아래에 있는 '외부 EPG용 외부 서브넷' 범위가 있는 L3Out 서브넷에 대해 구성되며 L3Out 서브넷을 L3Out EPG에 매핑하는 데 사용됩니다.
스위치의 LPM 또는 호스트 라우트 용량 때문에 이 문제가 발생하는 경우, 그러한 스위치는 재부팅 또는 업그레이드 후에 다른 항목 집합을 활성화할 수 있습니다.
이로 인해 업그레이드가 시작되고 나면 업그레이드가 실패하기 전에 또는 스위치를 완전히 다시 로드한 후에 작동하는 서비스가 생성될 수 있습니다.
이 결함이 있는 경우, APIC GUI에서Operations > Capacity Dashboard > Leaf Capacity LPM 및 /32 또는 /128 경로 사용을 확인합니다.
현재 정책 카운트를 가져오려면 leaf에서 이 명령을 실행할 수도 있습니다.
vsh_lc -c "show plat internal hal health-stats" | grep -A 55 "L3 stats"
APIC의 CLI에서 moquery(moquery -c faultInst -f 'fault.Inst.code=="F3544")를 실행하여 시스템에 이러한 결함이 있는지 확인할 수 있습니다. GUI 내에서도 fault가 표시됩니다.
결함 예(F3544: L3Out 서브넷 프로그래밍 실패)
다음 출력은 '외부 EPG를 위한 외부 서브넷'(pfxRuleFailed)이 있는 80개의 L3Out 서브넷에 대한 프로그래밍 오류가 있는 노드 101의 예를 보여줍니다. 또한 changeSet에서 계약 자체의 프로그래밍 실패(zoneRuleFailed)도 표시되지만, 이에 대한 별도의 결함 F3545가 제기됩니다.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3544"'
Total Objects shown: 1
# fault.Inst
code : F3544
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.246-05:00
delegated : no
descr : 80 number of Prefix failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3544
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3544
rule : actrl-stats-report-pre-fix-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
결함을 해결하는 방법
참고: 이 상태에서는 스위치를 다시 로드하지 마십시오.
1. Operations Capacity Dashboard(운영 용량 대시보드) 또는 leaf CLI를 사용하여 Policy CAM usage/LPM을 vsh_lc -c "show plat internal hal health-stats" 확인합니다.
2. 버전 및 플랫폼에 대해 지원되는 제한을 확인하려면 Verified Scalability Guide(Google Verified Scalability Guide ACI)를 참조하십시오.
3. EPG에 적용된 미사용 계약 및 필터를 제거합니다.
4. TAC의 추가 분석을 위해 리프 스위치가 포함된 주문형 기술 지원을 수집합니다.
업그레이드 전 확인
업그레이드 전에 fault가 해결되지 않을 경우 사용자에게 영향을 미치게 하기 위해 업그레이드 전 검증기 스크립트에서 fault F3545 및 F3544에 플래그를 지정합니다.
업그레이드 전 스크립트에 대한 자세한 내용은 다음과 같습니다.
https://www.cisco.com/c/en/us/td/docs/dcn/aci/apic/all/apic-installation-aci-upgrade-downgrade/Cisco-APIC-Installation-ACI-Upgrade-Downgrade-Guide/m-pre-upgrade-checklists.html?bookSearch=true#Cisco_Concept.dita_1f674dd5-9ea2-4062-826b-f3c1550552dc