Introduzione
Questo documento descrive gli errori ACI F3545/F3544 e le possibili misure da adottare per risolvere il problema.
F3545: Programmazione Policy CAM per contratti
L'errore F3545 si verifica quando lo switch non riesce ad attivare una regola di contratto (regola di zoning) a causa di un errore di programmazione hardware o software. Se ciò si verifica, è perché la policy Content Addressable Memory (CAM) è piena e non è possibile implementare altri contratti sullo switch, oltre a consentire l'implementazione di un diverso set di contratti dopo un riavvio o un aggiornamento.
Ciò può causare il malfunzionamento dei servizi che prima di un aggiornamento iniziavano a funzionare dopo un aggiornamento o un ricaricamento dello switch.
Si noti che lo stesso errore può verificarsi per altri motivi, ad esempio per un tipo di filtro non supportato nei contratti anziché per l'utilizzo della CAM dei criteri. Ad esempio, gli switch ACI di prima generazione supportano EtherType IP ma non IPv4 o IPv6 nei filtri dei contratti.
Quando il guasto è presente, controllare la GUIOperations > Capacity Dashboard > Leaf Capacity di APIC per l'utilizzo della CAM delle policy. È inoltre possibile eseguire questo comando sulla foglia per ottenere il conteggio dei criteri corrente.
vsh_lc -c "show plat internal hal health-stats" | grep -A 7 "Policy stats"
È inoltre possibile eseguire moquery (moquery -c faultInst -f 'fault.Inst.code="F3545"') sulla CLI di qualsiasi APIC per verificare se tali errori esistono nel sistema. I guasti sono visibili anche all'interno della GUI.
Esempio di errore (F3545: errore di programmazione della regola di zoning)
Nell'output successivo viene illustrato un esempio di nodo 101 con errore di programmazione per 266 regole di contratto (zoneRuleFailed). Sebbene mostri anche l'errore di programmazione delle subnet L3Out (pfxRuleFailed) in changeSet, per tale errore viene generato un errore separato F3544.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3545"'
Total Objects shown: 1
# fault.Inst
code : F3545
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.256-05:00
delegated : no
descr : 266 number of Rules failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3545
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3545
rule : actrl-stats-report-zone-rule-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
F3544: programmazione subnet L3Out per contratti (F3544)
L'errore F3544 si verifica quando lo switch non riesce ad attivare una voce per mappare un prefisso a pcTag a causa di un errore di programmazione hardware o software.
Queste voci sono configurate per le subnet L3Out con ambito 'Subnet esterne per EPG esterno' in un EPG esterno in un EPG L3Out e utilizzate per mappare le subnet L3Out agli EPG L3Out.
Se ciò si verifica a causa della capacità dei percorsi LPM o host sullo switch, quest'ultimo può attivare diversi gruppi di voci dopo un riavvio o un aggiornamento.
Ciò può causare un errore dei servizi che funzionavano prima dell'aggiornamento, una volta avviato l'aggiornamento o dopo un ricaricamento dello switch.
Quando questo errore è presente, controllare l'utilizzo di LPM nella GUI di APIC e /32 o /128 dellaOperations > Capacity Dashboard > Leaf Capacity route.
È inoltre possibile eseguire questo comando sulla foglia per ottenere il conteggio dei criteri corrente:
vsh_lc -c "show plat internal hal health-stats" | grep -A 55 "L3 stats"
È possibile eseguire moquery (moquery -c faultInst -f 'fault.Inst.code="F3544"') sulla CLI di qualsiasi APIC per verificare l'esistenza di questi errori nel sistema. I guasti sono visibili anche all'interno della GUI.
Esempio di errore (F3544: errore di programmazione subnet L3Out)
Nell'output successivo viene illustrato un esempio di nodo 101 con errore di programmazione per 80 subnet L3Out con 'Subnet esterne per EPG esterno' (pfxRuleFailed). Sebbene mostri anche l'errore di programmazione dei contratti stessi (zoneRuleFailed) in changeSet, viene generato un errore separato F3545 per tale errore.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3544"'
Total Objects shown: 1
# fault.Inst
code : F3544
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.246-05:00
delegated : no
descr : 80 number of Prefix failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3544
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3544
rule : actrl-stats-report-pre-fix-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
Come risolvere i guasti?
Nota: non ricaricare lo switch in questo stato.
1. Verificare l'utilizzo di Policy CAM/LPM nel dashboard della capacità operativa o utilizzando la CLI fogliavsh_lc -c "show plat internal hal health-stats".
2. Consultare la Verified Scalability Guide (Google Verified Scalability Guide ACI) per verificare i limiti supportati per la versione e la piattaforma.
3. Rimuovere i contratti e i filtri inutilizzati applicati agli EPG.
4. Raccogliere un supporto tecnico su richiesta che includa gli switch foglia per ulteriori analisi da parte di TAC.
Verifica pre-aggiornamento
Entrambi gli errori F3545 e F3544 sono contrassegnati dallo script di convalida pre-aggiornamento per avvertire l'utente dell'impatto se gli errori non vengono risolti prima dell'aggiornamento.
I dettagli dello script di pre-aggiornamento sono documentati qui:
https://www.cisco.com/c/en/us/td/docs/dcn/aci/apic/all/apic-installation-aci-upgrade-downgrade/Cisco-APIC-Installation-ACI-Upgrade-Downgrade-Guide/m-pre-upgrade-checklists.html?bookSearch=true#Cisco_Concept.dita_1f674dd5-9ea2-4062-826b-f3c1550552dc.