Introduction
Ce document décrit les défaillances de l'ACI F3545/F3544 et les étapes possibles pour aider à atténuer le problème.
F3545 : Programmation CAM de politiques pour les contrats
La panne F3545 se produit lorsque le commutateur ne parvient pas à activer une règle de contrat (règle de zonage) en raison d'une défaillance de programmation matérielle ou logicielle. Si vous voyez ceci, c'est parce que la stratégie Mémoire associative (CAM) est pleine et qu'aucun autre contrat ne peut être déployé sur le commutateur, et qu'un autre ensemble de contrats peut être déployé après un redémarrage ou une mise à niveau.
Cela peut conduire à des services qui fonctionnaient avant qu'une mise à niveau ne commence à échouer après une mise à niveau ou un rechargement du commutateur.
Notez que la même erreur peut se produire pour d'autres raisons, comme un type de filtre non pris en charge dans le ou les contrats au lieu de l'utilisation du CAM de stratégie. Par exemple, les commutateurs ACI de première génération prennent en charge l'IP EtherType mais pas l'IPv4 ou l'IPv6 dans les filtres de contrat.
Lorsque cette erreur est présente, recherchez l'utilisation du CAM de stratégie dans l'interfaceOperations > Capacity Dashboard > Leaf Capacity graphique du contrôleur APIC. Vous pouvez également exécuter cette commande sur le leaf afin d'obtenir le nombre actuel de stratégies.
vsh_lc -c "show plat internal hal health-stats" | grep -A 7 "Policy stats"
Vous pouvez également exécuter la commande moquery (moquery -c faultInst -f 'fault.Inst.code=="F3545"') sur l'interface de ligne de commande de n'importe quel APIC afin de vérifier si ces défauts existent sur le système. Les défaillances sont également visibles dans l'interface utilisateur graphique.
Exemple de défaillance (F3545 : échec de la programmation de la règle de zonage)
Le résultat suivant montre un exemple de noeud 101 avec un échec de programmation pour 266 règles de contrat (zoneRuleFailed). Bien qu'il montre également l'échec de programmation des sous-réseaux L3Out (pfxRuleFailed) dans le changeSet, une erreur distincte F3544 est soulevée pour cela.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3545"'
Total Objects shown: 1
# fault.Inst
code : F3545
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.256-05:00
delegated : no
descr : 266 number of Rules failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3545
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3545
rule : actrl-stats-report-zone-rule-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
F3544 : Programmation de sous-réseaux L3Out pour les contrats (F3544)
La panne F3544 se produit lorsque le commutateur ne parvient pas à activer une entrée afin de mapper un préfixe à pcTag en raison d'un échec de programmation matérielle ou logicielle.
Ces entrées sont configurées pour les sous-réseaux L3Out avec la portée 'Sous-réseaux externes pour l'EPG externe' sous un EPG externe dans un L3Out et utilisées pour mapper les sous-réseaux L3Out aux EPG L3Out.
Si vous voyez ceci en raison de la capacité du LPM ou des routes d'hôte sur le commutateur, un tel commutateur peut activer différents ensembles d'entrées après un redémarrage ou une mise à niveau.
Il peut en résulter que des services qui étaient fonctionnels avant une mise à niveau échouent une fois que la mise à niveau est lancée ou après un rechargement propre du commutateur.
Lorsque cette erreur est présente, recherchez l'utilisation des routes LPM et /32 ou /128 dans l'interface graphique utilisateurOperations > Capacity Dashboard > Leaf Capacity du contrôleur APIC.
Vous pouvez également exécuter cette commande sur le leaf afin d'obtenir le nombre actuel de stratégies :
vsh_lc -c "show plat internal hal health-stats" | grep -A 55 "L3 stats"
Vous pouvez exécuter la commande moquery (moquery -c faultInst -f 'fault.Inst.code=="F3544"') sur l'interface de ligne de commande de n'importe quel APIC afin de vérifier si ces défauts existent sur le système. Les défaillances sont également visibles dans l'interface utilisateur graphique.
Exemple de défaillance (F3544 : échec de programmation de sous-réseau L3Out)
Le résultat suivant montre un exemple de noeud 101 avec un échec de programmation pour 80 sous-réseaux L3Out avec « External Subnets for the External EPG » (pfxRuleFailed). Bien qu'il montre également l'échec de programmation des contrats eux-mêmes (zoneRuleFailed) dans le changeSet, un défaut distinct F3545 est soulevé pour cela.
apic1# moquery -c faultInst -f 'fault.Inst.code=="F3544"'
Total Objects shown: 1
# fault.Inst
code : F3544
ack : no
annotation :
cause : actrl-resource-unavailable
changeSet : pfxRuleFailed (New: 80), zoneRuleFailed (New: 266)
childAction :
created : 2020-02-26T01:01:49.246-05:00
delegated : no
descr : 80 number of Prefix failed on leaf1
dn : topology/pod-1/node-101/sys/actrl/dbgStatsReport/fault-F3544
domain : infra
extMngdBy : undefined
highestSeverity : major
lastTransition : 2020-02-26T01:03:59.849-05:00
lc : raised
modTs : never
occur : 1
origSeverity : major
prevSeverity : major
rn : fault-F3544
rule : actrl-stats-report-pre-fix-prog-failed
severity : major
status :
subject : hwprog-failed
type : operational
uid :
Comment résoudre les problèmes ?
Remarque : ne rechargez pas le commutateur dans cet état.
1. Vérifiez l'utilisation du CAM de stratégie/LPM sur le tableau de bord Capacité d'exploitation ou en utilisant l'interface de ligne de commande leaf vsh_lc -c "show plat internal hal health-stats".
2. Consultez le Verified Scalability Guide (google Verified Scalability Guide ACI) afin de vérifier les limites prises en charge pour la version et la plate-forme.
3. Supprimez les contrats inutilisés et les filtres appliqués aux groupes de terminaux.
4. Collectez un support technique à la demande qui inclut les commutateurs Leaf pour une analyse plus approfondie par le TAC.
Vérification préalable à la mise à niveau
Les deux défauts F3545 et F3544 sont marqués par le script de validation de pré-mise à niveau afin d'avertir l'utilisateur de l'impact si les défauts ne sont pas corrigés avant la mise à niveau.
Les détails du script de pré-mise à niveau sont documentés ici :
https://www.cisco.com/c/en/us/td/docs/dcn/aci/apic/all/apic-installation-aci-upgrade-downgrade/Cisco-APIC-Installation-ACI-Upgrade-Downgrade-Guide/m-pre-upgrade-checklists.html?bookSearch=true#Cisco_Concept.dita_1f674dd5-9ea2-4062-826b-f3c1550552dc.