Introduction
Ce document décrit la panne de l'ACI F3696 : étapes d'amortissement et de correction de la panne.
Informations générales
Cette erreur spécifique est déclenchée lorsque les ordinateurs passent à l'état « gel » en raison de la fonction d'amortissement des points d'extrémité COOP. Les EP sont mis en état de « gel » lorsqu'ils présentent un comportement de mouvement cohérent, ce qui entraîne plusieurs mises à jour de COOP dans un court intervalle de temps.
COOP EP Dampening est un mécanisme de protection du processus COOP qui aide également à identifier pourquoi EP(s).
L'amortissement COOP EP est introduit et activé par défaut dans Cisco APIC (Application Policy Infrastructure Controller) version 4.2(3).
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
Remarque : la nature de cette défaillance et les minuteurs de mise hors service associés peuvent déclencher la défaillance, puis être effacés par eux-mêmes.
Fabrics ACI Intersight Connected
Cette panne est activement surveillée dans le cadre des engagements proactifs de l'ACI.
Si vous disposez d'un fabric ACI connecté à Intersight, une demande de service a été générée en votre nom pour indiquer que des instances de cette erreur ont été trouvées dans votre fabric ACI connecté à Intersight.
Coop Endpoint Dampening
Le protocole COOP (Council of Oracle Protocol) est utilisé pour communiquer les informations de mappage des terminaux (emplacement et identité) au proxy spine. Les commutateurs Leaf transmettent les informations d'adresse de point d'extrémité aux commutateurs Spine via COOP, ce qui garantit ensuite que tous les noeuds Spine conservent une copie cohérente des informations d'adresse et d'emplacement de point d'extrémité.
Un mouvement EP constant, par exemple entre des interfaces ou des périphériques, entraîne des mises à jour constantes des terminaux vers les spines afin de garantir la précision de la base de données COOP. Un volume important de mises à jour en raison du déplacement continu des terminaux peut entraîner une surutilisation des ressources COOP, empêchant ainsi le traitement des mises à jour valides des terminaux.
La détection des terminaux non fiables, une fonctionnalité du commutateur Leaf, empêche les mises à jour EP agressives d'atteindre le commutateur Spine tant que les déplacements sont limités à un seul noeud Leaf. Il existe d'autres scénarios de mouvement EP, tels que le mouvement EP à feuilles croisées, qui nécessitent un mécanisme de protection différent pour protéger la COOP. C'est là que l'amortissement des terminaux COOP entre en jeu.
Pour réduire la pression sur la COOP dans les situations de mouvement EP, les commutateurs spine demandent à tous les commutateurs leaf d'ignorer les mises à jour des points d'extrémité marqués pendant une période spécifiée. Lorsque cela se produit, l'état d'amortissement d'un tel terminal est 'Figer' et une erreur F3696 est générée.
Pour plus de détails sur les valeurs de pénalité et les seuils, reportez-vous au lien du guide de configuration, par exemple 4.2.
https://www.cisco.com/c/en/us/td/docs/switches/datacenter/aci/apic/sw/4-x/basic-configuration/Cisco-APIC-Basic-Configuration-Guide-42x/Cisco-APIC-Basic-Configuration-Guide-42x_chapter_0101.html#Cisco_Task.dita_b4647f36-3e4f-43bc-bea3-7572badebc01
Reportez-vous au lien du guide de configuration spécifique à la version pour obtenir les dernières informations sur cette fonctionnalité.
Remarque : les autres fonctionnalités de protection contre les mises à jour EP agressives, telles que le contrôle des mises à jour EP indésirables et la protection contre les boucles EP, doivent être explicitement activées. Pour plus d'informations sur ces fonctionnalités, consultez le livre blanc sur l'apprentissage des terminaux de fabric ACI
https://www.cisco.com/c/en/us/solutions/collateral/data-center-virtualization/application-centric-infrastructure/white-paper-c11-739989.html
Causes possibles des gels EP
Les 2 scénarios typiques considérés pour provoquer ce comportement sur le terrain sont les suivants :
- Un serveur avec 2 connexions Leaf distinctes utilisant la configuration Active-Active au lieu d'une seule configuration de liaison logique (vPC)
- Boucle sur les périphériques réseau en aval
Démarrage rapide pour résoudre les défaillances
- Identifier le ou les terminaux qui sont passés à l'état « gelé »
- (Facultatif) Si l'impact du plan de données est détecté, effacez l'EP figé pour une résolution d'impact temporaire
- Identifiez et comprenez pourquoi le ou les périphériques ont été déplacés et si cela est attendu ou requis dans la conception de votre réseau.
- Si cela n'est pas nécessaire, prendre des mesures pour remédier à la condition sous-jacente qui a causé le mouvement de la PC
- Si le mouvement en question est nécessaire et nécessaire à la conception du réseau, pensez à désactiver l'amortissement COOP EP.
Note : L'amortissement COOP EP est un mécanisme de protection du processus COOP. En règle générale, il est préférable de prendre des mesures qui atténuent les mouvements inutiles du PE, dans la mesure du possible.
Étapes détaillées pour résoudre les défaillances
Identifier les terminaux « gelés »
Utilisez cette procédure CLI de commutateur pour afficher tous les points d'extrémité amortis dans un noeud spine ou leaf.
- Connectez-vous à l'interface de ligne de commande du commutateur spine ou leaf et entrez la commande :
- switch# show coop internal info repo ep dampening
(Facultatif) Effacer les terminaux « figés »
Via l'interface utilisateur graphique
Lorsque cette opération est effectuée via l'interface utilisateur graphique, tous les EP figés sur le noeud sélectionné sont effacés. Cette opération doit être exécutée sur tous les commutateurs spine ainsi que sur le commutateur leaf source du point d'extrémité figé.
- Dans la barre de menus, cliquez sur Fabric > Inventory.
- Dans le volet de navigation, développez la zone et le noeud spine ou leaf.
- Cliquez avec le bouton droit sur le noeud et choisissez Effacer les points d'extrémité amortis.
- Cliquez sur Oui pour confirmer l'action.
Remarque : si le ou les EP en question figurent toujours dans la table des terminaux du commutateur Leaf, le terminal est publié dans la base de données COOP du commutateur Spine. Si ce n'est pas le cas, le point d'extrémité amorti est supprimé de la base de données COOP du commutateur spine après deux minutes.
Via l'interface CLI du commutateur
Lorsqu'elle est effectuée via une interface de ligne de commande de commutateur, cette procédure efface un seul terminal à la fois. Cette opération doit être exécutée sur tous les commutateurs spine et sur le commutateur leaf source du point d'extrémité.
- Connectez-vous à l'interface de ligne de commande du commutateur spine ou leaf et entrez command
- switch# clear coop internal info repo ep dampening key <bd_vnid> <mac>
Remarque : si le ou les EP en question figurent toujours dans la table des terminaux du commutateur Leaf, le terminal est publié dans la base de données COOP du commutateur Spine. Si ce n'est pas le cas, le point d'extrémité amorti est supprimé de la base de données COOP du commutateur spine après deux minutes.
Désactiver le mouillage COOP EP
En général, cela n'est pas recommandé. Cependant, si vous avez constaté que votre conception de réseau nécessite le mouvement EP en question, le mouillage EP COOP peut être désactivé.
Un POST HTTP vers /api/policymgr/mo/.xml avec disableEpDampening="true" désactivera le COOP EP Dampening.
Vous pouvez réactiver l'amortissement COOP EP avec la même demande, mais en définissant disableEpDampening="false".
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
Via la CLI APIC
Sur l'interface de ligne de commande APIC, la commande icurl peut faciliter le POST HTTP requis.
Désactiver le mouillage COOP EP :
apic# icurl -X POST -d '
true">
' http://localhost:7777/api/policymgr/mo/.xml
Validez si l'amortissement COOP EP a été désactivé :
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
Détails supplémentaires
Humidification COOP EP - Personnalisation du facteur d'amortissement
Dans les versions 5.2.4d et ultérieures, le 'dampFactor' peut être modifié pour augmenter les valeurs spécifiques associées à la fonction d'amortissement COOP EP.
La modification du facteur d'amortissement peut être envisagée pour les scénarios dans lesquels un certain niveau de mouvement EP est attendu en dehors des seuils par défaut et où vous ne souhaitez pas désactiver l'amortissement COOP EP.
Il y a 3 valeurs de seuil liées à la pénalité d'humidité qui fonctionnent en tandem. Les trois valeurs sont modifiées lors de la modification du facteur d'amortissement.
Nom du seuil |
Description |
Valeur par défaut |
SeuilRéutilisationHumide |
Réutilisation de la valeur de seuil lorsque EP revient à l'état normal après un état « gel » |
2500 |
SeuilSiègeHumide |
Seuil de saturation humide. Lorsqu'un PE dépasse cette valeur de pénalité, il passe à l'état « gel » |
10 000 |
SeuilHumide |
Seuil d'état critique. Si le PE reste au-dessus de lui pendant 10 min, il est mis en état de "gel" |
4000 |
Le facteur d'amortissement par défaut est 1. Le facteur d'amortissement peut être modifié à des valeurs comprises entre 1 et 5.
Modifier le facteur d'amortissement COOP EP
Pour changer le facteur d'humidité à 4 fois la valeur, vous pouvez utiliser le post ci-dessous sur le APIC-
apic# icurl -X POST -d '
dampFactor=4>
' http://localhost:7777/api/policymgr/mo/.xml
Les seuils modifiés peuvent être validés, par spine par repo, en vérifiant la classe coopRepP :
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000