Einleitung
In diesem Dokument wird der ACI-Fehler F3696 beschrieben: Schritte zur Coop-ep-Dämpfung und zur Behebung.
Hintergrundinformationen
Dieser spezielle Fehler wird ausgelöst, wenn EPs aufgrund der COOP-Endpunkt-Dämpfungsfunktion in einen "Freeze"-Zustand versetzt werden. EPs werden in einen "Freeze"-Zustand versetzt, wenn festgestellt wird, dass sie ein konsistentes Bewegungsverhalten aufweisen, was dazu führt, dass in einem kurzen Zeitintervall mehrere Aktualisierungen an COOP vorgenommen werden.
COOP EP Dampening ist ein COOP-Prozess-Schutzmechanismus, der auch bei der Identifizierung der Gründe für EP(s) hilft.
COOP EP Dampening wurde in Version 4.2(3) des Cisco Application Policy Infrastructure Controller (APIC) eingeführt und ist standardmäßig aktiviert.
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
Hinweis: Die Art dieses Fehlers und die zugehörigen Burndown-Timer können dazu führen, dass der Fehler ausgelöst wird und anschließend eigenständig behoben wird.
Intersight Connected ACI Fabrics
Dieser Fehler wird im Rahmen der proaktiven ACI-Initiativen aktiv überwacht.
Wenn Sie über eine Intersight Connected ACI Fabric verfügen, wurde in Ihrem Auftrag eine Serviceanfrage erstellt, um anzugeben, dass Instanzen dieses Fehlers in Ihrer Intersight Connected ACI Fabric gefunden wurden.
COOP-Endpunktdämpfung
Das Council of Oracle Protocol (COOP) wird verwendet, um Endpunkt (EP)-Zuordnungsinformationen (Standort und Identität) an den Spine-Proxy zu übermitteln. Leaf-Switches leiten Endpunktadressinformationen über COOP an die Spine-Switches weiter. So wird sichergestellt, dass alle Spine-Knoten eine konsistente Kopie der Endpunktadresse und Standortinformationen erhalten.
Eine konsistente Verschiebung von EPs, z. B. zwischen Schnittstellen oder Geräten, führt zu ständigen Endpunkt-Updates in Richtung Spines, um die Genauigkeit der COOP-Datenbank sicherzustellen. Eine hohe Anzahl an Updates, die aufgrund der fortlaufenden Verschiebung von Endgeräten anfällt, kann zu einer Überlastung der COOP-Ressourcen führen und die Verarbeitung gültiger Endgeräte-Updates verhindern.
Die Erkennung nicht autorisierter Endpunkte, eine Funktion des Leaf-Switches, verhindert, dass aggressive EP-Updates den Spine-Switch erreichen, solange sich die Verschiebungen auf einen Leaf erstrecken. Es gibt andere EP-Bewegungsszenarien, wie z. B. die Kreuzblatt-EP-Bewegung, für die ein anderer Schutzmechanismus zum Schutz von COOP erforderlich ist. An dieser Stelle kommt COOP Endpoint Dampening ins Spiel.
Um COOP in Situationen, in denen EP-Bewegungen stattfinden, zu entlasten, bitten die Spine-Switches alle Leaf-Switches, Updates von den markierten Endpunkten für einen bestimmten Zeitraum zu ignorieren. In diesem Fall ist der Dampening-Zustand eines solchen Endpunkts "Freeze" (Einfrieren), und der Fehler F3696 wird generiert.
Weitere Einzelheiten zu den Penalty-Werten und Grenzwerten finden Sie im Konfigurationsleitfaden, z. B. im 4.2-Konfigurationsleitfaden.
https://www.cisco.com/c/en/us/td/docs/switches/datacenter/aci/apic/sw/4-x/basic-configuration/Cisco-APIC-Basic-Configuration-Guide-42x/Cisco-APIC-Basic-Configuration-Guide-42x_chapter_0101.html#Cisco_Task.dita_b4647f36-3e4f-43bc-bea3-7572badebc01
Neueste Informationen zu dieser Funktion finden Sie im versionsspezifischen Konfigurationsleitfaden.
Hinweis: Die anderen aggressiven EP Update Protection-Funktionen, wie Rogue EP Control und EP Loop Protection, müssen explizit aktiviert werden. Weitere Einzelheiten zu diesen Funktionen finden Sie im ACI Fabric Endpoint Learning Whitepaper.
https://www.cisco.com/c/en/us/solutions/collateral/data-center-virtualization/application-centric-infrastructure/white-paper-c11-739989.html
Mögliche Ursachen für EP-Einfrieren
Es wurden die folgenden zwei typischen Szenarien identifiziert, die dieses Verhalten in diesem Feld verursachen:
- Ein Server mit zwei separaten Leaf-Verbindungen unter Verwendung von Aktiv-Aktiv anstelle einer Konfiguration mit nur einer logischen Verbindung (vPC)
- Ein Loop auf Downstream-Netzwerkgeräten
Schnellstart zur Fehlerbehebung
- Ermitteln Sie, welche Endgeräte in den Zustand "eingefroren" gelangt sind.
- (Optional) Wenn Auswirkungen auf Datenebene festgestellt werden, löschen Sie das eingefrorene EP für die vorübergehende Problemlösung.
- Ermitteln und verstehen Sie, warum die EPs verschoben wurden und ob dies für Ihr Netzwerkdesign erwartet und erforderlich wird.
- Falls nicht erforderlich, ergreifen Sie Maßnahmen, um die zugrunde liegende Bedingung zu beheben, die die EP-Bewegung verursacht hat
- Wenn die betreffende Bewegung für das Netzwerkdesign erforderlich und erforderlich ist, sollten Sie die COOP EP Dampening deaktivieren.
Hinweis: COOP EP Dampening ist ein Schutzmechanismus für den COOP-Prozess. Generell ist es vorzuziehen, Maßnahmen zu ergreifen, die unnötige EP-Bewegungen nach Möglichkeit abschwächen.
Detaillierte Schritte zur Behebung von Fehlern
Identifizierung von "eingefrorenen" Endpunkten
Mit dieser CLI-Prozedur für den Switch können Sie alle abgeschwächten Endpunkte in einem Spine- oder Leaf-Knoten anzeigen.
- Melden Sie sich bei der CLI des Spine- oder Leaf-Switches an, und geben Sie den folgenden Befehl ein:
- switch# show coop interne info repo ep dämpfung
(Optional) Löschen Sie eingefrorene Endpunkte.
Über die Benutzeroberfläche
Wird dies über die GUI ausgeführt, werden alle blockierten EPs auf dem ausgewählten Knoten gelöscht. Dieser Vorgang muss auf allen Spine-Switches sowie auf dem Quell-Leaf-Switch des eingefrorenen Endpunkts ausgeführt werden.
- Klicken Sie in der Menüleiste auf Fabric > Inventory (Fabric > Bestand).
- Erweitern Sie im Navigationsbereich den POD und den Spine- oder Leaf-Knoten.
- Klicken Sie mit der rechten Maustaste auf den Knoten, und wählen Sie Clear Dampened Endpoints (Gedämpfte Endpunkte löschen).
- Klicken Sie auf Ja, um die Aktion zu bestätigen.
Hinweis: Wenn sich die betreffenden EPs weiterhin in der Endpunkttabelle auf dem Leaf-Switch befinden, wird der Endpunkt in der COOP-Datenbank des Spine-Switches veröffentlicht. Ist dies nicht der Fall, wird der beschädigte Endpunkt nach zwei Minuten aus der Spine-Switch-COOP-Datenbank gelöscht.
Über die Switch-CLI
Bei der Ausführung über eine Switch-CLI wird bei diesem Verfahren jeweils nur ein Endpunkt gelöscht. Dieser Vorgang muss auf allen Spine-Switches und auf dem Quell-Leaf-Switch des Endpunkts ausgeführt werden.
- Melden Sie sich bei der Kommandozeile des Spine- oder Leaf-Switches an, und geben Sie command ein.
- switch# clear coop internal info repo ep dämpfungsschlüssel <bd_vnid> <mac>
Hinweis: Wenn sich die betreffenden EPs weiterhin in der Endpunkttabelle auf dem Leaf-Switch befinden, wird der Endpunkt in der COOP-Datenbank des Spine-Switches veröffentlicht. Ist dies nicht der Fall, wird der beschädigte Endpunkt nach zwei Minuten aus der Spine-Switch-COOP-Datenbank gelöscht.
COOP EP Dampening deaktivieren
Im Allgemeinen wird dies nicht empfohlen. Wenn Sie jedoch festgestellt haben, dass Ihr Netzwerkdesign die betreffende EP-Bewegung erfordert, kann COOP EP Dampening deaktiviert werden.
Ein HTTP POST nach /api/policymgr/mo/.xml mit disableEpDampening="true" deaktiviert COOP EP Dampening.
COOP EP Dampening kann mit derselben Anforderung wieder aktiviert werden, allerdings durch Einstellung disableEpDampening="false".
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
Über APIC-CLI
Über die APIC-CLI kann der icurl-Befehl den erforderlichen HTTP POST-Test durchführen.
COOP EP Dampening deaktivieren:
apic# icurl -X POST -d '
true">
' http://localhost:7777/api/policymgr/mo/.xml
Überprüfen Sie, ob COOP EP Dampening deaktiviert wurde:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
Weitere Details
COOP EP Dämpfung - DampFactor Anpassung
In Version 5.2.4d und späteren Versionen kann der 'dampFactor' geändert werden, um bestimmte Werte zu erhöhen, die mit der COOP EP Dampening-Funktion verbunden sind.
Die Modifizierung des DampFactor kann für Szenarien in Betracht gezogen werden, in denen ein bestimmtes Maß an EP-Bewegung außerhalb der Standardschwellenwerte erwartet wird, und Sie möchten COOP EP Dampening nicht deaktivieren.
Es gibt drei Schwellenwerte für die Feuchtigkeitsstrafe, die zusammen wirken. Alle drei Werte werden geändert, wenn der DampFactor geändert wird.
Schwellenwert-Name |
Beschreibung |
Standardwert |
DampfWiederverwendungThresh |
Schwellenwert wiederverwenden, wenn EP aus dem "Freeze"-Zustand in den Normalzustand zurückkehrt |
2500 |
SatSatDresh |
Feuchtesättigungsschwelle. Wenn ein EP diesen Strafwert überschreitet, wird es in einen "Freeze"-Zustand versetzt |
10000 |
Dampffrischung |
Schwellenwert für kritischen Zustand. Wenn das EP 10 min darüber bleibt, wird es in einen "Freeze"-Zustand versetzt |
4000 |
Der DampFactor-Standardwert ist 1. Der DampFactor kann auf Werte zwischen 1 und 5 geändert werden.
COOP EP DampFactor ändern
Um den Feuchtigkeitsfaktor auf das Vierfache des Wertes zu verändern, können Sie den folgenden Beitrag auf dem APIC-
apic# icurl -X POST -d '
dampFactor=4>
' http://localhost:7777/api/policymgr/mo/.xml
Die geänderten Grenzwerte können für jede Spine und jeden Repo validiert werden, indem die coopRepP-Klasse geprüft wird:
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000