Introduzione
Questo documento descrive ACI Fault F3696 co-op-ep-dampening e le fasi di correzione.
Premesse
Questo errore specifico viene attivato quando gli EP entrano in uno stato di "blocco" a causa della funzione di attenuazione dell'endpoint COOP. Gli EP vengono messi in uno stato di "congelamento" quando hanno un comportamento di movimento coerente, causando più aggiornamenti a COOP in un breve intervallo di tempo.
COOP L'attenuazione dell'attività del PE è un meccanismo di protezione del processo COOP che aiuta anche a identificare il motivo per cui il PE o i PE.
L'attenuazione dell'impatto dell'EP COOP è introdotta e abilitata per impostazione predefinita in Cisco Application Policy Infrastructure Controller (APIC) versione 4.2(3).
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
Nota: la natura dell'errore e i timer di masterizzazione associati potrebbero causare l'attivazione dell'errore, quindi essere cancellati da soli.
Intersight Connected ACI Fabric
Questo guasto viene monitorato attivamente come parte degli accordi ACI proattivi.
Se si dispone di un'infrastruttura ACI connessa a Intersight, è stata generata una richiesta di assistenza per conto dell'utente per indicare che sono state trovate istanze di questo errore nell'infrastruttura ACI connessa a Intersight.
Attenuazione dell'endpoint COOP
Il protocollo COOP (Council of Oracle Protocol) viene utilizzato per comunicare le informazioni di mapping degli endpoint (EP) (posizione e identità) al proxy dorso. Gli switch foglia inoltrano le informazioni sull'indirizzo dell'endpoint agli switch della spine tramite COOP, il che assicura che tutti i nodi della spine mantengano una copia coerente delle informazioni sull'indirizzo e sulla posizione dell'endpoint.
Lo spostamento coerente dell'EP, ad esempio tra interfacce o dispositivi, provoca aggiornamenti costanti degli endpoint verso gli spine per garantire l'accuratezza del database COOP. Un volume elevato di aggiornamenti dovuto allo spostamento continuo dell'endpoint può causare un sovrautilizzo delle risorse COOP, impedendo l'elaborazione di aggiornamenti validi dell'endpoint.
Rogue Endpoint Detection, una funzione dello switch foglia, impedisce agli aggiornamenti EP aggressivi di raggiungere lo switch dorso, purché i movimenti abbiano l'ambito di una singola foglia. Ci sono altri scenari di movimento EP, come il movimento EP a foglie incrociate, che richiede un meccanismo di protezione diverso per proteggere COOP. A questo punto entra in gioco l'attenuazione degli endpoint COOP.
Per ridurre la pressione sul COOP nelle situazioni di movimento EP, gli interruttori a colonna vertebrale richiedono a tutti gli interruttori a foglia di ignorare gli aggiornamenti dagli endpoint contrassegnati per un periodo di tempo specificato. In questo caso, lo stato di smorzamento di uno di questi endpoint è "freeze" (congelamento) e viene generato un errore F3696.
Maggiori dettagli sui valori di penale e sulle soglie sono indicati nel collegamento alla guida di configurazione, esempio 4.2 guida di configurazione.
Fare riferimento alla guida alla configurazione specifica della versione per informazioni aggiornate su questa funzione.
Nota: le altre funzionalità aggressive di Protezione aggiornamento EP, ad esempio Controllo EP non autorizzato e Protezione loop EP, devono essere abilitate in modo esplicito. Per ulteriori informazioni su queste funzioni, consultare il white paper ACI Fabric Endpoint Learning.
Possibili cause dei blocchi del PE
I due scenari tipici che possono causare questo comportamento sul campo sono:
- Server con due connessioni foglia separate che utilizzano Active-Active, anziché una configurazione con collegamento logico singolo (vPC)
- Un loop nei dispositivi di rete a valle
Avvio rapido per risolvere gli errori
- Identificare gli endpoint che sono entrati nello stato "bloccato".
- (Facoltativo) Se l'impatto del piano dati viene rilevato, deselezionare il blocco EP per una risoluzione dell'impatto temporanea.
- Identificare e comprendere il motivo per cui gli EP sono stati spostati e se ciò è previsto e richiesto nella progettazione della rete.
- Se non è necessario, intraprendere un'azione per risolvere la condizione sottostante che ha causato il movimento EP.
- Se il movimento in questione è richiesto e necessario per la progettazione della rete, si consiglia di disabilitare lo smorzamento COOP EP.
Nota: lo smorzamento COOP EP è un meccanismo di protezione per il processo COOP. In generale, è preferibile adottare misure che limitino, ove possibile, gli spostamenti inutili del Parlamento europeo.
Passi dettagliati per la risoluzione degli errori
Identificazione degli endpoint bloccati
Usare questa procedura CLI dello switch per visualizzare tutti gli endpoint attenuati in una direttrice o in un nodo foglia.
- Accedere alla CLI dello switch dorso o foglia e immettere il comando: switch# show coop internal info repo ep dampening
(Facoltativo) Cancella endpoint bloccati
Uso della GUI
Se eseguito utilizzando la GUI, vengono cancellati tutti gli EP bloccati sul nodo selezionato. Questa operazione deve essere eseguita su tutti gli interruttori a dorso e sullo switch foglia di origine dell'endpoint bloccato.
- Sulla barra dei menu, fare clic su Fabric > Inventory (Fabric > Inventario).
- Nel riquadro di spostamento espandere il pod e il nodo dorso o foglia.
- Fare clic con il pulsante destro del mouse sul nodo e scegliere Cancella endpoint attenuati.
- Fare clic su Sì per confermare l'azione.
Nota: se gli EP in questione si trovano ancora nella tabella degli endpoint sullo switch foglia, l'endpoint viene pubblicato nel database COOP dello switch dorso. In caso contrario, l'endpoint smorzato viene eliminato dal database COOP dello switch a dorso dopo due minuti.
Tramite la CLI dello switch
Se eseguita tramite la CLI di uno switch, questa procedura cancella un solo endpoint alla volta. Questa operazione deve essere eseguita su tutti gli switch dorsali e sullo switch foglia di origine dell'endpoint.
- Accedere alla CLI dello switch dorso o foglia e immettere il comando: switch n. clear coop internal info repo ep smorzamento chiave <bd_vnid> <mac>
Nota: se gli EP in questione si trovano ancora nella tabella degli endpoint sullo switch foglia, l'endpoint viene pubblicato nel database COOP dello switch dorso. In caso contrario, l'endpoint smorzato viene eliminato dal database COOP dello switch a dorso dopo due minuti.
Disattiva smorzamento EP COOP
In generale, questa operazione non è consigliata. Tuttavia, se il progetto di rete richiede il movimento EP in questione, l'attenuazione COOP EP può essere disattivata.
Un HTTP POST a /api/policymgr/mo/.xml con disableEpDampening="true" disabilita l'attenuazione dell'impatto COOP su EP.
L'attenuazione dell'eco COOP può essere riattivata con la stessa richiesta, ma impostando disableEpDampening="false".
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
Uso di APIC CLI
Dalla CLI di APIC, il comando icurl può facilitare il POST HTTP richiesto.
Disattiva smorzamento EP COOP:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
Convalida che l'attenuazione dell'impatto di COOP su EP è stata disabilitata:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
Ulteriori dettagli
Attenuazione COOP EP - Personalizzazione del fattore di attenuazione
Nella release 5.2.4d e successive, è possibile modificare il valore di dampFactor per aumentare i valori specifici associati alla funzione di smorzamento COOP EP.
È possibile modificare il fattore di attenuazione per scenari in cui è previsto un determinato livello di movimento EP al di fuori delle soglie predefinite e non si desidera disattivare l'attenuazione dell'effetto di attenuazione COOP EP.
Ci sono 3 valori di soglia relativi alla sanzione dell'umidità che funzionano in tandem. Tutti e tre questi valori vengono modificati quando si modifica il fattore di attenuazione:
Nome soglia |
Descrizione |
Valore predefinito |
inumiditaRiutilizzaSpessore |
Riutilizza il valore di soglia quando EP torna allo stato normale da uno stato di "blocco" |
2500 |
bagnomariaSatThresh |
Soglia di saturazione umida. Quando un EP supera questo valore di penalità, viene messo in uno stato di "congelamento" |
10000 |
bagnomaria |
Soglia dello stato critico. Se l'EP rimane al di sopra della soglia per 10 minuti, viene messo in stato di "congelamento" |
4000 |
Il valore di default di DampFactor è 1. Il valore di dampFactor può essere modificato in valori compresi tra 1 e 5.
Modifica fattore di attenuazione EP COOP
Per modificare il fattore di umidità in 4 volte il valore, è possibile utilizzare questo post sull'APIC:
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
Le soglie modificate possono essere convalidate, per direttrice e per repo, verificando la classe coopRepP:
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000