Introducción
Este documento describe los pasos de dampening y remediación de ACI Fault F3696 coop-ep.
Antecedentes
Este fallo específico se activa cuando los EP pasan a un estado de "congelación" debido a la función de amortiguación de terminales COOP. Los EP se colocan en un estado de "congelación" cuando se detecta que tienen un comportamiento de movimiento uniforme, lo que provoca que se realicen varias actualizaciones a COOP en un breve intervalo de tiempo.
La amortiguación COOP EP es un mecanismo de protección del proceso COOP que también ayuda a identificar por qué EP(s).
El dampening COOP EP se introduce y se activa de forma predeterminada en Cisco Application Policy Infrastructure Controller (APIC) versión 4.2(3).
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
Nota: La naturaleza de este fallo y los temporizadores de combustión asociados podrían provocar que el fallo se active y luego se borre por sí solo.
Intersight Connected ACI Fabrics
Este fallo se supervisa activamente como parte de los compromisos proactivos de ACI.
Si tiene un fabric ACI conectado a Intersight, se generó una solicitud de servicio en su nombre para indicar que se encontraron instancias de este error en el fabric ACI conectado a Intersight.
Dampening de terminal COOP
El Council of Oracle Protocol (COOP) se utiliza para comunicar información de asignación de terminales (EP) (ubicación e identidad) al proxy de columna. Los switches de hoja reenvían la información de la dirección del terminal a los switches de columna a través de COOP, lo que garantiza que todos los nodos de columna mantengan una copia uniforme de la información de la ubicación y la dirección del terminal.
El movimiento uniforme de EP, como a través de interfaces o dispositivos, provoca actualizaciones constantes de terminales hacia las columnas para garantizar que la base de datos COOP sea precisa. Un volumen agresivo de actualizaciones debido al movimiento continuo de los terminales puede dar lugar a una sobreutilización de los recursos COOP, lo que impide el procesamiento de actualizaciones de terminales válidas.
La Detección de terminales no fiables, una función del switch de hoja, evita que las actualizaciones agresivas de EP lleguen al switch de columna, siempre que los movimientos tengan un ámbito de una sola hoja. Existen otros escenarios de movimiento EP, como el movimiento EP de hoja cruzada, que requieren un mecanismo de protección diferente para proteger el COOP. Aquí es donde entra en juego el dampening de terminales COOP.
Para aliviar la presión sobre COOP en situaciones de movimiento EP, los switches de columna piden a todos los switches de hoja que ignoren las actualizaciones de los terminales marcados durante un período específico. Cuando esto ocurre, el estado de amortiguación de cualquiera de estos terminales es "congelado" y se genera un error F3696.
En el enlace de la guía de configuración, por ejemplo, el enlace de la guía de configuración 4.2, se incluyen más detalles sobre los valores de penalización y los umbrales.
Consulte el enlace de la guía de configuración específica de la versión para obtener información más reciente sobre esta función.
Nota: Las otras funciones agresivas de protección de actualizaciones de EP, como Rogue EP Control y EP Loop Protection, deben estar habilitadas de forma explícita. En el informe técnico Aprendizaje de terminales de fabric de ACI encontrará más información sobre estas funciones.
Posibles causas de la congelación de EP
Los 2 escenarios típicos que se ha visto que causan este comportamiento en el campo son:
- Un servidor con 2 conexiones de hoja independientes que utilizan Active-Active, en lugar de una configuración de enlace lógico único (vPC)
- Un loop en los dispositivos de red descendentes
Inicio rápido para solucionar errores
- Identifique los terminales que han pasado al estado "congelado".
- (Opcional) Si se detecta un impacto en el plano de datos, borre el PE congelado para obtener una resolución de impacto temporal.
- Identifique y comprenda por qué se han movido los EP y si se espera o no que esto sea necesario en el diseño de la red.
- Si no es necesario, tome medidas para abordar la condición subyacente que causó el movimiento del EP.
- Si el movimiento en cuestión es necesario y necesario para el diseño de la red, considere la posibilidad de desactivar la amortiguación COOP EP.
Nota: COOP EP Dampening es un mecanismo de protección para el proceso COOP. En general, es preferible tomar medidas que mitiguen los movimientos innecesarios del PE siempre que sea posible.
Pasos detallados para abordar la falla
Identificar terminales congelados
Utilice este procedimiento CLI del switch para ver todos los terminales amortiguados en un nodo de columna u hoja.
- Inicie sesión en la CLI del switch de columna u hoja e ingrese el comando: switch# show coop internal info repo ep dampening
(Opcional) Borre los terminales congelados
Uso de la interfaz GUI
Cuando se realiza mediante la GUI, se borran todos los EP congelados del nodo seleccionado. Esta operación debe ejecutarse en todos los switches de columna, así como en el switch de hoja de origen del punto final congelado.
- En la barra de menús, haga clic en Fabric > Inventory.
- En el panel de navegación, expanda el grupo de dispositivos y el nodo de columna u hoja.
- Haga clic con el botón secundario en el nodo y elija Borrar extremos amortiguados.
- Haga clic en Yes para confirmar la acción.
Nota: Si los EP en cuestión siguen en la tabla de terminales del switch de hoja, el terminal se publica en la base de datos COOP del switch de columna. Si no es así, el punto final amortiguado se elimina de la base de datos COOP del conmutador central después de dos minutos.
A través de la CLI del switch
Cuando se realiza a través de una CLI de switch, este procedimiento solo borra un único punto final a la vez. Esta operación debe ejecutarse en todos los switches de columna y en el switch de hoja de origen del punto final.
- Inicie sesión en la CLI del switch de columna u hoja e ingrese el comando: switch# clear coop internal info repo ep dampening key <bd_vnid> <mac>
Nota: Si los EP en cuestión siguen en la tabla de terminales del switch de hoja, el terminal se publica en la base de datos COOP del switch de columna. Si no es así, el punto final amortiguado se elimina de la base de datos COOP del conmutador central después de dos minutos.
Desactivar amortiguación COOP EP
En general, esto no se recomienda. Sin embargo, si se ha dado cuenta de que el diseño de la red requiere el movimiento de EP en cuestión, se puede desactivar la amortiguación COOP EP.
Un HTTP POST a /api/policymgr/mo/.xml con disableEpDampening="true" inhabilita el dampening COOP EP.
El dampening COOP EP se puede volver a habilitar con la misma solicitud, pero configurando disableEpDampening="false".
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
Uso de APIC CLI
En la CLI de APIC, el comando icurl puede facilitar el HTTP POST requerido.
Desactivar amortiguación COOP EP:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
Valide que se haya deshabilitado la amortiguación COOP EP:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
Detalles adicionales
COOP EP Dampening - Personalización de DampFactor
En las versiones 5.2.4d y posteriores, se puede modificar dampFactor para aumentar los valores específicos asociados con la función de amortiguación COOP EP.
Considere la posibilidad de modificar DampFactor para escenarios en los que se espera un cierto nivel de movimiento EP fuera de los umbrales predeterminados y no desea desactivar el dampening COOP EP.
Hay 3 valores de umbral relacionados con la penalización de humedad que funcionan en tándem. Los 3 valores se modifican al cambiar DampFactor:
Nombre de umbral |
Descripción |
Valor Predeterminado |
dampReuseThresh |
Valor de umbral de reutilización cuando el EP vuelve al estado normal desde un estado de "congelación" |
2500 |
dampSatThresh |
Umbral de saturación de humedad. Cuando un EP supera este valor de penalización, se pone en un estado de "congelación" |
10000 |
dampThresh |
Umbral de estado crítico. Si el EP permanece por encima del umbral durante 10 minutos, se pone en estado "congelado" |
4000 |
El valor predeterminado de DampFactor es 1. El valor de dampFactor se puede modificar a valores entre 1 y 5.
Modificar COOP EP DampFactor
Para cambiar el factor de humedad a 4 veces el valor, puede utilizar esta publicación en el APIC:
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
Los umbrales modificados se pueden validar, por columna y por repo, comprobando la clase coopRepP:
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000