소개
이 문서에서는 ACI 결함 F3696 coop-ep 댐프닝 및 교정 단계에 대해 설명합니다.
배경 정보
이 특정 결함은 COOP 엔드포인트 댐프닝 기능으로 인해 EP가 "동결" 상태가 될 때 트리거됩니다. EP는 일관적인 이동 동작이 발견되면 "고정" 상태로 전환되어 짧은 시간 간격으로 COOP에 대한 여러 업데이트가 발생합니다.
COOP EP 댐프닝은 EP를 사용하는 이유를 식별하는 데 도움이 되는 COOP 프로세스 보호 메커니즘입니다.
COOP EP 댐프닝은 Cisco APIC(Application Policy Infrastructure Controller) 릴리스 4.2(3)에서 기본적으로 도입되고 활성화됩니다.
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
참고: 이 결함의 특성 및 관련 번다운 타이머로 인해 결함이 트리거된 다음 자동으로 해결될 수 있습니다.
Intersight Connected ACI Fabric
이 결함은 사전 대응적 ACI 계약의 일부로 적극적으로 모니터링됩니다.
Intersight에 연결된 ACI 패브릭이 있는 경우 Intersight Connected ACI 패브릭 내에서 이 결함의 인스턴스가 발견되었음을 알리기 위해 귀하를 대신하여 서비스 요청이 생성되었습니다.
COOP 엔드포인트 차단
COOP(Council of Oracle Protocol)는 EP(Endpoint) 매핑 정보(위치 및 ID)를 스파인 프록시에 전달하는 데 사용됩니다. 리프 스위치는 COOP를 통해 엔드포인트 주소 정보를 스파인 스위치에 전달합니다. 그러면 모든 스파인 노드가 엔드포인트 주소 및 위치 정보의 일관된 사본을 유지할 수 있습니다.
인터페이스 또는 디바이스 전체에서 EP를 일관되게 이동하면 COOP 데이터베이스가 정확한지 확인하기 위해 스파인에 대한 엔드포인트 업데이트가 지속적으로 이루어집니다. 지속적인 엔드포인트 이동으로 인한 과도한 양의 업데이트는 COOP 리소스 과다 사용을 초래하여 유효한 엔드포인트 업데이트를 처리하지 못하게 할 수 있습니다.
Leaf 스위치의 기능인 Rogue Endpoint Detection은 이동이 단일 leaf로 범위가 지정된 한 공격적인 EP 업데이트가 spine 스위치에 도달하는 것을 방지합니다. COOP를 보호하기 위해 다른 보호 메커니즘을 필요로 하는 다른 EP 이동 시나리오(예: Cross-leaf EP Movement)가 있습니다. COOP 엔드포인트 댐프닝 기능이 바로 여기에 있습니다.
EP 이동 상황에서 COOP에 대한 부담을 줄이기 위해 스파인 스위치는 모든 리프 스위치에 지정된 기간 동안 플래그가 지정된 엔드포인트의 업데이트를 무시하도록 요청합니다. 이러한 경우 해당 엔드포인트의 댐프닝 상태가 "동결"이며 결함 F3696이 생성됩니다.
페널티 값 및 임계값에 대한 자세한 내용은 컨피그레이션 가이드 링크(예: 4.2 컨피그레이션 가이드 링크)에 나와 있습니다.
이 기능에 대한 최신 정보는 버전별 컨피그레이션 가이드 링크를 참조하십시오.
참고: 비인가 EP 제어 및 EP 루프 보호와 같은 다른 적극적인 EP 업데이트 보호 기능을 명시적으로 활성화해야 합니다. 이러한 기능에 대한 자세한 내용은 ACI 패브릭 엔드포인트 학습 백서에서 다룹니다.
EP가 정지된 가능한 원인
현장에서 이 동작을 유발하는 일반적인 2가지 시나리오는 다음과 같습니다.
- 단일 vPC(Logical Link) 컨피그레이션 대신 Active-Active를 사용하는 2개의 개별 리프 연결이 있는 서버
- 다운스트림 네트워크 디바이스의 루프
빠른 시작 - 결함 해결
- 어떤 엔드포인트가 "동결" 상태로 전환되었는지 확인합니다.
- (선택 사항) Dataplane impact가 표시되면 임시 영향 해결을 위해 고정된 EP를 지웁니다.
- 네트워크 설계에서 EP가 이동된 이유와 이것이 예상 및 필요한지 여부를 파악하고 이해합니다.
- 필요하지 않은 경우 EP 이동을 일으킨 기본 조건을 해결하기 위한 조치를 취합니다.
- 해당 이동이 네트워크 설계에 필요하고 필요한 경우 COOP EP 댐프닝을 비활성화하는 것을 고려하십시오.
참고: COOP EP 댐프닝은 COOP 프로세스를 위한 보호 메커니즘입니다. 일반적으로, 가능한 경우 불필요한 EP 이동을 완화하는 조치를 취하는 것이 선호된다.
결함 해결을 위한 세부 단계
고정 엔드포인트 식별
이 스위치 CLI 절차를 사용하여 스파인 또는 리프 노드의 모든 손상된 엔드포인트를 확인합니다.
- 스파인 또는 리프 스위치 CLI에 로그인하고 다음 명령을 입력합니다. switch# show coop internal info repo ep dampening
(선택 사항) 고정된 엔드포인트 지우기
GUI 사용
GUI를 사용하여 수행할 경우 선택한 노드에서 모든 고정된 EP가 지워집니다. 이 작업은 모든 스파인 스위치와 고정 엔드포인트의 소스 리프 스위치에서 실행해야 합니다.
- 메뉴 모음에서 패브릭 > 인벤토리를 클릭합니다.
- Navigation(탐색) 창에서 Pod와 스파인 또는 리프 노드를 확장합니다.
- 노드를 마우스 오른쪽 버튼으로 클릭하고 Clear Damped Endpoints(손상된 엔드포인트 지우기)를 선택합니다.
- Yes(예)를 클릭하여 작업을 확인합니다.
참고: 문제의 EP가 여전히 리프 스위치의 엔드포인트 테이블에 있는 경우 엔드포인트는 스파인 스위치 COOP 데이터베이스에 게시됩니다. 그렇지 않은 경우, 2분 후에 손상된 엔드포인트가 스파인 스위치 COOP 데이터베이스에서 삭제됩니다.
스위치 CLI 사용
스위치 CLI를 통해 수행할 경우 이 절차는 한 번에 하나의 엔드포인트만 지웁니다. 이 작업은 모든 스파인 스위치와 엔드포인트의 소스 리프 스위치에서 실행해야 합니다.
- 스파인 또는 리프 스위치 CLI에 로그인하고 다음 명령을 입력합니다. 스위치 번호 clear coop internal info repo ep dampening key <bd_vnid> <mac>
참고: 문제의 EP가 여전히 리프 스위치의 엔드포인트 테이블에 있는 경우 엔드포인트는 스파인 스위치 COOP 데이터베이스에 게시됩니다. 그렇지 않은 경우, 2분 후에 손상된 엔드포인트가 스파인 스위치 COOP 데이터베이스에서 삭제됩니다.
COOP EP 댐프닝 비활성화
일반적으로 이는 권장되지 않습니다. 그러나 네트워크 설계에서 문제의 EP 이동이 필요한 경우 COOP EP 댐프닝을 비활성화할 수 있습니다.
disableEpDampening="true"를 가진/api/policymgr/mo/.xml에 대한 HTTP POST는 COOP EP 댐프닝을 비활성화합니다.
COOP EP 댐프닝은 동일한 요청으로 다시 활성화할 수 있지만 disableEpDampening="false"로 설정하면 됩니다.
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
APIC CLI 사용
APIC CLI에서 icurl 명령은 필요한 HTTP POST를 지원할 수 있습니다.
COOP EP 댐프닝 비활성화:
apic# icurl -X POST -d '
' http://localhost:7777/api/policymgr/mo/.xml
COOP EP 댐프닝이 비활성화되었는지 확인합니다.
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
추가 세부 정보
COOP EP 댐프닝 - DampFactor 사용자 지정
5.2.4d 이상 릴리스에서는 COOP EP 댐프닝 기능과 관련된 특정 값을 높이도록 dampFactor를 수정할 수 있습니다.
특정 수준의 EP 이동이 기본 임계값을 벗어날 것으로 예상되는 경우 DampFactor for scenerios를 수정하여 COOP EP 댐프닝을 비활성화하지 않도록 하십시오.
동시에 작동하는 축약 페널티와 관련된 3개의 임계값이 있습니다. DampFactor를 변경할 때 다음 세 가지 값이 모두 수정됩니다.
임계값 이름 |
설명 |
기본값 |
댐프재사용 임계값 |
EP가 "고정" 상태에서 정상 상태로 다시 이동할 때 임계값 재사용 |
2500 |
습한토요일 |
습기 포화 임계값입니다. EP가 이 페널티 값을 초과하면 "동결" 상태가 됩니다 |
10000 |
습한임계값 |
위험 상태 임계값입니다. EP가 10분 동안 임계값 위에 머물러 있으면 "동결" 상태가 됩니다 |
4000 |
기본 DampFactor는 1로 설정됩니다. dampFactor는 1에서 5 사이의 값으로 수정할 수 있습니다.
COOP EP DampFactor 수정
습기 요인을 값의 4배로 변경하려면 APIC에서 이 게시물을 사용할 수 있습니다.
apic# icurl -X POST -d '
dampFactor=4
>
' http://localhost:7777/api/policymgr/mo/.xml
coopRepP 클래스를 확인하여 수정된 임계값을 repo당 스파인별로 검증할 수 있습니다.
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000