소개
이 문서에서는 Cisco 버그 ID CSCwb의 영향을 받을 때 NCS4K 플랫폼에서 관찰된 증상을 설명합니다69873
배경 정보
두 NCS4K 노드(SW 6.5.26) 간에 BFD(Bidirectional Forwarding Detection) 세션이 플랩되고 있으며 최종적으로 감소 상태가 되는 경우가 많습니다.
동시에 두 노드는 패킷 손실 없이 서로 ping할 수 있습니다.
문제
문제 노드에서 BFD 세션이 활성 및 대기 LC VM에서 INIT 상태임을 확인할 수 있습니다.
Hu0/4/0/11/2.4001 10.55.6.180 0s 6s(2s*3) INIT
Yes 0/LC0
Hu0/4/0/11/2.4001 10.55.6.180 0s 6s(2s*3) INIT
Yes 0/LC1
show logging 출력에서는 다음 추적 결과를 볼 수 있습니다.
LC/0/LC1:2022 Nov 24 11:29:37.098 UTC: fib_mgr[198]: %ROUTING-FIB-3-PLATF_UPD_FAIL : FIB platform update failed: Obj=DATA_TYPE_NHINFO[ptr=0x87c654c0,refc=0,flags=0x10000008] Action=CREATE Proto=ipv4. Cerr='Subsystem(8165)' detected the 'resource not available' condition 'Code(0)' : fib_mgr : (PID=5045) : -Traceback= 7f648e9733c7 7f648f8d546e 7f648f74cb3f 7f648f75449c 7f648f75a3c4 7f648f7cee95 7f648f8c7e58 7f648f7c623f 7f648f7ca7f4 7f648f8c841f 7f648f8fc3f7 7f648f8c7e58 7f648f7c623f 7f648f7ca7f4 7f648f8c8465 7f648f7d3028
LC/0/LC1:2022 Nov 24 11:29:52.163 UTC: fib_mgr[198]: %ROUTING-FIB-3-PLATF_UPD_FAIL : FIB platform update failed: Obj=DATA_TYPE_NHINFO[ptr=0x87c652d0,refc=0,flags=0x10000008] Action=CREATE Proto=ipv4. Cerr='Subsystem(8165)' detected the 'resource not available' condition 'Code(0)' : fib_mgr : (PID=5045) : -Traceback= 7f648e9733c7 7f648f8d546e 7f648f74cb3f 7f648f75449c 7f648f75a3c4 7f648f7cee95 7f648f8c7e58 7f648f7c623f 7f648f7ca7f4 7f648f8c841f 7f648f8fc3f7 7f648f8c7e58 7f648f7c623f 7f648f7ca7f4 7f648f8c8465 7f648f7d3028
이 명령에서 show cef platform trace all location <active LC VM> 출력은 다음과 같습니다.
Nov 23 21:03:03.659 dnx_fib_retry_event 0/LC1 t5851 TP764,ppinfo_send_encap_gcc,ppindex_alloc_failed,trans_id,716207282,ifh,0x800087c,rc,-806191104:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
마지막으로 명령 show ppinfo producer trac all location <active LCVM> inc 리소스 출력에서 다음 오류를 확인할 수 있습니다.
Nov 28 07:47:20.819 ppinfo/prod/fib/ipv4/err 0/LC1 517384# t5851 ppindex alloc Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.819 ppinfo/prod/fib/ipv4/err 0/LC1 452746# t5851 indx alloc failed: Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.819 ppinfo/prod/fib/ipv4/err 0/LC1 508753# t5851 ppindex alloc Cerr: 'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.827 ppinfo/prod/fib/ipv4/err 0/LC1 504601# t5851 ppindex alloc Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.827 ppinfo/prod/fib/ipv4/err 0/LC1 619759# t5851 indx alloc failed: Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.827 ppinfo/prod/fib/ipv4/err 0/LC1 1067176# t5851 ppindex alloc Cerr: 'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.835 ppinfo/prod/fib/mpls/err 0/LC1 517116# t5851 ppindex alloc Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.835 ppinfo/prod/fib/mpls/err 0/LC1 2096661# t5851 indx alloc failed: Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.835 ppinfo/prod/fib/mpls/err 0/LC1 617742# t5851 ppindex alloc Cerr: 'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.843 ppinfo/prod/fib/mpls/err 0/LC1 1298595# t5851 ppindex alloc Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.843 ppinfo/prod/fib/mpls/err 0/LC1 190161# t5851 indx alloc failed: Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:20.843 ppinfo/prod/fib/mpls/err 0/LC1 1299219# t5851 ppindex alloc Cerr: 'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:35.845 ppinfo/prod/fib/ipv4/err 0/LC1 621013# t5851 ppindex alloc Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
Nov 28 07:47:35.845 ppinfo/prod/fib/ipv4/err 0/LC1 512881# t5851 indx alloc failed: Cerr:'Subsystem(8165)' detected the 'resource not available' condition 'Code(0)'
솔루션
이 모든 증상이 이 DDT와 일치합니다.
Cisco 버그 ID CSCwb69873ppinfo 할당 실패:
요약 결함
6.5.33에서 수정되었습니다.
증상:
링크 BFD 세션이 플래핑 중이거나 INIT 상태에서 중단되었습니다.
조건:
다음 홉 주소의 플래핑으로 인해 이 문제가 발생합니다.
해결 방법:
RP 카드 전환(기본적으로 RP 및 LC VM 전환) 이렇게 하면 PPIndex 할당 실패가 지워집니다. LINK BFD 문제를 해결하려면 다음 중 하나를 수행하여 영향을 받은 하위 인터페이스(OR)를 삭제하고 다시 생성하십시오. 영향을 받은 하위 인터페이스를 종료하지 마십시오.
추가 문제 설명:
ppindex 항목이 누수되어 모든 사용 가능한 항목이 소모되며 이로 인해 리소스 소모 문제가 발생합니다. NH가 삭제되면 PIndex가 해제되고, NH가 생성되면 ppindex가 할당된다. NH delete가 누출을 유발하는 ppindex를 비우지 않게 하는 버그가 있다. 모든 ppindex가 다 사용되면, 이들을 자유롭게 만들라는 호출이 없으며, 이는 시스템이 지속적으로 실패하게 만들고 새로운 농협(NH)들을 생성한다. 할당된 encap_id에 대한 검사가 있지만 코드에서 encap_id를 가져오지 않으므로 검사가 실패하고 ppindex_free를 호출하지 않고 조기에 취소됩니다.