소개
이 문서에서는 ASR5500 DCP(Delivery Collaboration Portal) 및 MIO의 CRC(Capture Resource Center) 오류를 해결하는 방법에 대해 설명합니다.
배경 정보
CRC 오류가 감지되면 ASR5500은 자가 복구 및 자동 복구를 수행하도록 설계되었습니다. 대부분의 경우 내부 프로세스의 비침해적 소프트 리셋 및 자동 카드 전환을 수행할 때, 이러한 패킷 손상으로부터 시스템을 복구합니다.
문제
소프트 오류(CRC 오류)가 감지되면 StarOS는 먼저 npumgr 및 DDF 다시 로드와 같은 관련 내부 프로세스를 소프트 리셋하여 결함을 사전 대응적으로 복구하려고 시도합니다. 그러한 복구가 실패하면 자동으로 카드를 다시 시작하여 소프트 오류를 지우고 카드의 전체 하드웨어 검사를 수행합니다.
DPC/UPDC/DPC2/UDPC2/MIO/UMIO에 의해 CRC 오류가 감지되면 시스템이 수행하는 첫 번째 복구 단계 중 하나는 영향을 받는 칩셋과 관련된 프로세스를 소프트 리셋하는 것입니다. 이 예에서 show logs'/syslog 및 debug console의 로그가 카드 8의 CRC 오류를 감지하여 복구할 수 있었습니다.
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
프로세스 재시작이 시스템을 복구하지 않을 경우 DPC/UPDC/DPC2/UDPC2/MIO/UMIO 카드가 자동으로 재시작됩니다. 이 예에서 show logs, 시스템 syslog 및/또는 디버그 콘솔 로그의 로그는 CRC 오류가 감지되면 영향을 받는 카드가 자동으로 재시작됩니다. 이러한 로그에서 카드 6이 다시 시작되어 대기 상태로 돌아왔습니다.
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
솔루션
DPC 및 MIO 카드에서 탐지된 CRC 오류는 대부분 시스템에서 자동으로 복구되는 일시적인 오류입니다. 카드를 다시 시작하고 다시 서비스로 돌아오면 추가 작업이 필요하지 않습니다. 시스템에서 이러한 오류를 자동으로 복구할 수 없는 경우, 3번의 재설정 시도 후 영향을 받는 데이터 처리 카드를 오프라인으로 만듭니다. 카드를 다시 시작하고 스탠바이 상태로 돌아오면 추가 작업이 필요하지 않습니다. 드문 경우이지만 시스템이 CRC에서 자동 복구할 수 없는 경우 Cisco TAC에 문의하십시오.