Introduction
Este documento descreve como solucionar erros do Capture Resource Center (CRC) do ASR5500 Delivery Collaboration Portal (DCP) e MIO.
Informações de Apoio
Após a detecção de erros de CRC, o ASR5500 é projetado para executar autorrecuperação e recuperação automática. Na maioria dos casos, quando você executa uma redefinição de software não intrusiva de processos internos e switchover de placa automática, o sistema recupera desse pacote corrompido.
Problema
Quando um erro de software (erro de CRC) é detectado, o StarOS tenta primeiro recuperar proativamente a falha redefinindo o software dos processos internos relevantes, como o nbomgr e o recarregamento de DDF. Se essa recuperação não for bem-sucedida, a placa será reiniciada automaticamente para eliminar o erro de software e executar a verificação completa de hardware da placa.
Após a detecção de erros de CRC por DPC/UPDC/DPC2/UDPC2/MIO/UMIO, uma das primeiras etapas de recuperação que o sistema executa é reiniciar por software os processos associados ao chipset afetado. Neste exemplo, os registros do show logs'/syslog e do console de depuração da placa 8 detectaram um erro de CRC e conseguiram se recuperar.
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
Em determinadas situações, se a reinicialização do processo não recuperar o sistema, as placas DPC/UPDC/DPC2/UDPC2/MIO/UMIO serão reiniciadas automaticamente. Neste exemplo, os registros de show logs, syslog do sistema e/ou debug console logs, a placa afetada é reiniciada automaticamente pelo sistema após a detecção de erros de CRC. Nesses registros, a placa 6 foi reiniciada e voltou ao estado de espera.
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
Solução
Na maioria das vezes, erros de CRC detectados na placa DPC e MIO são erros transitórios que são recuperados automaticamente pelo sistema. Se a placa for reiniciada com êxito e voltar ao serviço, nenhuma ação adicional será necessária. Caso o sistema não consiga se recuperar automaticamente desses erros, o sistema colocará a placa de processamento de dados afetada off-line após 3 tentativas de redefinição. Se a placa for reiniciada e voltar ao estado de espera, não serão necessárias mais ações. Em situações raras, se o sistema não puder se recuperar automaticamente do CRC, entre em contato com o TAC da Cisco.