Introduction
Ce document décrit comment dépanner les erreurs CRC (Capture Resource Center) de ASR5500 Delivery Collaboration Portal (DCP) et MIO.
Informations générales
Dès la détection des erreurs CRC, l'ASR5500 est conçu pour effectuer l'autoréparation et la récupération automatique. Dans la plupart des cas, lorsque vous effectuez une réinitialisation logicielle non intrusive des processus internes et de la commutation par carte automatique, elle récupère le système contre une corruption de paquets.
Problème
Lorsqu'une erreur logicielle (Erreur CRC) est détectée, StarOS tente d'abord de récupérer la défaillance de manière proactive en réinitialisant les processus internes pertinents tels que npumgr et le rechargement DDF. Si cette récupération échoue, la carte est automatiquement redémarrée pour effacer l'erreur logicielle et effectuer la vérification complète du matériel de la carte.
Une fois les erreurs CRC détectées par DPC/UPDC/DPC2/UDPC2/MIO/UMIO, l'une des premières étapes de récupération que le système effectue consiste à réinitialiser les processus associés au chipset affecté. Dans cet exemple, les journaux de show logs'/syslog et de la console de débogage de la carte 8 ont détecté une erreur CRC et ont pu être restaurés.
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
Dans certaines situations, si le redémarrage du processus ne récupère pas le système, les cartes DPC/UPDC/DPC2/UDPC2/MIO/UMIO sont automatiquement redémarrées. Dans cet exemple, les journaux de show logs, syslog système et/ou de debug console, la carte affectée est automatiquement redémarrée par le système après détection d'erreurs CRC. Dans ces journaux, la carte 6 a été redémarrée et elle est revenue en veille.
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
Solution
La plupart du temps, les erreurs CRC détectées sur le DPC et la carte MIO sont des erreurs transitoires qui sont récupérées automatiquement par le système. Si la carte redémarre et revient en service, aucune autre action n'est requise. Si le système ne peut pas récupérer automatiquement de ces erreurs, il met la carte de traitement des données affectée hors ligne après 3 tentatives de réinitialisation. Si la carte est redémarrée et revient en veille, aucune autre action n'est nécessaire. Dans de rares cas, si le système ne peut pas récupérer automatiquement à partir du CRC, contactez le centre d'assistance technique de Cisco.