Inleiding
Dit document beschrijft hoe u problemen kunt oplossen met fouten van ASR 5500 Delivery Collaboration Portal (DCP) en MIO.
Achtergrondinformatie
Bij het detecteren van CRC-fouten is ASR5500 ontworpen voor zelfgenezing en automatisch herstel. In de meeste gevallen, wanneer u een niet-opdringerige zachte reset van interne processen en het omschakelen naar de automatische kaart uitvoert, dan herstelt u het systeem uit dergelijke pakketcorruptie.
Probleem
Wanneer een zachte fout (CRC Error) wordt gedetecteerd, probeert StarOS eerst de fout proactief terug te krijgen door de relevante interne processen zoals npumgr en DDF opnieuw te herstellen. Als een dergelijk herstel niet succesvol is, wordt de kaart automatisch herstart om de zachte fout te verwijderen en de volledige hardware controle van de kaart uit te voeren.
Na detectie van CRC-fouten door DPC/UPDC/DPC2/UDPC2/MIO/UMIO, is een van de eerste herstelstappen die het systeem uitvoert het zachte reset van de processen die gekoppeld zijn aan de aangetaste chipset. In dit voorbeeld, de logboeken van show logs'/syslog en debug console van kaart 8 ontdekte CRC fout en kon herstellen.
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
In bepaalde situaties, als het opnieuw opstarten van het proces niet het systeem herstelt, worden de DPC/UPDC/DPC2/UDPC2/MIO/UMIO-kaarten automatisch opnieuw gestart. In dit voorbeeld, de logbestanden van show logs, systeemsyslog en/of debug console loglogs, wordt de aangetaste kaart automatisch door het systeem herstart wanneer het CRC-fouten detecteert. In deze logs werd kaart 6 opnieuw opgestart en hij kwam terug in de stand-by staat.
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
Oplossing
Het merendeel van de tijd dat CRC-fouten die op de DPC- en MIO-kaart zijn gedetecteerd, zijn tijdelijke fouten die automatisch door het systeem worden hersteld. Als de kaart weer in gebruik wordt genomen en opnieuw in gebruik wordt genomen, zijn geen verdere maatregelen vereist. Als het systeem niet in staat is om automatisch van deze fouten te herstellen, maakt het systeem de ingevoerde gegevensverwerkingskaart offline na 3 reset pogingen. Als de kaart opnieuw wordt opgestart en opnieuw in de stand-by staat verschijnt, zijn geen verdere acties nodig. Als het systeem in zeldzame situaties niet in staat is om automatisch van de CRC te herstellen, neemt u contact op met Cisco TAC.