簡介
本文檔介紹如何對ASR5500交付合作門戶(DCP)和MIO的捕獲資源中心(CRC)錯誤進行故障排除。
背景資訊
在檢測到CRC錯誤時,ASR5500旨在執行自我修復和自動恢復。在大多數情況下,當您對內部進程執行非侵入式軟重置和自動卡切換時,它會使系統從此類資料包損壞中恢復。
問題
檢測到軟錯誤(CRC錯誤)時,StarOS首先嘗試通過軟重置相關內部進程(如npumgr和DDF重新載入)來主動恢復故障。如果恢復不成功,卡將自動重新啟動,以清除軟錯誤並執行卡的完整硬體檢查。
在DPC/UPDC/DPC2/UDPC2/MIO/UMIO檢測到CRC錯誤時,系統執行的第一個恢復步驟之一就是軟重置與受影響的晶片集相關的進程。在本示例中,來自卡8的show logs'/syslog和debug console的日誌檢測到CRC錯誤並且能夠恢復。
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
在某些情況下,如果進程重新啟動不能恢復系統,DPC/UPDC/DPC2/UDPC2/MIO/UMIO卡將自動重新啟動。在本示例中,show logs、系統系統日誌和/或調試控制檯日誌中的日誌,在檢測到CRC錯誤時,系統會自動重新啟動受影響的卡。在這些日誌中,卡6已重新啟動,並返回到備用狀態。
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
解決方案
DPC和MIO卡上檢測到的大多數CRC錯誤都是系統自動恢復的瞬態錯誤。如果卡成功重新啟動並恢復服務,則無需執行進一步的操作。如果系統無法從這些錯誤中自動恢復,則系統會在嘗試3次重置後使受影響的資料處理卡離線。如果卡重新啟動後返回到待機狀態,則無需執行進一步的操作。在極少數情況下,如果系統無法從CRC自動恢復,請聯絡Cisco TAC。