المقدمة
يوضح هذا المستند كيفية أستكشاف أخطاء مركز موارد الالتقاط (CRC) في مدخل تعاون التسليم (DCP) ل ASR5500 واستكشاف أخطائها وإصلاحها و MIO.
معلومات أساسية
عند اكتشاف أخطاء CRC، تم تصميم ASR5500 لإجراء الاسترداد التلقائي والاسترداد الذاتي. في معظم الحالات، عند إجراء إعادة ضبط ناعمة غير إقتحام للعمليات الداخلية وتبديل البطاقات التلقائية، فإنها تسترد النظام من فساد الحزمة هذا.
المشكلة
عند اكتشاف خطأ بسيط (خطأ CRC)، يحاول StarOS أولا إسترداد الخطأ بشكل استباقي عن طريق إعادة تعيين العمليات الداخلية ذات الصلة مثل إعادة تحميل NPUMGR و DDF. وإذا لم ينجح هذا الاسترداد، فسيتم إعادة تشغيل البطاقة تلقائيا لمسح الخطأ البسيط وإجراء فحص الأجهزة الكامل للبطاقة.
عند اكتشاف أخطاء CRC بواسطة DPC/UPDC/DPC2/UDPC2/MIO/UMIO، فإن إحدى خطوات الاسترداد الأولى التي يقوم بها النظام هي إعادة ضبط العمليات المرتبطة بمجموعة الشرائح المتأثرة بطريقة سلسة. في هذا المثال، كشفت السجلات من show log'/syslog ووحدة تحكم تصحيح الأخطاء للبطاقة 8 عن خطأ CRC وكانت قادرة على الاسترداد.
2021-Aug-01+01:01:01.711 [drvctrl 39204 error]
[8/0/7058 <hwmgr:80> hw_common_lib.c:492]
[software internal system syslog] hw_mon_elem_changed:
Detected DDF RELOAD on CRC error: card 8, device DDF1
2021-Aug-01+01:01:01.727 card 8-cpu0: [23552535.124999]
DF2 Complex-0 Program DDF2 CAF_DF1_PROG_ERR error detected on FLM123456AB
في حالات معينة، إذا لم تقم إعادة تشغيل العملية باسترداد النظام، تتم إعادة تشغيل بطاقات DPC/UPDC/DPC2/UDPC2/MIO/UMIO تلقائيا. في هذا المثال، يتم إعادة تشغيل السجلات الواردة من show log و/أو سجلات وحدة تحكم النظام syslog و/أو debug، البطاقة المتأثرة تلقائيا بواسطة النظام عند اكتشاف أخطاء CRC. في هذه السجلات، تمت إعادة تشغيل البطاقة 6 وعادت إلى حالة الاستعداد.
2021-Jun-20+10:11:12.150 [hat 3033 error]
[5/0/7094 <hatsystem:0> atsystem_fail.c:1470]
[hardware internal system critical-info diagnostic]
Card error detected on card 6 device DDF reason DDF_CRC_ERROR
2021-Jun-20+10:11:12.201 [rct 13013 info]
[software internal system critical-info syslog] Card 6 shutdown started
2021-Jun-20+10:11:12.201 [afctrl 186001 error]
[5/0/7169 <afctrl:0> l_msg_handler.c:277]
[software internal system critical-info syslog]
afctrl_bcf_scrmem_doorbell_callback: Slot 6 scratch memory driver error
******** show rct stats *******
RCT stats Details (Last 1 Actions)
Action Type From To Start Time Duration
----------------- --------- ---- ---- ------------------------ ----------
Shutdown N/A 6 0 2021-Jun-20+10:11:12.201 0.002 sec
الحل
معظم الوقت الذي يتم فيه اكتشاف أخطاء CRC على بطاقة DPC و MIO هي أخطاء عابرة يتم إستردادها تلقائيا بواسطة النظام. في حالة إعادة تشغيل البطاقة بنجاح وإعادتها إلى الخدمة، لا يلزم إتخاذ أي إجراءات أخرى. في حالة عدم قدرة النظام على الاسترداد التلقائي من هذه الأخطاء، يقوم النظام بجعل بطاقة معالجة البيانات المتأثرة غير متصلة بعد 3 محاولات لإعادة التعيين. إذا تم إعادة تشغيل البطاقة وعادت إلى حالة الاستعداد، فلن تكون هناك حاجة إلى مزيد من الإجراءات. في الحالات النادرة، إذا لم يكن النظام قادرا على الاسترداد التلقائي من CRC، اتصل ب cisco TAC.