يشرح هذا المستند خطوات أستكشاف أخطاء التماثل وإصلاحها وعزل جزء أو مكون فاشل من موجه الإنترنت من السلسلة Cisco 12000 Series بعد أن تواجه مجموعة متنوعة من رسائل خطأ التماثل.
ملاحظة: لا يغطي هذا المستند سبب أخطاء التماثل. إذا كنت مهتما بتعريف أكثر إيجازا لأخطاء التماثل (المعروف أيضا ب إزاحات حدث واحد - SEU) والسبب المحتمل لها، فإننا نوصي بأن تقرأ الوثائق المرتبطة من زيادة توفر الشبكة.
للحصول على مزيد من المعلومات حول اصطلاحات المستندات، راجع اصطلاحات تلميحات Cisco التقنية.
قبل متابعة هذا المستند، نوصي بقراءة المستندات التالية:
تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية أدناه.
سلسلة موجهات الإنترنت طراز 12000 من Cisco
جميع إصدارات برنامج Cisco IOS®
تم إنشاء المعلومات المُقدمة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كنت تعمل في شبكة مباشرة، فتأكد من فهمك للتأثير المحتمل لأي أمر قبل استخدامه.
تتضمن معظم معالجات مسار موجه الإنترنت Cisco 12000 Series وبطاقات الخط وظيفة تصحيح رمز الخطأ (ECC). ومع ذلك، هناك بعض بطاقات الخطوط الموجودة في الميدان التي لا تملك قدرة نظام تصحيح الأخطاء (ECC). تغطي وظائف نظام تصحيح الأخطاء (ECC) ذاكرة الوصول العشوائي (RAM) أو ذاكرة الوصول العشوائي الديناميكية المتزامنة (SDRAM) فقط على البطاقات. أما الباقي فلا يتمتع بحماية نظام تصحيح الأخطاء (ECC).
فيما يلي مقارنة لوظائف ECC لبطاقات الخط المستخدمة مع Cisco 12000:
تشتمل جميع بطاقات المحرك 2 والإصدارات الأحدث على وظائف نظام تصحيح الأخطاء (ECC).
تم تغيير بطاقات المحرك 1 إلى ECC بعد FCS.
لا تشتمل بطاقات المحرك 0 على وظيفة ECC.
يمكن ترقية بعض البطاقات إلى منتجات مماثلة تدمج وظيفة ECC.
يسرد الجدول التالي المنتجات التي تحتوي على وظيفة ECC:
منتجات لا تعمل بنظام تصحيح الأخطاء (ECC) | منتجات ECC |
---|---|
GRP(=) | GRP-B(=) |
GE-SX/LH-SC(=) | GE-GBIC-SC-B(=) |
GE-GBIC-SC-A(=) | GE-GBIC-SC-B(=) |
8FE-FX-SC(=) | 8FE-FX-SC-B(=) |
8FE-TX-RF45(=) | 8FE-TX-RJ45-B(=) |
6DS3-SMB(=) | 6DS3-SMB-B(=) |
12DS3-SBM(=) | 12DS3-SMB-B(=) |
OC12/SRP-IR-SC(=) | OC12/SRP-IR-SC-B(=) |
OC12/SRP-MM-SC(=) | OC12/SRP-mm-SC-B(=) |
OC12/SRP-LR-SC(=) | OC12/SRP-LR-SC-B(=) |
ملاحظة: B و ECC مستقلان. -ب يعني أن المنتج هو ثاني أكبر مراجعة منتظمة للمجلس. وفي بعض الحالات، كان هذا هو تنقيح نظام تصحيح الأخطاء.
تقدم Cisco خطة لترحيل التقنية (TMP) تتيح لك ترقية لوحة لا تعمل بنظام تصحيح الأخطاء (ECC) إلى لوحة جديدة تعمل بنظام تصحيح الأخطاء (ECC). وسيخصص اعتماد لشراء مجلس إدارة مركز المؤسسة الجديد مقابل المجلس الذي ليس مجلس إدارة مركز المؤسسة.
يساعدك المخطط الانسيابي أدناه على تحديد مكون موجه الإنترنت من السلسلة Cisco 12000 Series المسؤول عن رسائل خطأ تصحيح التماثل/الخطأ (ECC) على معالج توجيه جيجابت (GRP).
ملاحظة: يمكنك التقاط سجلات إخراج وحدة التحكم الخاصة بدعم التقنية وتسجيلها وتجميع جميع ملفات crashinfo أثناء أحداث خطأ التماثل/تصحيح الأخطاء (ECC).
يساعدك المخطط الانسيابي أدناه على تحديد مكون بطاقة خط موجه الإنترنت Cisco 12000 Series Internet Router المسؤول عن رسائل خطأ تصحيح التماثل/الخطأ (ECC):
ملاحظة: كلما تعرضت بطاقة خط لحدث خطأ التماثل/ECC، قم بجمع أكبر قدر ممكن من المعلومات (راجع أستكشاف أخطاء بطاقات الخط وإصلاحها على موجه الإنترنت من السلسلة 12000 من Cisco للحصول على تفاصيل).
يتعافى موجه الإنترنت Cisco 12000 Series من أخطاء التماثل في ذكريات بطاقات الخط الأخرى (SDRAM و SRAM) دون يتعطل.
يمكن الإبلاغ عن البيانات ذات التماثل غير الصحيح بواسطة العديد من أجهزة التحقق من التماثل لأي عملية قراءة أو كتابة على موجه الإنترنت Cisco 12000 Series Internet Router.
يستخدم GRP-B و PRP تصحيح أخطاء البت الواحد واكتشاف أخطاء البت المتعددة ECC إلى الذاكرة المشتركة (SDRAM). يتم تصحيح خطأ بت واحد في SDRAM تلقائيا، ويستمر النظام في العمل بشكل طبيعي.
يحتوي PRP و GRP-B على وحدة التحكم المحسنة في ذاكرة الوصول العشوائي الديناميكية (DRAM) التي تدعم نظام تصحيح الأخطاء (ECC). لذلك، فإنها يمكن أن تصحح أخطاء بت واحدة والإبلاغ عن أخطاء متعددة بت. يبدو تصحيح خطأ بت واحد كما يلي:
%Tiger-3-SBE: Single bit error detected and corrected at <address>
يتم تصحيح شبكات SBE بواسطة دائرة تصحيح الأخطاء ولا تؤثر على وظائف بروتوكول GRP-B أو بروتوكول PRP. لا يتطلب أي إجراء لأخطاء البت الواحد، ما لم تحدث بشكل متكرر. في هذه الحالة، من المستحسن إستبدال لوحة المعالج.
يتم الإبلاغ عن اكتشاف خطأ متعدد وحدات بت من خلال إستثناء خطأ ناقل أو إستثناء خطأ تماثل ذاكرة التخزين المؤقت لوحدة المعالجة المركزية.
يتم الإبلاغ عن رسالة خطأ تماثل ذاكرة المعالج إذا اكتشفت وحدة المعالجة المركزية خطأ تماثل عند الوصول إلى ذاكرة التخزين المؤقت الخارجية للمعالج (L3 على بروتوكول GRP) من خلال ناقل SysAD أو أي من ذكريات ذاكرة التخزين المؤقت الداخلية لوحدة المعالجة المركزية (L1 أو L2). يعرض الجدول 1 أمثلة للرسائل التي سيتم طباعتها لكل نوع من أخطاء تماثل ذاكرة التخزين المؤقت:
الجدول 1: موقع خطأ تماثل ذاكرة التخزين المؤقت
موقع خطأ التماثل | رسالة خطأ |
---|---|
ذاكرة التخزين المؤقت للأوامر من المستوى الأول | خطأ: أساسي، ذاكرة تخزين مؤقت مثبته، حقول: بيانات |
ذاكرة التخزين المؤقت للبيانات من المستوى الأول | خطأ: أساسي، ذاكرة تخزين مؤقت للبيانات، حقول: بيانات |
الذاكرة الحاجبة للأوامر من المستوى الثاني | خطأ: SysAD، ذاكرة تخزين مؤقت مثبتة، الحقول: البيانات |
ذاكرة التخزين المؤقت للبيانات من المستوى الثاني | خطأ: SysAD، ذاكرة تخزين مؤقت للبيانات، الحقول: البيانات |
ذاكرة التخزين المؤقت للأوامر من المستوى الثالث | خطأ: SysAD، ذاكرة تخزين مؤقت مثبتة، حقول: الكلمة الأولى |
ذاكرة التخزين المؤقت للبيانات من المستوى الثالث | خطأ: SysAD، ذاكرة تخزين مؤقت للبيانات، حقول: الكلمة الأولى |
مثال:
يشير السطر الأول من رسالة الخطأ إلى موقع خطأ التماثل، ويمكن أن يكون أي موقع مدرج في الجدول 1. في هذا المثال، يكون الموقع هو ذاكرة التخزين المؤقت للأوامر من المستوى الثالث.
Error: SysAD, instr cache, fields: data, 1st dword Physical addr(21:3) 0x000000, virtual addr 0x6040BF60, vAddr(14:12) 0x3000 virtual address corresponds to main:text, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01 2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01 Low Data High Data Par Low Data High Data Par DRAM Data: 0:0xAE620068 0x8C830000 0x00 1:0x50400001 0xAC600004 0x01 2:0xAC800000 0x00000000 0x02 3:0x1600000B 0x00000000 0x01
يجب أن يكون إخراج show version مماثلا لهذا:
...System was restarted by processor memory parity error at PC 0x602310D0, address 0x0 at 03:18:21 GMT Sun Oct 27 2002 ...
من إخراج show context، يمكنك أن ترى أنه قد تم إعادة تشغيل النظام من قبل إستثناء تماثل ذاكرة التخزين المؤقت:
Router#show context slot 11 CRASH INFO: Slot 11, Index 1, Crash at 19:08:07 CST Thu Nov 14 2002 VERSION: GS Software (GSR-P-M), Version 12.0(22)S1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) TAC Support: http://www.cisco.com/tac Compiled Mon 16-Sep-02 17:36 by nmasa Card Type: Route Processor, S/N LC uptime was 0 minutes. System exception: sig=20, code=0xE42F3E4B, context=0x52CF3D44 System restarted by a Cache Parity Exception STACK TRACE: -Traceback= 5020453C 500E5E24 5010E6DC 5015F89C 501E9F6C 501E9F58 ...
قم باستبدال بروتوكول GRP أو بروتوكول PRP بعد فشل ثان.
قد تظهر الرسالة التالية في إخراج وحدة التحكم:
SEC 7: %GRP-3-PARITYERR: Parity error detected in the fabric buffers. Data (8)
تعني هذه الرسالة أنه تم اكتشاف خطأ تماثل بواسطة جهاز واجهة البنية على GRP. يشير الرقم السداسي إلى الخطأ قطع متجه. يشير ذلك عادة إلى وجود مشكلة في الأجهزة في GRP التي تبلغ عن الخطأ (في هذه الحالة، slot 7). يجب إستبدال بروتوكول GRP المعيب في التكرار الثاني لظاهرة مماثلة.
تظهر رسالة الخطأ هذه عندما يستقبل الموجه بيانات ذات تماثل سيئ.
يتم الإبلاغ عن البيانات ذات التماثل غير الصحيح بواسطة العديد من أجهزة التحقق من التماثل لأي عملية قراءة أو كتابة يتم تنفيذها على موجه الإنترنت Cisco 12000 Series Internet Router.
يستخدم PRP تصحيح أخطاء البت الواحد واكتشاف أخطاء البت المتعددة ECC لمشاركة الذاكرة (SDRAM). يتم تصحيح خطأ بت واحد في SDRAM تلقائيا، ويستمر النظام في العمل بشكل طبيعي.
يتم تصحيح أخطاء البت الواحد (SBE) بواسطة دائرة تصحيح الأخطاء (ECC) ولا تؤثر على وظائف PRP. لا يتطلب أي إجراء لأخطاء البت الواحد ما لم تحدث بشكل متكرر.
إذا حدث الخطأ بشكل متكرر، فمن المستحسن إستبدال لوحة المعالج.
أخطاء SDRAM Single Bit Error-correction Code (ECC)
خطأ بت واحد هو بيانات بت واحدة غير صحيحة في كلمة تمت قراءتها من الذاكرة. بالنسبة لنظم SBE، يمكن تصحيح الخطأ دون تعطيل العمليات.
يتم اكتشاف أخطاء بت واحدة ويتم تقديم البيانات التي تم تصحيحها. على سبيل المثال، يتم الإبلاغ عن أخطاء بت واحد كما يلي في Engine 4/4+:
SLOT 6:Jul 19 07:37:34: %TX192-3-SDRAM_SBE: Error=0x2 - DIMM1 Syndrome=0x7600 Addr=0xBEA09 Data bit80-Traceback= 401C8C9C 401C9508 401CDE08 401CDE40 4007F674 4009ED0C 4009ECF8
يتم تصحيح SBE بواسطة دائرة تصحيح الخطأ ولا تؤثر على وظائف بطاقة الخط. لا يتطلب أي إجراء لأخطاء البت الواحد، إلا إذا حدثت بشكل متكرر. في هذه الحالة، من المستحسن إستبدال بطاقة الخط.
أخطاء نظام تصحيح الأخطاء (ECC) SDRAM متعددة البت
يوجد خطأ متعدد البت عندما يكون أكثر من بت غير صحيح في نفس الكلمة. بالنسبة ل MBEs، يتم اكتشاف الخطأ وتعطل بطاقة الخط. إن حدوث SBE و MBEs نادر جدا.
وفيما يلي مثال على الرسالة المطبوعة على وحدة التحكم إستجابة لخطأ ECC متعدد البت في SDRAM:
SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_SBE: Error=0x808 - DIMM0 Syndrome=0x31000000 Addr=0x81034 Data bit120 -Traceback= 401C8C9C 401C9508 40450018 400BF7D4 SLOT 5:Jul 25 16:58:51: %MCC192-3-SDRAM_MBE: Error=0x808 - DIMM0 Syndrome=0x18000000 Addr=0x80834 -Traceback= 401C8D88 401C9508 40450018 400BF7D4
لا يمكن تصحيح MBEs بواسطة ECC، وتسبب تعطل بطاقة الخط. ثم يتم إعادة تحميل بطاقة الخط وإعادتها إلى التشغيل الطبيعي بواسطة معالج التوجيه.
يمكن إستخدام تشخيصات الحقول للتحقق من ذاكرة بطاقة الخط ل MBEs. يتم اكتشاف MBEs بواسطة تشخيصات الحقل كأخطاء في الذاكرة. فيما يلي مثال للوحة تعرضت لخطأ متعدد البت في TX SDRAM الذي فشل في تشخيصات الحقول:
FDIAG_STAT_IN_PROGRESS(5): test #12 TX SDRAM Marching Pattern FD 5> RIM: FD 5> TX Registers FD 5> INT_CAUSE_REG = 0x00000680 FD 5> Unexpected L3FE Interrupt occured. FD 5> ERROR: TX BMA Asic Interrupt Occured FD 5> *** 0-INT: External Interrupt *** FDIAG_STAT_DONE_FAIL(5) test_num 12, error_code 1 Field Diagnostic: ****TEST FAILURE**** slot 5: last test run 12, TX SDRAM Marching Pattern, error 1 Field Diag eeprom values: run 5 fail mode 1 (TEST FAILURE) slot 5 last test failed was 12, error code 1
إذا كان لديك بطاقة خط QOC48 أو OC192، فارجع إلى هذا إشعار ميداني: QOC48/OC192 SBEs/MBEs. وإلا، يجب إستبدال بطاقة الخط بعد فشل ثان.
تحقق من قيمة حقل sig= في الإخراج show context slot [slot#]:
Router#show context slot 4 CRASH INFO: Slot 4, Index 1, Crash at 04:28:56 EDT Tue Apr 20 1999 VERSION: GS Software (GLC1-LC-M), Version 11.2(15)GS1a, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Compiled Mon 28-Dec-98 14:53 by tamb Card Type: 1 Port Packet Over SONET OC-12c/STM-4c, S/N CAB020500AL System exception: SIG=20, code=0xA414EF5A, context=0x40337424 System restarted by a Cache Parity Exception
بعض البطاقات القائمة على محرك إعادة توجيه المحرك 1 تكون عرضة لمشاكل تلف ذاكرة التخزين المؤقت الداخلية عند التشغيل في ظروف خاصة جدا للجهد ودرجة الحرارة.
ميزة إسترداد أخطاء ذاكرة التخزين المؤقت (CERF) هي ميزة برمجية في بطاقات خطوط Engine1 تقوم باكتشاف أخطاء تماثل ذاكرة التخزين المؤقت وتصحيحها من خلال مسح الأخطاء من ذاكرة التخزين المؤقت لوحدة المعالجة المركزية الخارجية، وتحديث سطر ذاكرة التخزين المؤقت من DRAM. توفر هذه الميزة ذكاء في خوارزمية إدارة ذاكرة التخزين المؤقت لوحدة المعالجة المركزية (CPU) الذي يتيح لوحدة المعالجة المركزية إمكانية إسترداد خطأ تماثل ذاكرة التخزين المؤقت، مما يمنع تعطل بطاقة الخط دون تكبد خطأ في الأداء.
ملاحظة: يعمل CERF بشكل افتراضي. يمكن مراقبة نشاط رمز تصحيح خطأ البرنامج (ECC) هذا بواسطة الأمر show controller cerf. لإيقاف تشغيل الميزة، أستخدم أمر التكوين العام no service cerf.
انظر إشعار ميداني: خطأ تماثل ذاكرة التخزين المؤقت على بطاقة GSR 1GE للحصول على معلومات إضافية.
لتحديد محرك إعادة التوجيه الذي تستند إليه بطاقة الخط، راجع كيفية تحديد بطاقة المحرك التي يتم تشغيلها في المربع؟ من موجه الإنترنت السلسلة 12000 من Cisco: مستند الأسئلة المتكررة.
إذا كانت بطاقة الخط تستند إلى المحرك 1، فإن الحل البديل هو ترقية برنامج Cisco IOS software إلى إصدار يحتوي على ميزة إسترداد خطأ ذاكرة التخزين المؤقت (CERF). كانت هذه الميزة متاحة أول مرة في برنامج Cisco IOS Software، الإصدار 12.0(21)S3. إذا كان لا يزال يتعطل بواسطة إستثناء تماثل ذاكرة التخزين المؤقت، فيجب إستبدال بطاقة الخط.
إذا كانت بطاقة الخط تستند إلى نوع محرك آخر، فيجب عليك إستبدال بطاقة الخط في التكرار الثاني لانهيار مماثل.
قد ترى الرسالة التالية في سجلات وحدة التحكم:
SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERRS: L3FE DRAM error 12 address 41E9B9A0 SLOT 2:Oct 23 17:07:45.531 EST: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 txbma 0 addr 0 dram 12 addr 41E9B9A0 io 0 addr 0 SLOT 2:Oct 23 17:07:45.531 EST: %GSR-3-INTPROC: Process Traceback= 40080BAC -Traceback= 40357084 40495D30 40496EE0 400CCF98
تشير هذه الرسالة إلى خطأ في تماثل كتابة CPU DRAM. يمثل L3FE محرك إعادة توجيه الطبقة 3. يجب إستبدال بطاقة الخط في التكرار الثاني لمشكلة مماثلة.
فيما يلي بعض رسائل الخطأ التي قد تواجهها:
في السجلات لبطاقة خط جيجابت ذات منفذ واحد:
SLOT 5: %LCGE-3-INTR: TX GigaTranslator external interface parity error
بالنسبة للوحات الأحدث، تم تعديل أحد الإصلاحات باستبدال TX GigaTranslator ASIC بصفيف بوابة قابل للبرمجة الميدانية (FPGA). وعند حدوث أمر مماثل في المرة الثانية، يجب إستبدال اللوحة.
في إخراج وحدة التحكم:
SLOT 6: %LC-3-ECC: Salsa ECC: About to handle ECC single bit error, ECC status = 2 DRAM error status = = 21 SLOT 6: %LC-3-L3FEERR: L3FE error: rxbma 0 addr 0 txbma 0 addr 0 dram 21 addr 200020 io 0 addr 0 SLOT 6: %LC-3-ECC: Salsa ECC: Addresses: Salsa returned =429BFDE8 correcting on = 429BFDE8 SLOT 6: %MEM_ECC-3-SBE: Single bit error detected and corrected at 0x429BFDE8 SLOT 6: %MEM_ECC-3-SYNDROME_SBE: 8-bit Syndrome for the detected Single-bit error: 0x8A SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 0x6299FB60 SLOT 1:Jun 10 05:29:47.690 EDT: %LC-3-ECC: Salsa ECC: About to handle ECC single bit error,ECC status = 0 DRAM error status =12 SLOT 6:Sep 26 15:18:01: %LC-3-SWECC: L2 event cleared: EPC = 0x40631CCC, CERR = 0xE40BB933, SysAD Addr = 1, total = 1 SLOT 0:Dec 7 13:48:11.480: %LC-3-SWECC_DATA: L2 event cleared: EPC = 0x400A8040, CERR = 0xA01DCE58, l1v = 0x41E3C20441E3C1C5, dv =0x41E3C1C441E3C204, SysAD Addr = 0, total = 1
يمكن تقسيم هذه الرسائل إلى الأجزاء التالية:
٪LC-3-ECC: Salsa ECC - يوجد خطأ في ASIC L3FE لبطاقة الخط.
٪LC-3-L3FEERR - يوجد خطأ في معلومات تسجيل ASIC لبطاقة الخط L3FE.
٪MEM_ECC-3-SBE - تم الكشف عن خطأ قابل للتصحيح من بت واحد في قراءة من DRAM. يمكن إستخدام الأمر show memory ecc لتفريغ أخطاء البت الفردية التي تم تسجيلها حتى الآن. هذه هي نفس رسالة الخطأ ٪MEM_ECC-3-SBE_LIMIT.
٪MEM_ECC-3-SYNDROME_SBE - متلازمة 8-بت لخطأ بت واحد تم اكتشافه. لا تشير هذه القيمة إلى مواضع وحدات بت بدقة في الخطأ، ولكن يمكن إستخدامها لتقدير مواضعها. هذه هي نفس رسالة الخطأ ٪MEM_ECC-3-SYNDROME_SBE_LIMIT.
بشكل أساسي، قامت بطاقة الخط بالإعلام عن خطأ أحادي البت وتم تصحيحه تلقائيا. لا يتطلب أي إجراء من الجزء الخاص بك، ما لم يحدث ذلك بشكل متكرر. في هذه الحالة، من المستحسن إستبدال بطاقة الخط.
٪LC-3-SWECC_DATA - يشير إلى أنه تم تصحيح حدث ذاكرة التخزين المؤقت في LC في الفتحة 0 من خلال رمز تصحيح خطأ البرنامج (SWECC).
هناك رسالة أخرى قد تصادفها:
SLOT 4: %MEM_ECC-3-SBE_HARD: Single bit *hard* error detected at 0x6299FB60
تعني هذه الرسالة أنه تم اكتشاف خطأ [خطأ ثابت] أحادي بت غير قابل للتصحيح على قراءة وحدة المعالجة المركزية من DRAM. يقوم الأمر show memory ecc بتفريغ أخطاء البت الفردية التي تم تسجيلها حتى الآن ويشير إلى مواقع عناوين الأخطاء الثابتة التي تم الكشف عنها.
مراقبة النظام باستخدام الأمر show memory ecc واستبدال DRAM إذا كان هناك عدد كبير جدا من تكرارات هذه الأخطاء.
قد ترى الخطأ التالي في إخراج وحدة التحكم:
SLOT 6: %LC-6-PSAECC: An TLU SDRAM ECC correctable error occurred address 19C49FD SLOT 2:035610: Feb 26 13:09:13.628 UTC: %LC-6-PSAECC: An PLU SDRAM ECC correctable error occurred address 1956059
وهذا يعني أن ASIC (PSA) ECC Protected SDRAM قد حددت خطأ من بت واحد قابل للتصحيح. لا يتطلب أي إجراء من الجزء الخاص بك، ما لم تحدث هذه الرسائل بشكل متكرر. في هذه الحالة، من المستحسن إستبدال بطاقة الخط.
يمكنك رؤية هذه الأخطاء في إخراج وحدة التحكم:
SLOT 6:00:03:53: %PM622-3-SAR_SRAM_PARITY_ERR: (6/0): Parity error in Reassembly SAR SRAM address: 80000000.Resetting the port SLOT 3:00:00:53: %PM622-3- SAR_MULTIBIT_ECC_ERR: (3/0): Multi-bit ECC Uncorrectable error in SAR SDRAM address: 80000000. Resseting the port. SLOT 4:00:00:53: %PM622-3 SAR_SINGLE_BIT_ECC_ERR: (3/0): ECC corrected an error in SAR SDRAM address: 800000. SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC: RX ALPHA: An PLU SDRAM ECC correctable error occured address 1000C254 SLOT 0:Jun 25 20:45:53 KST: %EE48-6-ALPHAECC2: RX ALPHA: An PLU SDRAM ECC multibit error occured at address 1000E254 SLOT 5:Nov 17 09:46:30.171: %EE48-6-ALPHA_PARITY: TX ALPHA: Transient SRAM64 parity corrected error 3E Data 0 100000 Parity bits 0 SLOT 10:Feb 21 16:55:36: %EE48-3-ALPHA_SRAM64_ERR: TX ALPHA: ALPHA_PST_RANGE_ERR error 11003F Data 0 0 Parity bits 0 SLOT 4:Jan 15 06:30:00.942 UTC: %EE48-2-GULF_TX_SRAM_ERROR: ASIC GULF: TX SRAM uncorrectable error detected. Details=0x0000 SLOT 0:Mar 16 19:50:22.464 cst: %EE48-4-QM_ZBT_PARITY: ToFab Address 0xB95E Data 0x1 SLOT 5:May 17 06:17:35.507: %EE48-4-QM_NON_ZBT_PARITY: ToFab Error 0x10000028 SLOT 5:May 17 06:17:53.883: %EE48-4-QM_ZBT_PARITY_TRANSIENT: FrFab Address 0x0 Data 0x7E SLOT 5:May 17 06:17:53.883: %EE48-4- GULF_RX_TB_PARITY_ERROR: ASIC GULF: RX telecom bus parity error on port 0 SLOT 1:Dec 13 00:27:42: %EE48-3-SRAM_PARITY: SRAM parity: Unable to find shadow 281B9EB4 SLOT 0:Aug 4 08:55:37: %EE48-3-QM_PARITY: FrFab Address 0x1859E Data 0x10 SLOT 0:Aug 4 08:55:37: %EE48-3-QM_ERROR: FrFab error register 0x80000.
قد تواجه الرسائل التالية على بطاقات الخط المستندة إلى Engine 4/4+:
SLOT 4: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - Parity error on rx_pbc_mem. -Traceback= 401C37C0 403D8814 400BE1EC SLOT 4: %LC-3-ERR_INTR: Error interrupt occurred -Traceback= 400CE028 400C8DF0 40010A24
أو
SLOT 3: %RX192-3-HINTR: status = 0x4000000, mask = 0x3FFFFFFF - Parity error on rx_pbc_mem. -Traceback= 406012E0 406972A0 400C555C %FIB-3-FIBDISABLE: Fatal error, slot 3: IPC failure
أو
SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_SBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_SBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 5:Apr 26 11:56:08.160: %MCC192-3-SDRAM_MBE: Error=0x200 - DIMM1 Syndrome=0x3000 Addr=0x811C3 SLOT 10:Mar 6 05:05:26.965: %RX192-3-ADJ_MEM_MBE: phy addr 0x7905E648, offset 0xBCC9, old ecc 0x0, new ecc 0x0, bit -1, value 0x0 - MBE on Adjacency Memory.. SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 2:00:03:41: %MCC192-6-RED_PARAM1_MBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No SLOT 2:00:03:41: %MCC192-3-RED: Error=0x80000 - RED PARAM 1 ECC SBE Error. -Traceback= 405AF5E0 405B1CEC 406DFF7C 406E057C 400FC7E SLOT 2:00:03:41: %MCC192-6-RED_PARAM2_MBE: Parameter 1 - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x43, samebit No, diffbit No Sep 8 14:32:09 jst: %MEM_ECC-3-SYNDROME_SBE_LIMIT: 8-bit Syndrome for the detected Single-bit error: 0xD5
الأعراض لهذه المشكلة تشمل:
يتم تعطيل إعادة التوجيه السريع من Cisco على بطاقة الخط هذه
المنافذ المقترنة تبقى عالية/عالية
قد يتم إعادة تعيين بطاقة الخط تلقائيا
إذا لم تتم إعادة تعيين بطاقة الخط، فإن الحل البديل هو تنفيذ الأمر microCode reload<slot>:
لا تشير هذه الرسالة دائما إلى وجود مشكلة في الجهاز مع الوحدة النمطية RX192. قد تنتج بعض أخطاء برنامج Cisco IOS رسالة الخطأ هذه كأثر جانبي. إذا ظهرت هذه الرسالة مرة واحدة فقط، استمر في مراقبة اللوحة. سيتم إعادة تعيين الجهاز. إذا إستمرت المشكلة، فسيتم إعادة تعيين البطاقة تلقائيا. اتصل بممثل الدعم الفني ل Cisco للحصول على المساعدة إذا إستمرت هذه الرسالة.
يمكن التحقق من أحداث SBE في E4/E4+ باستخدام الأمر show controllers mcc192 ecc:
LC-Slot4#show controllers mcc192 ecc MCC192 SDRAM ECC Counters SBE = 0x0, MBE = 0x0 TX192 SDRAM ECC Counters SBE = 0x0, MBE = 0x0
يتناول هذا التقرير كلا من ذاكرة RX و TX.
يمكنك رؤية هذه الأخطاء في إخراج وحدة التحكم:
SLOT 1:Jun 26 20:45:53 KST: %EE192-6-WAHOOECC: RX WAHOO: An PLU SDRAM ECC correctable error occured address 20000254 SLOT 9:Sep 2 21:27:49.680 GMT+8: %MCC192-3-PKTMEM_SBE: Single bit error detected and corrected SLOT 14:Jul 18 07:19:24.637: RX_XBMA: 1-bit CPUIM_ECCERR1 error 0x2 SLOT 15:Jan 4 16:53:16.591: TX_XBMA: (1) QSRAM qinfo SBE detected. info: 0x82605455 SLOT 12:Dec 12 22:34:15: %EE192-4-BM_ERRSSS: FrFab BM BADDR ECC ERR info single bit error(s) corrected, error 8250F63E count: 2 SLOT 1:Nov 22 13:40:02 JST: %EE192-3-QM_ERROR: RX_XBMA OQLLM error error register 0x1 -Traceback= 40AE71AC 406078C4 405F5EC0 SLOT 7:001113: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRS: RX WAHOO: WAHOO_CSRAM_CNTRL_INT PIPE0 error 8 SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRSSS: RX WAHOO: WAHOO_FFCRAM_CNTRL_INT PIPE0 error 4 addr 3FBFAB8 agent 94 SLOT 7:001114: Oct 24 10:50:28.520 BST: %EE192-3-WAHOOERRSSSS: RX WAHOO: WAHOO_PPC_INT PIPE1 error pl_ctl 4000226 pl_aa_avl F9F7B pl_aa_end 7FF9 pl_aa_fatal 4800000 SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: RX WAHOO WAHOO_NFC_SRAM_MULTI_ECC_ERR multi-bit CSSRAM error SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_FFCRAM_CNTRL_INT MBE SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: FSRAM not OK WAHOO_FSRAM_CNTRL_INT ECC_1_BIT_EE | ECC_UNCORR_EE SLOT 6:Oct 4 16:48:00.487: %EE192-3-WAHOOERRS: WAHOO_CTCAM_CNTRL_INT multi-bit CSRAM error SLOT 1:00:01:14: WEEKLY_THROTTLE_SOCKEYE_SBE: SOCKEYE SBE: addr: 0xC2A007C0, synd: 0xC4 SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_TX+i: CBSRAM SBE TX: 1-bit CBSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CBSRAM_SBE_RX+i: CBSRAM SBE RX: 1-bit CBSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_TX+i: CSSRAM SBE TX: 1-bit CSSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSSRAM_SBE_RX+i: CSSRAM SBE RX: 1-bit CSSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_TX+i: CSRAM SBE TX: 1-bit CSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_CSRAM_SBE_RX+i: CSRAM SBE RX: 1-bit CSRAM error. SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_TX+throttle_i: TX FTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FW_TCAM_PRTY_RX+throttle_i: RX FTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_TX+throttle_i: TX CLTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_CL_TCAM_PRTY_RX+throttle_i: RX CLTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_TX+throttle_i: TX NFTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_NF_TCAM_PRTY_RX+throttle_i: RX NFTCAM PRTY error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_VMR: TCAM PRTY VMR error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_TCAM_PRTY_NO-VMR: TCAM PRTY NO-VMR error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_SBE_RX: FCRAM SBE TX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FCRAM_PER_CHIP_SBE_TX: FCRAM CHIP SBE error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FCRAM_PER_CHIP_SBE_RX: FCRAM CHIP SBE error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_TX: FSRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_FSRAM_SBE_RX: FSRAM SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_TX: FSRAM MBE RX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_W_ FSRAM_MBE_RX: FSRAM MBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_TX: ISERR TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_ISERR_RX: ISERR RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_TX: FCRAM SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_BM_FCRAM_SBE_RX: FCRAM SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_TX: QSRAM LINK SBE TX error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_LINK_SBE_RX: QSRAM LINK SBE RX error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_QEINFO_SBE_TX: QSRAM queue info sbe rx error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_QSRAM_BADDR_SBE_TX: qsram bad addr sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_ QM_QSRAM_BADDR_SBE_RX: qsram bad addr sbe rx error, status = 0x3 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_TX: oqllm sbe tx error, status = 0x2 SLOT 1:00:01:14: WEEKLY_THROTTLE_QM_OQLLM_SBE_RX: oqllm sbe rx error status = 0x3
يمكنك رؤية هذه الأخطاء في إخراج وحدة التحكم:
SLOT 0:Jan 14 08:53:44.581 GMT: %FIA-3-RAMECCERR: To Fabric ECC error was detected Single Bit Error RAM2 status = 0x8000 Syndrome = 0x0 addr = 0x0 SLOT 6:Apr 29 09:36:12: %E6LC-4-ECC_THRESHOLD: HERMES VID SBE exceeded threshold, possible memory failure SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_SBE: Head1 Syndrome=0x94 Addr=0xFFF2B -Traceback= 40544830 40546A90 40688C94 400EDC18 SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_SBE: Syndrome=0x59 Addr=0xFFF2B -Traceback= 40000830 40036A90 40555D44 400ddd23 SLOT 14:Dec 9 20:02:29: %E6_RX192-6-PBC_SBE: Single bit error detected and corrected RLDRAM Syndrome=0x61 Addr=0xF855 Dec 9 20:02:33: %GRP-4-RSTSLOT: Resetting the card in the slot: 14,Event: linecard error report SLOT 4:06:21:43: %E6_RX192-3-ACL_SBE: ACTION MEM Syndrome=0x7 Addr=0x0 -Traceback= 40549740 4054A7E0 4068D814 400EE018 SLOT 6:Mar 28 03:30:19: %RX192-3-HINTR: status = 0x1000000000000, mask = 0x7FFFFF0FA320F - L3X SBE error. -Traceback= 405816DC 406A1010 406A1650 400F70E8 SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_SBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B SLOT 6:Nov 27 23:32:36: %HERA-3-PKTMEM_SBE: Single bit error detected and corrected Error=0x80 – Syndrome=0x5100000000000000 Addr=0x894620 Data bit116 SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_SBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_SBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 12:May 24 03:03:36: %HERA-6- UPF_SBE: Single bit error detected and corrected Error=0x60 – Syndrome=0x4100000000000000 Addr=0x451140 Data bit216 SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_SBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 9:May 5 18:52:14: %HERA-6-QM_FBF_SBE: Free Block FIFO - Single Bit Error detected and corrected Syndrom = 0x10, Addr = 0x778, samebit Yes, diffbit No SLOT 9:May 5 18:52:14: %HERA-3-QM: Error=0x40 - FBF RAM ECC SBE. -Traceback= 405AD4CC 405AF5D0 405F2E80 406DCDB8 406DD434 400FC500 SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_SBE: Average Queue Depth - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x89, samebit No, diffbit No SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_SBE: Statistics - Single Bit Error detected and corrected Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No SLOT 4:*Mar 13 23:38:19.295: %E6_RX192-3-MTRIE_MBE: Single bit error detected and corrected Head1 Syndrome=0x94 Addr=0xFFF2B SLOT 7:*Mar 4 1234:19.295: %E6_RX192-3-ADJ_MBE: Syndrome=0x59 Addr=0xFFF2B -Traceback= 40000830 40036A90 40555D44 400ddd23 00:00:18: %E6_RX192-3-PBC_MBE: ADJ OBANK LO Syndrome=0xE5 Addr=0x142 -Traceback= 405BF8B0 405C0F08 406E8D78 406E93B8 400FCCE0 SLOT 6:Mar 28 03:30:19: %E6_RX192-6-VID_MBE: Single bit error detected and corrected VID memory Syndrome=0x19 Addr=0xE51B SLOT 0:Apr 18 06:44:53.751 GMT: %HERA-3-PKTMEM_MBE: Error=0x1010 - Syndrome=0x9900000000 SLOT 7:Oct 2 23:32:36: %HERA-6- MCD_MBE: Single bit error detected and corrected Error=0x50 – Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 1:Jun 22 03:32:36: %HERA-6- MRW_MBE: Single bit error detected and corrected Error=0x50 - Syndrome=0x3100000000000000 Addr=0x331110 Data bit216 SLOT 13:Dec 5 07:30:15.272 cst: %HERA-6-PAM_ACL_MBE: PKT CNT MEM Syndrome=0x8 Addr=0x523C SLOT 9:May 5 18:52:14: %HERA-6-QM_FBF_MBE: Free Block FIFO - Single Bit Error detected and corrected Syndrome = 0x10, Addr = 0x778, samebit Yes, diffbit No SLOT 3:Aug 16 00:45:14: %MCC192-6-RED_AQD_MBE: Average Queue Depth - Single Bit Error detected and corrected Syndrome = 0x7, Address = 0x89, samebit No, diffbit No SLOT 2:Jan 23 06:29:56 KST: %MCC192-6-RED_STAT_MBE: Statistics - Single Bit Error detected and corrected Syndrome = 0x38, Address = 0xFF, samebit No, diffbit No
يمكنك رؤية هذه الأخطاء في إخراج وحدة التحكم:
SLOT 7:Jan 4 02:04:00.487: %SPA_CHOC_DSX-3-UNCOR_PARITY_ERR: SPA4/0: CHOC SPA parity error(s) encountered SLOT 7:Jan 4 02:04:00.487: %MCT1E1-3-UNCOR_PARITY_ERR: SPA5/0: T1E1 SPA parity error(s) encountered SLOT 3: 00:33:48: %MCT1E1-3-UNCOR_MEM_ERR: SPA3/0: 1 uncorrectable HDLC SRAM memory error(s) encountered. SLOT 1:Oct 3 14:42:45.727: %SPA_PLIM-4-SBE_ECC: SPA-4XT3/E3[1/2] reports 2 SBE occurrence at 1 addresses SLOT 1: Jul 22 05:26:29.613 UTC: %SPA_DATABUS-3-SPI4_SINGLE_DIP4_PARITY: SIP Sbslt 0 Ingress Sink - A single DIP4 parity error has occurred on the data bus. SLOT 4: Dec 2 22:44:05: %SPA_DATABUS-3-SPI4_SINGLE_DIP2_PARITY: SIP Sbslt 0 Egress Source - A single DIP 2 parity error on the FIFO status bus has occurred. SLOT 1:Oct 3 14:42:45.727: %SPA_PLIM-4-SBE_OVERFLOW: SPA-4XT3/E3[1/2] reports SBE table (2 elements) overflows SLOT 1:Oct 3 14:42:45.727: % SPA_PLUGIN-3-SPI4_SETCB: SPA-4XT3/E3[1/2] : IPC SPI4 set callback failed(status 2).
تتم تغطية جميع رسائل خطأ التماثل المتعلقة بتحويل بطاقات البنية بالتفصيل في أستكشاف أخطاء الأجهزة وإصلاحها لموجه الإنترنت من السلسلة 12000 من Cisco. وتتضمن هذه الرسائل (القائمة غير الحصرية):
%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x2. SLOT 1:%FABRIC-3-PARITYERR: To Fabric parity error was detected. Grant parity error Data = 0x1