المقدمة
يصف هذا وثيقة ما يسبب أخطاء التماثل على cisco مسحاج تخديد، وكيف أن يتحرى هم.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بكيفية أستكشاف أخطاء الموجه وإصلاحها.
راجع أستكشاف أخطاء الموجه وإصلاحها للحصول على مزيد من المعلومات.
المكونات المستخدمة
لا يقتصر هذا المستند على إصدارات برامج ومكونات مادية معينة.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
الاصطلاحات
راجع اصطلاحات تلميحات Cisco التقنية للحصول على مزيد من المعلومات حول اصطلاحات المستندات.
التعرف على خطأ تماثل
تحدث أخطاء تماثل الذاكرة في منتجات المعالجات التي تستند إلى معالج الواجهة متعدد القنوات (MIPS) مثل:
-
سلسلة موجهات طراز 4500/4700 من Cisco
-
الموجهات من السلسلة Cisco 7500 (RSP1، RSP2، RSP4، RSP8، VIP2-10، VIP2-15، VIP2-20، VIP2-40، VIP2-50)
-
سلسلة موجهات طراز 7000 (RSP 7000) من Cisco
-
الموجهات من السلسلة Cisco 7200 Series Routers (NPE-100، NPE-150، NPE-175، NPE-200، NPE-225، NPE-300)
-
سلسلة موجهات الإنترنت طراز 12000 من Cisco
فيما يلي بعض الرسائل، المرتبطة باكتشاف التكافؤ السئ في مكان ما في النظام (القائمة ليست شاملة، ولكنها تحتوي على أكثر الرسائل شيوعا):
-
في إخراج الأمر show version:
System restarted by processor memory parity error at PC 0x6014F7C0,
address 0x0
أو
System restarted by shared memory parity error at PC 0x60130F40
إن يتلقى أنت الإنتاج من عرض صيغة أمر من ك cisco أداة، أنت يستطيع استعملت cisco CLI محلل أن يعرض ممكن إصدار ونقطة معينة. لاستخدام Cisco CLI Analyzer (محلل واجهة سطر الأوامر من Cisco)، يجب أن تكون عميل مسجل، وأن تسجل دخولك، وأن يتم تمكين JavaScript.
-
في سجلات وحدة التحكم، أو في ملفات crashinfo:
- *** Cache Error Exception ***
Cache Err Reg = 0xa401a65a
data reference, primary cache, data field error , error on SysAD Bus
PC = 0xbfc17950, Cause = 0x0, Status Reg = 0x3040d007
- Error: primary data cache, fields: data,
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
Low Data High Data Par Low Data High Data Par
L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Low Data High Data Par Low Data High Data Par
Mem Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89
2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
- *** Shared Memory Parity Error ***
shared memory control register= 0xffe3
error(s) reported for: CPU on byte(s): 0/1
- %PAR-1-FATAL: Shared memory parity error
shared memory status register= 0xFFEF
error(s) reported for: CPU on byte(s): 0/1 2/3
- %RSP-3-ERROR: MD error 0000008000000200
%RSP-3-ERROR: QA parity error (bytes 0:3) 02
%RSP-3-ERROR: MEMD parity error condition
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
log 22010000, data 00000000 00000000
%RSP-3-RESTART: cbus complex
- %RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
- %RSP-3-ERROR: MD error 00800080C000C000
%RSP-3-ERROR: SRAM parity error (bytes 0:7) F0
%RSP-3-RESTART: cbus complex
أخطاء التماثل المادية مقابل الصعبة
هناك نوعان من أخطاء التماثل:
وقد أظهرت الدراسات أن أخطاء التماثل الليني أكثر تواترا من أخطاء التماثل الصلبة بعشر مرات إلى مائة مرة. لذلك، توصي Cisco بشدة بأن تنتظر لخطأ تماثل ثان قبل أن تستبدل أي شيء. وهذا يقلل كثيرا من التأثير على شبكتك.
عزل المشكلة
يحتوي الموجه على ذاكرة في مواقع مختلفة. نظريا، أي موقع ذاكرة يستطيع كنت يتأثر بخطأ التماثل، غير أن معظم مشاكل الذاكرة تحدث في ذاكرة الوصول العشوائي الديناميكية (DRAM) أو ذاكرة الوصول العشوائي المشتركة (SRAM). استنادا إلى النظام الأساسي، وإليك كيفية اكتشاف موقع الذاكرة الذي تم التأثر به، وإذا تبين أنه خطأ في التماثل، فما هو الجزء الذي يجب إستبداله:
أنظمة Cisco 4500 و 4700
على الأنظمة الأساسية Cisco 4500 و 4700، لا يتوفر ملف crashinfo في الإصدارات الأقدم من برنامج Cisco IOS® الإصدار 12.2(10) و 12.2(10)T.
تتمثل إحدى طرق اكتشاف مكان حدوث الخطأ في النظر إلى "سبب إعادة التشغيل" في سجلات وحدة التحكم، وفي إخراج الأمر show version:
-
خطأ تماثل في DRAM:
إذا لم تقم بإعادة تحميل الموجه يدويا بعد عطل، فإن إخراج show version يبدو كما يلي:
System restarted by processor memory parity error at PC 0x601799C4,
address 0x0
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
إذا كان ملف crashinfo متاحا، أو إذا تم التقاط سجلات وحدة التحكم، فيمكنك أيضا رؤية شيء مثل:
*** Cache Error Exception ***
Cache Err Reg = 0xa0255c61
data reference, primary cache, data field error , error on SysAD Bus
PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007
يشير التكرار في أخطاء التماثل في DRAM إلى أن DRAM أو الهيكل معيب. في حالة إزالة الهيكل مؤخرا أو في حالة إجراء أي تغييرات في تكوين الأجهزة، فعليك إعادة تثبيت شرائح DRAM لحل المشكلة. خلاف ذلك، استبدل ذاكرة الوصول العشوائي (DRAM) كخطوة أولى. يجب أن يؤدي ذلك إلى منع أخطاء التماثل. إذا كان الموجه لا يزال يتعطل، فاستبدل الهيكل.
-
خطأ تماثل في SRAM:
إذا لم تقم بإعادة تحميل الموجه يدويا بعد عطل، فإن إخراج الأمر show version يبدو كما يلي:
System restarted by shared memory parity error at PC 0x60130F40
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
إذا كان ملف crashinfo متاحا، أو إذا تم التقاط سجلات وحدة التحكم، فيمكنك أيضا رؤية شيء مثل:
*** Shared Memory Parity Error ***
shared memory control register= 0xffe3
error(s) reported for: CPU on byte(s): 0/1
أو
%PAR-1-FATAL: Shared memory parity error
shared memory status register= 0xFFEF
error(s) reported for: CPU on byte(s): 0/1 2/3
أو
*** Shared Memory Parity Error ***
shared memory control register= 0xffdf
error(s) reported for: NIM1 on byte(s): 0/1 2/3
ملاحظة:
-
إذا تم الإبلاغ عن الخطأ لوحدة المعالجة المركزية، فاستبدل ذاكرة SRAM.
-
إذا تم الإبلاغ عن الخطأ ل NIM(x)، فاستبدل الوحدة النمطية للشبكة في slot (x). كما يمكن أن تتأثر ذاكرة SRAM المخصصة للفتحة (x). في هذه الحالة، استبدل SRAM.
تشير أخطاء التماثل المتكررة في ذاكرة SRAM إلى شرائح SRAM معيبة أو وحدة شبكة معيبة كتبت تماثل سيئ في ذاكرة SRAM. إذا قمت بإزالة الهيكل مؤخرا أو إذا قمت بإجراء أي تغييرات في تكوين الأجهزة، فعليك بإعادة تثبيت وحدات الشبكة وشرائح ذاكرة SRAM لحل المشكلة. وإلا، فتحقق من مكان الإبلاغ عن الخطأ في سجلات وحدة التحكم (راجع مثال الإخراج أعلاه).
معالج التوجيه/المحول (RSP)، ومحرك معالجة الشبكة (NPE)، ومنصات معالج التوجيه (RP)
كما هو الحال مع سلسلة Cisco 4000، يمكن أن تكون المشكلة بسبب DRAM أو SRAM الخاطئ لهذه الأنظمة الأساسية. كما يمكن أن تكون المشكلة بسبب وجود بطاقة معالج معيبة (RP أو RSP أو NPE). كما يمكن أن تبلغ Cisco 7000 و 7500 عن أخطاء التماثل الناتجة عن معالج واجهة معيب أو غير مستقر (Legacy xIP أو VIP).
تحقق من ملف crashinfo وسجلات وحدة التحكم بحثا عن إحدى رسائل الخطأ هذه:
خطأ تماثل في DRAM أو SRAM (MEMD)
بالنسبة لكل من RP و RSP و NPE، عادة ما ترى شيئا كهذا:
Error: primary data cache, fields: data, (SysAD)
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
أو ببساطة:
Error: primary data cache, fields: data, SysAD
phy21:3 0x201880, va14:12 0x1000, addr 63E01880
يشير هذا إلى وجود مشكلة في RSP نفسها. إذا حدثت المشكلة مرة واحدة فقط، فإنها على الأرجح مسألة عابرة.
تم سحب خطأ التماثل من SRAM
بالنسبة ل RSP، يمكن أن تبدو الرسالة كما يلي:
%RSP-3-ERROR: MD error 0000008000000200
%RSP-3-ERROR: QA parity error (bytes 0:3) 02
%RSP-3-ERROR: MEMD parity error condition
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
log 22010000, data 00000000 00000000
%RSP-3-RESTART: cbus complex
أو
%RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
في حالة عدم وجود مؤشر على معالج واجهة آخر يقوم بكتابة التماثل غير الصحيح في ذاكرة SRAM (على سبيل المثال، رسائل خطأ VIP2-1-MSG)، فإن السبب الأكثر ترجيحا لخطأ التماثل هو ذاكرة SRAM نفسها. في هذه الحالة، استبدل RSP.
إذا كانت رسائل الخطأ الأخرى تشير إلى أن معالج الواجهة يكتب تماثل سيئ، فقد تكون بطاقة معيبة أو غير مثبتة بشكل صحيح.
معالج الواجهة متعدد الاستخدام Versatile Interface Processor
إذا إستلمت ٪VIP2-1-MSG: رسائل slot(x) في السجلات أو في ملف crashinfo، ارجع إلى أستكشاف أخطاء الشخصية وإصلاحها.
الإجراءات الموصى بها
عند أول ظهور لخطأ التماثل، لا يمكن التفريق بين خطأ التماثل لين أو صلب. من التجربة، فإن معظم تكرارات التماثل عبارة عن أخطاء بسيطة في التماثل، ويمكنك عادة تجاهلها. إذا كنت قد قمت مؤخرا بتغيير بعض الأجهزة أو قمت بنقل المربع، فحاول إعادة تثبيت الجزء المتأثر (DRAM أو SRAM أو NPE أو RP أو RSP أو VIP). وتعني تكرارات التماثل المتعددة المتكررة وجود أجهزة معيبة. قم باستبدال الجزء التأثر (DRAM أو RSP أو VIP أو اللوحة الأم) بمساعدة التعليمات المذكورة في هذا المستند.
المعلومات التي سيتم تجميعها إذا قمت بفتح طلب خدمة TAC
إذا كنت لا تزال بحاجة إلى المساعدة بعد اتباع خطوات أستكشاف الأخطاء وإصلاحها أعلاه وتريد فتح طلب خدمة باستخدام مدير حالة دعم Cisco، فتأكد من تضمين هذه المعلومات: |
- تم إجراء أستكشاف الأخطاء وإصلاحها قبل فتح طلب الخدمة.
- إخراج أمر show technical-support (في وضع التمكين إن أمكن).
- إخراج الأمر show log أو التقاط وحدة التحكم إذا كان متوفرا.
- ملف crashinfo (إذا كان موجودا، ولا يتم تضمينه بالفعل في إخراج أمر show technical-support. إذا كانت هناك ملفات crashinfo متعددة، فقم بتضمينها جميعها).
- عدد مرات إعادة التحميل بسبب أخطاء تماثل ذاكرة المعالج التي قمت برؤيتها ووقت حدوثها.
بمجرد إنشاء الحالة، الرجاء إرفاق البيانات المجمعة بالحالة الخاصة بك بتنسيق نص عادي (.txt) غير مضغوط. لإرفاق معلومات بطلب الخدمة، قم بتحميلها من خلال أداة مدير حالة الدعم (للعملاء المسجلين فقط). إذا تعذر عليك الوصول إلى "أداة إدارة حالة الدعم"، فعليك إرفاق المعلومات ذات الصلة بطلب الخدمة الخاص بك، وإرسالها إلى موقع attach@cisco.com برقم طلب الخدمة الخاص بك في سطر موضوع رسالتك. ملاحظة: لا تقم بإعادة تحميل الموجه يدويا أو إعادة تشغيله قبل تجميع المعلومات الواردة أعلاه ما لم تكن مطلوبة لاستكشاف أخطاء تماثل ذاكرة المعالج وإصلاحها، لأن ذلك قد يؤدي إلى فقدان معلومات مهمة تكون مطلوبة لتحديد السبب الجذري للمشكلة. |
معلومات ذات صلة