يوضح هذا المستند كيفية حل أخطاء البنية التي تم الإعلام عنها في النظام الأساسي Cisco Nexus 7000. يتضمن أستكشاف أخطاء الموجزات المرجعية للتكرار الدوري للبنية وإصلاحها (CRCs) جمع البيانات وتحليل البيانات وعملية الاستبعاد من أجل عزل مكون المشكلة. يغطي هذا المستند الأنواع الأكثر شيوعا من أخطاء CRC الخاصة بالقناة الليفية.
فيما يلي رسم تخطيطي عالي المستوى لوحدة بنية Nexus 7018 باستخدام سلاسل M1:
تعطي الصورة السابقة نظرة عامة على المكونات المعنية عندما تجتاز الحزمة وحدة نمطية من النسيج. المرحلة 1 (S1)، المرحلة 2 (S2)، والمرحلة 3 (S3) هي المراحل الثلاث من بنية Nexus 7000، والأخطبوط هو محرك قائمة الانتظار، وسانتا كروز (SC) هو ASIC للقناة الليفية، والمثيل 1 و 2 هما مثيلا SC على Xbar. يعتبر هذا المستند XBAR واحد فقط. الرجاء تذكر أن معظم محولات Nexus 7000 Series تحتوي على ثلاثة XBAR أو أكثر مثبتة.
بافتراض وجود تدفق أحادي الإتجاه من الوحدة النمطية 1 (M1) إلى الوحدة النمطية 2 (M2)، يقوم المدخل Octopus-1 على M1 بإجراء تدقيق للخطأ على الحزم التي يستلمها من الجنوب، ويخرج Octopus-1 على M2 من الشمال. إذا تم اكتشاف CRC في S3، فقد تحدث مشكلة في S1 أو S2 أيضا، نظرا لأنه لا يتم إجراء فحص CRC في تلك المراحل. لذا، فإن الأجهزة المعنية بالمسار هي المدخل أخطبوط، هيكل، قضيب بناء، ومخرج أخطبوط.
في بنية M1/FAB1، يتم اكتشاف قوائم التحكم في الوصول إلى الإطارات (CRC) فقط على بطاقة خط الخروج (S3).
هنا عينة رسالة خطأ:
%OC_USD-SLOT1-2-RF_CRC: OC1 received packets with
CRC error from MOD 15 through XBAR slot 1/inst 1
يتم الإبلاغ عن ذلك بواسطة M1، والذي يشير إلى أنه استلم حزم باستخدام CRC غير صحيح من الوحدة النمطية 15 (M15) عبر فتحة XBAR 1/instance 1.
يصف هذا القسم أربعة من أكثر أنواع أخطاء CRC الليفية شيوعا.
%OC_USD-SLOT1-2-RF_CRC: OC1 received packets withوهذا يعني أن الوحدة النمطية في المنفذ 1 كشفت عن خطأ CRC من M15 إلى فتحة XBAR 1/المثيل 1. يتم الإشارة إلى الوحدة النمطية التي تنشأ فيها أخطاء CRC باسم وحدة الدخول النمطية (M15 في هذه الحالة)، والوحدة النمطية التي أبلغت عن المشكلة هي وحدة الخروج النمطية (M1). Xbar 1 هو الشريط المتقاطع الذي تم إستلام الحزمة فيه. يوجد مثالان لكل XBAR. في هذه الحالة، اكتشف M1 أخطاء CRC من M15 إلى مثيل 1 لفتحة XBAR.
CRC error from MOD 15 through XBAR slot 1/inst 1
%OC_USD-SLOT4-2-RF_CRC: OC2 received packets withفي هذه الرسالة، أبلغت الوحدة النمطية 4 (M4) عن خطأ CRC من M1. لاحظ أن معلومات XBAR مفقودة. يتعذر على النظام التأكد من XBAR الذي تم إجتياز الحزمة له. هناك كثير سبب، غير أن أكثر سبب شائع هو: المعلومة في النسيج رأس من الربط أمكن كنت فاسد، لذلك المصدر وحدة نمطية يستطيع لا يكون حددت؛ ال XBAR أن كان يجتاز أزلت من النظام منذ الخطأ يزيد. وبالتالي، لم يتم الإبلاغ عنه في رسالة syslog بالساعة.
CRC error from MOD 1
%OC_USD-2-RF_CRC: OC1 received packets withفي هذه الحالة، كشف جهاز عن CRC من الوحدة النمطية 16 (M16) حتى XBAR 1. ومع ذلك، لا توجد وحدة إستقبال. عندما يكتشف المشرف (SUP) وحدة تحكم في الوصول (CRC) واردة من وحدة البنية النمطية، لا يتم تسجيل معلومات الفتحة. عندما لا ترى معلومات الفتحات، اكتشف SUP المشكلة. هذا لا يعني أن العلة سيئة. مثلما تقوم الوحدة بالإبلاغ عن المشكلة، فهناك العديد من المكونات التي قد تتسبب في حدوث المشكلة، مثل M16 أو الهيكل (غير المرجح) أو Xbar 1 أو Sup.
CRC error from MOD 16 through XBAR slot 1/inst 1
%OC_USD-SLOT6-2-RF_CRC: OC2 received packets withالمصدر استخرجت وحدة نمطية من المدخل أخطبوط أن مصدر الربط سيئ. لا يعرف السائق الذي يثير مقاطعة لتسجيل رسالة الخطأ هذه دائما المدخل أخطبوط الذي نشأت منه الحزمة التالفة. هذا لأن بعض من البتات يستعمل in order to تمثل المدخل أخطبوط لا يستعمل. إذا كان النظام يحدد أن وحدات بت متعددة تم تشغيل وحدات البت غير المستخدمة هذه، فيجب أن يفترض النظام أن أي واحدة منها قد تكون المصدر، وهو ما يتسبب في تضمين رسالة الخطأ لجميع هذه الوحدات النمطية. اكتشف النظام أنه لا يمكن أن يكون لهذا النموذج 13 (M13) هذا التعارض بسبب عدم إستخدام وحدات بت هذه؛ وبالتالي، لم يتم تسجيلها كمصدر محتمل.
CRC error from MOD 11 or 12 or 14 or 15 or 16 or 17 or 18
تكشف بطاقات الخط الجديدة (M2) والوحدة النسيجية 2 (FAB2) بطاقات CRC في S1 أو S2 أو S3. عندما تحقق في التفاصيل والعثور على أنماط في رسائل الفشل والتسجيل، فإنها تساعد على عزل المكون الخاطئ.
فيما يلي بعض الأسئلة التي ينبغي طرحها:
تتيح لك الإجابات على هذه الأسئلة إمكانية التعامل مع إجراء أستكشاف الأخطاء وإصلاحها من زاوية من المرجح أن تؤدي إلى حل أسرع.
ينشئ هذا القسم إطارا عاما يستخدم لاستكشاف أخطاء هذه المشاكل وإصلاحها.
يوفر هذا القسم أمثلة على كيفية أستكشاف أخطاء المشاكل المماثلة وإصلاحها.
%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT1-2-RF_CRC: OC2 received packets with CRC error from MOD 7
%OC_USD-SLOT3-2-RF_CRC: OC2 received packets with CRC error from MOD 7
لبضع ساعات، تظهر أخطاء مركز crc على M1 والوحدة النمطية 3 (M3) التي تأتي من الوحدة التعليمية 7 (M7) فقط.
هناك xbar سيئ أو غير مستقر يقوم بإفساد الحزم المتجهة إلى M7، أو M7 سيئ أو متصالب.
إذا كان لديك ثلاثة XBAR مثبتة، فإنها توفر لك تكرار N+1. وبالتالي، يمكنك إيقاف تشغيلها مرة واحدة في كل مرة (لا يتم إيقاف تشغيلها أكثر من مرة في أي وقت على الإطلاق) مع الحد الأدنى من التأثير فقط لمعرفة ما إذا تم حل المشكلة. دخلت هذا أمر in order to أتمت هذا عملية:
N7K(config)# poweroff xbar 1
<monitor>
N7K(config)# no poweroff xbar 1
N7K(config)# poweroff xbar 2
<monitor>
N7K(config)# no poweroff xbar 2
N7K(config)# poweroff xbar 3
N7K(config)# no poweroff xbar 3
في دراسة الحالة هذه، لم يتم حل المشكلة عند إيقاف تشغيل XBAR.
ونظرا لوجود وحدتين للإبلاغ عن أخطاء في نظام تصحيح الأخطاء (CRC)، فمن غير المرجح أن تكون هاتان الوحدتان (M1 و M3) هما السبب في ذلك. تتمثل الخطوة التالية في إعادة تركيب M7 (وحدة الدخول)، لأنه على الأرجح المكون المعيب. قد تتسبب هذه المشكلة في إستخدام أسطر متدلية غير مثبتة، ومن المستحسن إعادة إستخدام الوحدة النمطية قبل إستبدالها.
في دراسة الحالة هذه، إستمرت أخطاء CRC في التزايد على وحدة النسيج بعد إعادة بيع M7. اتصل بمركز المساعدة التقنية (TAC) من Cisco في هذه النقطة (أو قبل هذه النقطة) لاستبدال M7 نظرا لأن إعادة البيع لا تحل المشكلة.
في دراسة الحالة هذه، أوقف إستبدال M7 رسائل خطأ CRC الخاصة بالنسيج، وحل فقدان الحزمة.
%OC_USD-SLOT11-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT12-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT13-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT15-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT2-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT4-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT5-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT6-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT7-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
%OC_USD-SLOT8-2-RF_CRC: CRC error from MOD 12 through XBAR slot 3/inst 1
تقوم الوحدات النمطية المتعددة بالإبلاغ عن أخطاء CRC من الوحدة النمطية 12 (M12) التي تمر عبر XBAR 3.
الطراز XBAR 3 سيئ أو ذو بنية سيئة، أو الطراز M12 ذو بنية سيئة أو ذو بنية سيئة.
في هذه الحالة، يتم إيقاف تشغيل XBAR 3 مع الإجراء الموصوف مسبقا (في دراسة الحالة الأولى)، ويتم مراقبته لمزيد من الأخطاء. تم العثور على أن الأخطاء قد توقفت عند إيقاف تشغيل XBAR 3. عند هذه النقطة، تتم إعادة تعيين XBAR 3، ويتم توخي الحذر لضمان عدم انثناء أي سنون على المستوى الأوسط وأن الوحدة النمطية يتم إدراجها بشكل صحيح. بعد إعادة تمكين XBAR 3، لا تحدث المشكلة مرة أخرى. تنسب هذه المشكلة إلى وحدة Xbar النمطية القائمة على نظام التشغيل XBAR.
%OC_USD-SLOT6-2-RF_CRC: OC1 received packets with CRC error from
MOD 1 or 2 or 7 or 13 or 17 through XBAR
slot 1/inst 1 and slot 2/inst 1 and slot 3/inst 1
%OC_USD-SLOT6-2-RF_CRC: OC2 received packets with CRC error from
MOD 1 or 2 or 3 or 7 or 15 or 17 through XBAR
slot 2/inst 1 and slot 3/inst 1
%OC_USD-SLOT6-2-RF_CRC: OC1 received packets with CRC error from
MOD 1 or 2 or 5 or 7 or 16 or 17 through XBAR
slot 1/inst 1 and slot 2/inst 1 and slot 3/inst 1
تقوم الوحدة النمطية 6 (M6) بالإعلام عن الحزم التي تحتوي على أخطاء CRC التي تم استقبالها من علامات أسطر متعددة و XBARs.
M6 سيئ أو سيئ.
M6 هو السبب الأكثر ترجيحا لهذه المشكلة لأنه الوحدات النمطية الشائعة الوحيدة في جميع رسائل الخطأ. من بين جميع الوحدات النمطية المدرجة في رسائل الخطأ، هي تلك التي تظهر بشكل متناسق بشكل أكبر هي M6. لذلك، حاول إعادة إرسال M6 لمعرفة ما إذا تم حل المشكلة قبل إستبدالها.
في هذه الحالة، تتم إعادة تعيين M6، لكن الأخطاء لا تزال مستمرة. لذلك، أنت ينبغي فتحت cisco TAC حالة in order to استبدلت M6. بعد إستبدال M6، لا يتم الإبلاغ عن الأخطاء.
فيما يلي قائمة بالأوامر المستخدمة لاستكشاف الأخطاء وإصلاحها/تصحيح الأخطاء:
المراجعة | تاريخ النشر | التعليقات |
---|---|---|
1.0 |
13-Aug-2013 |
الإصدار الأولي |