المقدمة
يوضح هذا المستند كيفية أستكشاف أخطاء بطاقة بطاقة البنية والتخزين (FSC) وإصلاحها عند "ThreshFabricEGQDiscards" SNMP trap.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:
المكونات المستخدمة
لا يقتصر هذا المستند على إصدارات برامج ومكونات مادية معينة.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
المشكلة
يتم ملاحظة خطأ "ThreshFabricEGQDiscards" عند ظهور حدث واحد منزعج (SEU) على مجموعة شرائح حافة البنية (FE) على بطاقة FSC واحدة في هيكل ASR5500. نظرا لقلب هذا البت في جداول FE، تبدأ رقاقة FE في تلف الحزم (الخلايا) في البنية مما يؤدي إلى ظهور مرتجعات قائمة انتظار الخروج مما يؤدي إلى حالات فشل في نبضات القلب بين البطاقات.
أنت يستطيع رأيت مثال من هذا مشكلة يستعمل الأمر خط قارن (CLI) أمر عرض snmp مصيدة محفوظات verbose.
Sat Jan 02 03:59:30 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 9 device 2 threshold 50 measured value 2430 interval 30
Sat Jan 02 03:59:30 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 9 device 1 threshold 50 measured value 2096 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 4 threshold 50 measured value 481 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 4 device 2 threshold 50 measured value 3761 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 4 device 1 threshold 50 measured value 3660 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 2 threshold 50 measured value 173 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 1 threshold 50 measured value 133 interval 30
Sat Jan 02 03:59:42 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 8 device 2 threshold 50 measured value 2977 interval 30
Sat Jan 02 03:59:42 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 8 device 1 threshold 50 measured value 4310 interval 30
Sat Jan 02 03:59:44 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 3 device 1 threshold 50 measured value 4499 interval 30
Sat Jan 02 03:59:44 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 3 device 2 threshold 50 measured value 4091 interval 30
Sat Jan 02 03:59:45 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 10 device 1 threshold 50 measured value 2796 interval 30
Sat Jan 02 03:59:45 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 10 device 2 threshold 50 measured value 5418 interval 30
Sat Jan 02 03:59:47 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 1 device 2 threshold 50 measured value 4747 interval 30
Sat Jan 02 03:59:47 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 1 device 1 threshold 50 measured value 5243 interval 30
Sat Jan 02 03:59:49 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 7 device 2 threshold 50 measured value 4644 interval 30
Sat Jan 02 03:59:49 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 7 device 1 threshold 50 measured value 5017 interval 30
يظهر هذا الخط ضمن وحدات تحكم وحدات المعالجة المركزية (CPU) متعددة البطاقات:
ملاحظة: بطاقة وحدة التحكم في تصحيح الأخطاء هي أمر مخفي/test. كما يتم تجميع هذا الأمر في كل مرة لجميع البطاقات على ASR5500 عند تشغيل الأمر show support detail على عقدة StarOS.
******** debug console card 1 cpu 0 tail 10000 only *******
Saturday January 02 05:45:38 EST 2016
[...]
2016-Jan-02+03:59:47.479 card 1-cpu0: afio [1/0/2701] [2862193.674] afio/afio_petrab_egress.c:121: #1: petrab=1=1/1, PetraB EGQ Egress drop threshold exceeded, drop count=5243, interval=30 secs, threshold=50
استكشاف الأخطاء وإصلاحها
تحقق ما إذا كانت حالات سقوط الخروج تتزايد.
ملاحظة: إذا كانت أخطاء البنية في تزايد وأنك تقوم بتشغيل عقدة StarOS في الإصدار 19.0 أو إصدار أحدث، فعليك المتابعة إلى قسم "الحل" في هذه المقالة.
ملاحظة: إذا كانت أخطاء البنية في تزايد وأنك تقوم بتشغيل إصدار منخفض لإصدار عقدة StarOs.19.0 الرجاء زيادة متطلبات الخدمة تجاه TAC.
الخطوة 1. دخلت إختبار أسلوب، هنا توثيق كيف أن يمكن هو على StarOS عقدة.
cli test-commands [encrypted] password password
الخطوة 2. تحقق من سلامة البنية.
show fabric health | grep -i -E "^Petra-B|EGQ"
مثال للإخراج عندما لا تكون المشكلة موجودة:
[local]#show fabric health | grep -i -E "^Petra-B|EGQ" Petra-B 1=1/1
Petra-B 2=1/2
Petra-B 3=2/1
Petra-B 4=2/2
Petra-B 5=3/1
Petra-B 6=3/2
[...]
مثال للإخراج حيث ترى زيادة في حزم EGQ المتجاهلة:
[local]#show fabric health | grep -i -E "^Petra-B|EGQ"
Petra-B 1=1/1
EGQ.RqpDiscardPacketCounter 1143278
EGQ.EhpDiscardPacketCounter 1143278
EGQ.PqpDiscardUnicastPacketCounter 1143278
Petra-B 2=1/2
EGQ.RqpDiscardPacketCounter 1068491
EGQ.EhpDiscardPacketCounter 1068491
EGQ.PqpDiscardUnicastPacketCounter 1068491
[local]#show fabric health | grep -i -E "^Petra-B|EGQ"
Petra-B 1=1/1
EGQ.RqpDiscardPacketCounter 1346022 <<<
EGQ.EhpDiscardPacketCounter 1346022 <<<
EGQ.PqpDiscardUnicastPacketCounter 1346022 <<<
Petra-B 2=1/2
EGQ.RqpDiscardPacketCounter 1271360 <<<
EGQ.EhpDiscardPacketCounter 1271360 <<<
EGQ.PqpDiscardUnicastPacketCounter 1271360 <<<
الحل
آلية الاسترداد التلقائي
نوع تغيير السلوك:
أمر واجهة سطر أوامر (CLI) جديد لتمكين إجراء الاسترداد/إعادة الضبط التلقائي لميزة FSC عند اكتشاف عمليات ترحيل لمخارج الموصلات البينية بشكل مفرط
تم تقديم الإصدار:
19.0
السلوك القديم:
عملية الاسترداد اليدوية لإعادة ضبط FSCs.
سلوك جديد:
أوامر تكوين واجهة سطر الأوامر (CLI) الجديدة، يرجى التحقق من الوثائق:
بنيوي fsc mise à recovery enable max-attempts <x>لتمكين هذه الميزة.
يقصد ب Max-Attempts عدد المرات التي تقوم فيها بإعادة ضبط كل FSCs. بشكل افتراضي، تكون محاولات الحد الأقصى غير محدودة.
أعجزت fabric fsc auto-recovery لتعطيل هذه الميزة.
يعرض عرض afctrl fsc-auto-recovery تفاصيل حول الاسترداد التلقائي ل FSC، بما في ذلك الأجهزة التي لم تتم إعادة ضبطها بعد، وإعادة ضبط العدد، الحد الأقصى للمحاولات، حالة حد إسقاط المخرج، ومحفوظات الاسترداد التلقائي ل FSC.
تحذير: التأثير على العميل: تتم إعادة تعيين أجهزة FSC FE ويتم فقد أي حزم في الطيران.
ملاحظة: يتم نسخ كافة القيم باستثناء المحفوظات عند فشل MIO.