المقدمة
يصف هذا المستند عيوب البرامج الرئيسية التي يمكن أن تتسبب في حقن إطارات البيانات الفاسدة في بنية نظام الحوسبة الموحدة (UCS) كما هو محدد بواسطة عدادات أخطاء التحقق الدوري من تكرار الواجهة (CRC) أو تسلسل التحقق من الإطارات (FCS).
ملاحظة: لا يصف هذا المستند كيفية عزل نقطة حقن CRC.
معلومات أساسية
في بيئة UCS، يمكن أن تكون أخطاء CRC عالية التأثير. ويجب معالجة عزل سبب هذه الأخطاء والتخفيف من حدته بأولوية عالية.
ويعتمد التأثير على النقطة التي تحدث عندها المشكلة، والتي يمكن أن تمتد إلى هياكل متعددة وتؤثر على كل من اتصال إيثرنت ووصلة التخزين.
في حين أن الفشل المادي للمكونات (خاصة الكبلات والتهيئة الصغيرة القابلة للتوصيل (SFP)) هو السبب الأكثر شيوعا، هناك عيوب معروفة في البرامج يمكن أن تتسبب أيضا في أخطاء CRC.
تؤدي هذه العيوب إلى انخفاض قوة الإشارة بين المكونات المختلفة، مما يؤدي إلى تلف الإطارات.
أحد المفاهيم الرئيسية التي يمكنك الرجوع إليها هو إرتفاع العين وهو قياس سلامة الإشارة بين مكونات الطبقة المادية. إذا انخفض مستوى الإشارة تحت مستوى معين (يختلف بين المكونات)، فقد تتلف الإطارات التي يتم إرسالها أو استقبالها.
توصي Cisco بأن تكون قد قمت بمراجعة مشاكل الأداء المشتركة ل FlexPod، وخاصة فقدان الإطارات والحزم لتحديد مصدر أخطاء CRC غير المتغلغلة داخل بنية UCS و/أو محولات البث.
في حين أن المستند مخصص لعمليات نشر FlexPod، فإن القسم المذكور قابل للتطبيق على بيئات UCS غير FlexPod.
مؤشرات إلى الخلل ذي الصلة بلجنة حقوق الطفل
إذا كان لديك كابلات TwinAx في بيئة UCS، فمن المرجح أن تتأثر بواحد أو أكثر من هذه العيوب، حيث إن معظم العيوب تتعلق بالكابلات المستندة إلى Twinax.
البيئات التي تحتوي على كابلات ضوئية فقط لا تزال تواجه مشكلات، حيث إنه يمكن التحقق من أخطاء CRC بين المهايئ ووحدة الإدخال/الإخراج UCS (IOM). ومع ذلك، يقتصر هذا على خوادم معينة ولا يؤثر على خوادم أو هياكل متعددة في حالة وجود مشكلة في منفذ منفذ Server أو الوصلة.
إن يبدو أن disable/enable من ميناء في UCS إدارة يوقف قارن خطأ مع ما من إجراء إضافي مثل كبل مفتاح أو يعيد، تدقيق إضافي أن يدقق إن يكون خلل برمجية السبب الجذري من الإصدار.
إذا تم ملاحظة أخطاء CRC بعد جرات/إعادة تمهيد المنافذ المفاجئة، فإن هذه العيوب يمكن أن تكون سببا محتملا.
أوامر للتحقق من إرتفاع العين
مؤشر رئيسي على عيوب برامج CRC ذات الصلة هي قيمة منخفضة لارتفاع العين لمنفذ واحد أو أكثر.
الأوامر الشائعة المستخدمة للتحقق من ذلك هي:
المحولات القائمة على Nexus 5500:
show hardware internal carmel eye
الموصلات الليفية البينية ل UCS 6200:
connect nxos a
show hardware internal carmel eye
exit
connect nxos b
show hardware internal carmel eye
exit
نموذج للمخرجات يظهر إرتفاع عين جيد (200 ميجابت):
UCSB-5-A(nxos)# show hardware internal carmel eye
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
| Port | Eye Height | Eye Width | Raw values | Time measured |St|20|21|22|23|24|25|26|2E|2F|
+-------+------------+-------------+------------+----------------------------+--+--+--+--+--+--+--+--+--+--+
Eth 1/1 | 200 mv | 796 mUI | 40/ 33 | 08/31/2016 16:48:52.345248 |a9|ee|82|00|00|6e|82|00|88|00|
fi0 | 200 mv | 843 mUI | 40/ 36 | 08/31/2016 16:48:52.350360 |00|00|00|00|00|00|00|00|00|00|
fi1 | 200 mv | 859 mUI | 40/ 37 | 08/31/2016 16:48:52.355470 |00|00|00|00|00|00|00|00|00|00|
على هذه المنصات، إذا كانت القيمة:
- أقل من 50 مللي فولت، تم العثور عليه لتشغيل أخطاء CRC
- 50 - 100mV، يمكن أن يتسبب في أخطاء CRC، ينصح بالتخفيف
- > 100 mV، يجب ألا تتسبب في أخطاء CRC
لا تنطبق الأوامر الواردة أعلاه على الموصلات البينية الليفية 6332 أو 6454 أو 6324
الوحدات النمطية UCS 2200 IOM:
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software woodside sts (Note: The HI number/s for the servers that you need to check)
dbgexec woo
kr_geteye HIxx
Ctrl-C to exit dbgexec mode
نموذج للمخرجات يظهر إرتفاع عين جيد (125 م/ث):
woo> kr_geteye HI31
[serdes] reg: 64/40h = 42ch
check_kr_status: HI31: up (kr_retries=0)
sent SPICO interrupt(20, 0, 49)
Vertical eye result 0x14
sent SPICO interrupt(20, 0, 49)
Horizontal eye result 0x28
HI31: 125.0 mV, 0.6250 UI (NORM)
الوحدات النمطية UCS 2300 IOM:
connect local-mgmt a or connect local-mgmt b
connect iom x
show platform software tiburon sts (Note the HI number/s for the servers you need to check)
dbgexec tib
kr_geteye 0 HIxx
Ctrl-C to exit dbgexec mode
نموذج للمخرجات يظهر إرتفاع عين جيد (156 م v):
tib> kr_geteye 0 HI31
Start eye measurement HI31...
bottom: -73.5 (mV), top: 82.7 (mV), height: 156.2 (mV)
left: -0.34 (UI), right: 0.33 (UI), width: 0.69 (UI)
total time = 0.119456 sec
على هذه المنصات، إذا كانت قيمة الارتفاع:
- أقل من 90 مللي فولت، تم العثور عليه لتشغيل أخطاء CRC
- > 90 mV، يجب ألا يؤدي إلى أخطاء CRC
معيبونا
الارتباطات النسيجية
ويلاحظ هذا العيب على منافذ Fabric Interconnect، مثل الوصلة ومنافذ الخادم.
ثابت في UCS Infrastructure، 2.2(3a)، ارجع إلى أداة البحث عن الأخطاء للإصدارات الأخرى التي تم إصلاحها.
- الخطأ القريب المتطابق الذي يؤثر لاحقا على البرنامج الثابت UCS:
CSCuw36398 يلاحظ أخطاء CRC على الكبل النحاسي
يظهر هذا العيب على منافذ Fabric Interconnect، مثل الوصلة ومنافذ الخادم
تم إصلاحه في البنية الأساسية ل UCS 2.2(7b). ارجع إلى أداة البحث عن الأخطاء للإصدارات الأخرى التي تم إصلاحها.
IOM ومهايئ
ويلاحظ هذا العيب بين واجهات المضيف (HIF) التابعة للمنظمة الدولية للهجرة وواجهات لوحة التوصيل الخلفية للمهايئات.
ومنذ ذلك الحين، تم العثور على أن هذا قد يحدث بسبب مشاكل اللوحة الخلفية للهيكل. إن يراقب أنت هذا إصدار، فتح طلب خدمة مع cisco TAC.
- CSCva47085 VIC1340+2304 IOM أهلي 40G خطوة تدريب سبب فقدان الاتصال
ويلاحظ هذا العيب بين HIF IOM و Adapters، مما يؤثر على الخوادم الفردية.
يجري التحقيق حاليا.
الفئة C
- يظهر CSCux31002 VIC 1227 CRCs عند إستخدام كبل twinax نشط.
البرنامج الثابت الثابت المستقل من الفئة C 2.0(9c). ارجع إلى أداة البحث عن الأخطاء للإصدارات الأخرى التي تم إصلاحها.
يتمثل شرط المشغل الخاص بهذا الخطأ في عكس الحكمة الشائعة بأن Active TwinAx من غير المحتمل أن يتسبب في مشاكل CRC بسبب نقل الطاقة النشط الخاص به.
Nexus 5500
- يحتاج CSCuj86736 إلى تحسين توليف DFE في محولات 55xxUP Series Switches - أخطاء RX CRC
وعلى الرغم من أنه ليس خطأ UCS بشكل محكم، إلا أنه لا يزال يظهر بشكل شائع في إختبارات UCS بسبب انتشار Nexus 55xx upStream. ارجع إلى أداة البحث عن الأخطاء للحصول على تفاصيل حول الإصدارات الثابتة.
الحلول/التخفيف
ارجع إلى ملاحظة الإصدار الخاصة بكل خطأ للحصول على تفاصيل محددة، ولكن إذا كنت قد عثرت على دليل على انخفاض في إرتفاع العين، فإن إغلاق/عدم إغلاق المنفذ يكون معقولا.
في حالة حدوث عيب في إرتفاع العين لدى المنظمة الدولية للهجرة/المهايئ، يمكن إعادة ضبط DCE في الواجهة. انتقل إلى الخادم > المحول > واجهة DCE > إعادة ضبط الموصلات كما هو مناسب.
يجب بعد ذلك التحقق من المخرجات لمعرفة ما إذا كان إرتفاع العين قد زاد إلى قيم جيدة وما إذا كانت عدادات CRC لم تعد تتزايد.
يمكن ان تكون هنالك حاجة إلى عدة جنيحات (عادة إلى 5) لزيادة إرتفاع العين بشكل كاف.
إذا لم يسترد إرتفاع العين بعد ظهور عدة وصلات، فقد يحدث فشل في المكونات المادية.
عندما يرفرف ميناء، كن على علم أن هذا يستطيع أطلقت اكتشاف ضحل بواسطة UCS Manager.
لا يؤثر اكتشاف سطحي في الظروف العادية على مستوى البيانات، ومع ذلك، هناك عيوب معروفة تؤثر على الخوادم النصلية B200-M4 (راجع CSCut61527 للتعرف على الخلل الأكثر شيوعا). اكتشاف ضحل يمكن أن يتحول إلى اكتشاف عميق، مما يمكن أن يؤدي إلى إعادة تمهيد نظام التشغيل المضيف.
توصي Cisco بمراجعة ملاحظات الإصدار الخاصة بإصدار مدير UCS الخاص بك بحثا عن العيوب الأخرى القابلة للتطبيق.
بجانب تفريغ المنفذ اليدوي كخطوة إسترداد تفاعلي، يمكن إستخدام معالجة خطأ المنفذ المستند إلى سياسة UCS في مدير UCS 2.2(4) والإصدارات الأحدث لتعطيل منافذ NIF عند رؤية أخطاء CRC. بينما يمكن أن يحد هذا الإجراء بسرعة من تأثير أخطاء CRC، يمكن أن يكون له إمكانية تعطيل تدفق حركة المرور، وبالتالي لا يتم تمكينه بشكل افتراضي ويجب توخي الحذر إذا قمت بتمكينه.
يقوم مدير UCS بإنشاء أخطاء لأخطاء CRC ويمكن مراقبة هذه الأخطاء عبر واجهة برمجة تطبيقات XML أو بروتوكول إدارة الشبكة البسيط (SNMP).