المقدمة
يصف هذا المستند خطوات فهم سيناريوهات إستبدال الأجهزة في قائمة التحكم في الوصول (ACI) واستكشاف أخطائها وإصلاحها.
معلومات أساسية
استخرجت المادة من هذا المستند من أستكشاف أخطاء البنية الأساسية المرتكزة على التطبيقات من Cisco وإصلاحها، الإصدار الثاني الكتاب، تحديدا اكتشاف البنية إستبدال الجهاز الفصل.
نظرة عامة
وخلال تطوير بنية قائمة على التطبيقات (ACI)، سيكون من الضروري إستبدال مكونات متعددة بما في ذلك: APICs ومحولات الأوراق ومحولات العمود الفقري وأجهزة IPN. وتتضمن أكثر أسباب الاستبدال شيوعا عمليات ترخيص المواد المسترجعة (RMA) وترقيات الأجهزة. تكون هذه الإجراءات موثقة بشكل جيد في أدلة تثبيت/ترقية Cisco، ويجب قراءة أحدث دليل قبل الاستبدال. سيتضمن هذا القسم نظرة أكثر عمقا حول كيفية عمل الإجراءات في إطار القلنسوة، فضلا عن إستعراض العديد من سيناريوهات أستكشاف المشكلات وحلها الأكثر شيوعا.
الإجراءات والتحقق
ملاحظة: بدءا من الإصدار 5.2(3) من محول قائمة التحكم في الوصول (ACI)، يمكن للمحولات التي تعمل بنظام التشغيل NXOS والمتصلة بمحول بنية قائمة تحكم في الوصول (ACI) مكتشف إستخدام نقطة الوصول (POAP) للتحويل إلى محول قائمة تحكم في الوصول (ACI).
إستبدال الأجهزة
ورقة
سوف تصل ورقة من مستودع RMA تشغل برنامج NXOS. يرجى الرجوع إلى القسم التالي المسمى "مشكلة: وصول إلى وضع NXOS" لتحويل الورقة بشكل صحيح إلى وضع ACI. إذا كنت تستخدم ورقة من نسيج مختلف أو مع التكوين السابق، فتأكد من إستخدام الأوامر "إزالة الحموضة باللمس" و"إعادة التحميل".
بعد إتمام الخطوات المذكورة أعلاه وأصبح المحول الطرفي الجديد جاهزا للتسجيل، قم بإزالة الورق المراد إستبداله من البنية من خلال الخيار "إزالة من وحدة التحكم".
سيقوم الخيار 'إزالة من وحدة التحكم' بإزالة العقدة بالكامل من APIC، مما يؤدي إلى تحرير معرف العقدة وارتباط SN وعنوان TEP الذي تم تعيينه من قبل APIC. تكون هذه العمليات مطلوبة عند إستبدال عقدة محول. يتم إستخدام الخيار "إلغاء الأمر" فقط عندما يكون التوقع هو أن نفس العقدة ستقوم بإعادة ضم البنية بنفس معرف العقدة و SN.
عندما لا يعود يتم رؤية المحول الطرفي الذي سيتم إستبداله على صفحة عضوية البنية، يمكن توصيل الورقة الجديدة بالنسيج عبر واجهات العمود الفقري. وحالما يكتشف ال APIC الورقة، ستظهر في مخزون القماش وتكون جاهزة للتسجيل. إذا لم يقم الجهاز الذي سيتم إستبداله بإصدار معرف العقدة الخاص به بعد، وتم تسجيل محول جديد بنفس معرف العقدة، سيتم طرح خطأ يشير إلى حقيقة أن المعرف مرتبط بالفعل بعقدة طرفية أخرى. لازم الغلط يطلع بعد شوي. إذا لم تظهر العقدة الجديدة في القائمة الفرعية "عضوية البنية"، فقد تكون هناك مشكلة في الكابلات؛ ويمكن التحقق من ذلك من خلال عرض جيران بروتوكول LLDP من خلال الأمر "show lldp neighbors detail" على محولات العمود الرئيسي المتصلة بالمحول الطرفي المرفق حديثا. لمزيد من التفاصيل حول عملية اكتشاف البنية، يرجى الرجوع إلى الفصل إعداد البنية الأولي".
إذا تم تعديل شبكة VLAN الموجودة أدناه، فيجب أن تكون جميع العقد الطرفية نظيفة عند إعادة التشغيل في نفس الوقت. إذا لم يتم تنظيف جميع المحولات الطرفية في نفس الوقت، سيتم إرسال محول معاد تحميله نظيفا إلى الإنترنت وسيتلقى الشبكة المحلية الظاهرية (VLAN) القديمة عبر بروتوكول LLDP من ورقة لم يتم تنظيفها بعد، وستفشل الورقة النظيفة المعاد تحميلها في التسجيل مع APIC. راجع الفصل إعداد البنية الأولية" للحصول على مزيد من التفاصيل.
نظرا لقيود النظام الأساسي، لا يمكن أن تكون أزواج أجهزة الكمبيوتر الافتراضية الخاصة مزيجا من محولات الوحدات الطرفية من الجيل الأول أو الجيل الثاني أو الأعلى. ولكن، في وقت كتابة هذه السطور، يمكن ان تمتزج اية ورقة من الجيل الثاني أو اعلى بأي ورقة أخرى من الجيل الثاني أو اعلى.
عمود فقري
ومثل الورقة، يمكن أن تصل إلى وضع NXOS اعتمادا على الأجهزة الرئيسية للعامود الرئيسي (مثل العمود الفقري النمطي). أستخدم الإجراء "مشكلة: وصول إلى وضع NXOS" ضمن السيناريوهات لتنفيذ التحويل.
عند إستبدال محول رئيسي، يجب على المستخدم مراعاة وظيفة عاكس مسار BGP. كأفضل ممارسة، يجب أن يكون هناك على الأقل محولين عموديين تم تكوينهما كعاكس مسار BGP للطبقة 3 من بناء Cisco ACI. يقع هذا التكوين في 'System > System Settings (إعدادات النظام) > عاكس مسار BGP' تحت عقد عاكس المسار. عند إستبدال محول رئيسي أو إزالته، تأكد من إجراء تغييرات التكوين المناسبة للحفاظ على عاكس مسار نشط، وتأكد على الأقل من عاكس مسار نشط بعد إكمال التغييرات.
راجع القسم "سياسات Pod — BGP RR / التاريخ والوقت / SNMP" في الفصل "الإدارة والخدمات الأساسية" للحصول على مزيد من المعلومات حول عاكس مسار BGP.
APIC
وأهم إعتبار عند القيام بعملية إستبدال لمعدات منع الحمل هو صحة مجموعة أجهزة منع الحمل الحالية. قبل الاستبدال، يجب الإبلاغ عن كافة APICs في المجموعة على أنها مناسبة تماما. في 4-2، تم إدخال أداة إضافية للتحقق من صحة مجموعة APIC عبر CLI:
apic1# acidiag cluster
Admin password:
Product-name = APIC-SERVER-L2
Serial-number = FCH2206W0RK
Running...
Checking Core Generation: OK
Checking Wiring and UUID: OK
Checking AD Processes: Running
Checking All Apics in Commission State: OK
Checking All Apics in Active State: OK
Checking Fabric Nodes: OK
Checking Apic Fully-Fit: OK
Checking Shard Convergence: OK
Checking Leadership Degration: Optimal leader for all shards
Ping OOB IPs:
APIC-1: 192.168.4.20 - OK
Ping Infra IPs:
APIC-1: 10.0.0.1 - OK
Checking APIC Versions: Same (4.2(1i))
Checking SSL: OK
Done!
عند إستبدال APIC، تأكد من ملاحظة متغيرات الإعداد الأولي الخاصة ب APIC الذي سيتم إستبداله، قبل إجراء عملية إلغاء تحميل APIC.
apic1# cat /data/data_admin/sam_exported.config
Setup for Active and Standby APIC
fabricDomain = POD37
fabricID = 1
systemName =apic1
controllerID = 1
tepPool = 10.0.0.0/16
infraVlan = 3937
GIPo = 225.0.0.0/15
clusterSize = 3
standbyApic = NO
enableIPv4 = Y
enableIPv6 = N
firmwareVersion = 4.2(1i)
ifcIpAddr = 10.0.0.1
apicX = NO
podId = 1
oobIpAddr = 10.48.176.57/24
قم بتجهيز APIC الجديد باستخدام إصدار البرنامج الصحيح وأعد إدخال قيم الإعداد الأولية المشار إليها سابقا. عند اكتمال الإعداد الأولي وتحميل APIC بالكامل، قم بإعادة تعيينه إلى البنية من واجهة المستخدم الخاصة بأحد APICs الأخرى في المجموعة.
إستبدال جهاز IPN
في بيئة متعددة الوصلات، قد يكون من الضروري إستبدال أحد الأجهزة المستخدمة ل IPN (الشبكة بين نقاط الوصول). قبل الاستبدال، يجب أن يكون لشبكة IPN تكرار نقطة إعادة التوجيه ثنائي الإتجاه PIM مكون في شكل نقاط وصول (RP) وهمية. دون وجود نقاط وصول عن بعد (RP) وهمية، إذا كانت العقدة المستبدلة هي RP، فسيكون هناك تقارب PIM وسيظهر فقد الحزم لجميع حركة مرور BUM المرسلة عبر IPN.
يرجى الرجوع إلى "تكوين RP" في الفصل "اكتشاف قوائم انتظار متعددة" للحصول على مزيد من المعلومات حول كيفية تكوين RP الوهمية.
إعادة تحميل نقي لخط APIC/الورقة/العمود الفقري
في بعض السيناريوهات، يتمثل الخيار الأفضل لاسترداد ورقة/عمود فقري لا ينضم إلى البنية في إجراء إعادة تحميل نظيفة للجهاز.
لا يوصى بإجراء إعادة تحميل نظيف على جهاز ينتظر دوره للترقية. يمكن أن تستغرق عملية إعادة التحميل النظيفة لأي جهاز فترة زمنية ممتدة.
يحتوي الأمر 'acidag touch' على خيارين، وهما التنظيف والإعداد. يزيل خيار نظيف كل بيانات النهج أثناء الاحتفاظ بتكوين شبكة APIC (مثل اسم البنية وعنوان IP وتسجيل الدخول). يزيل خيار الإعداد كلا من بيانات النهج وتكوين شبكة APIC. يشيع إستخدام خيار الإعداد عند نقل الأجهزة عبر PODS، حيث يجب تغيير معرف Pod، وفي العادة ستحتاج شبكة الإدارة إلى التحديث أيضا.
APIC
fab1-apic1# acidiag touch clean
This command will wipe out this device, Proceed? [y/N] y
fab1-apic1# acidiag reboot
This command will restart this device, Proceed? [y/N] y
ورقة/عمود فقري
fab1-leaf101# acidiag touch clean
This command will wipe out this device, Proceed? [y/N] y
fab1-leaf101# reload
This command will reload the chassis, Proceed (y/n)? [n]: y
يعمل الأمر 'acidag touch clean' عن طريق وضع ملف مخفي على الورقة في /mnt/pss يسمى .clean. عندما يتم تمهيد الورقة، يتم تشغيل برنامج نصي shell للتحقق مما إذا كان ملف .clean موجود. في حالة وجود ملف .clean ضمن /mnt/pss، يتم مسح تكوين النهج وإعادة تنزيل التكوين من APIC. إذا تم إدخال هذا الأمر ولم يتم إعادة تحميل العقدة، سيظل الملف موجودا وسيظل النهج محوها عند إعادة التحميل التالية، بغض النظر عن الوقت الذي انقضى منذ إدخال نظيف اللمس.
سيناريوهات أستكشاف الأخطاء وإصلاحها
المشكلة: الوصول إلى وضع NXOS
التحقق
في بعض الأحيان، عندما يتم شحن محول عبر RMA، يمكن أن يصل مع برنامج NXOS الذي لم يتم تكوينه بعد من خلال عملية التزويد بالطاقة على التشغيل التلقائي (POAP). عند قيام المستخدم بوحدات التحكم في هذا الجهاز، سيرى شكلا ما من الرسالة التالية:
إيقاف التشغيل التلقائي قبل اكتماله ومتابعة الإعداد العادي ؟(نعم/لا)
إذا كان الجهاز قد مر بالفعل من خلال نقطة الوصول (POAP)، فإن الطريقة الأبسط لتحديد ما إذا كانت إحدى الأوراق تقوم بتشغيل شفرة NXOS المستقلة هي البحث عن سطر "ملف صورة NXOS" في الإخراج "show version". إذا كان هذا الإخراج موجودا، فإن الورقة تقوم بتشغيل التعليمات البرمجية المستقلة وستحتاج إلى تحويلها إلى وضع واجهة سطر الأوامر. يمكن التحقق من وجود Kickstart وصور النظام ولن تكون موجودة إلا على ورقة تشغل صورة ACI، وذلك بالنظر إلى الصورة نفسها التي ستكون n9000 على انفراد و aci-N9000 على ACI.
نظام التشغيل NXOS المستقل
nxos-n9k# show version
Cisco Nexus Operating System (NX-OS) Software
.
.
.
Software
BIOS: version 07.17
NXOS: version 6.1(2)I3(4)
BIOS compile time: 09/10/2014
NXOS image file is: bootflash:///n9000-dk9.6.1.2.I3.4.bin
NXOS compile time: 3/18/2015 0:00:00 [03/18/2015 07:49:10]
ACI
aci-leaf101# show version
Cisco Nexus Operating System (NX-OS) Software
.
.
.
Software
BIOS: version 07.66
kickstart: version 14.2(1i) [build 14.2(1i)]
system: version 14.2(1i) [build 14.2(1i)]
PE: version 4.2(1i)
BIOS compile time: 06/11/2019
kickstart image file is: /bootflash/aci-n9000-dk9.14.2.1i.bin
kickstart compile time: 09/07/2019 10:25:16 [09/07/2019 10:25:16]
system image file is: /bootflash/auto-s
system compile time: 09/07/2019 10:25:16 [09/07/2019 10:25:16]
الحل
إذا تم شحن المحول أثناء تشغيل رمز NXOS، فستحتاج إلى تحويله إلى وضع واجهة التحكم في الوصول (ACI). يجب شحن المحول مع كل من NXOS وصورة واجهة التحكم في الوصول (ACI) في ذاكرة التمهيد المؤقتة (bootflash)، رغم أن هذه ليست الحالة دائما. ستبدأ صورة ACI ب 'aci-N9000'. إذا لم تكن صورة قائمة التحكم في الوصول (ACI) موجودة، فستحتاج إلى تحميلها يدويا على ذاكرة Bootflash (الذاكرة المؤقتة). يمكن تنفيذ ذلك عبر اتصال USB (يلزم الوصول المحلي) أو عبر SCP من APIC مباشرة (بافتراض أن كلا الجهازين موصلان عبر شبكة إدارة). فيما يلي إرشادات نسخ الصورة عبر SCP:
1. nexus-9000(config)# feature scp-server
2. apic1# scp -r /firmware/fwrepos/fwrepo/switch-image-name admin@standalone_switch:switch-image-name
ستحتاج الورقة بعد ذلك إلى أن يتم تكوينها لعدم تحميل صورة NXOS، وحفظ التكوين، وتغيير عبارات التمهيد إلى واجهة التحكم في الوصول (ACI).
1. (config)# no boot nxos
2. (config)# copy run start
3. (config)# boot aci bootflash:
4. (config)# reload
المشكلة: Leaf/Spine EPLD/FPGA غير صحيح، F1582
التحقق
سترى الأخطاء التالية في أخطاء محول Nexus 9000 ACI.
تم اكتشاف عدم تطابق في الإصدار F1582 FPGA. الإصدار الجاري تشغيله:0x(z) الإصدار المتوقع:0x(y)
من ال APIC CLI، ابحث عن كل مثال من خطأ F1582:
apic1# moquery -c faultInst -f 'fault.Inst.code=="F1582"'
ملاحظات EPLD
تحتوي المحولات ذات الوضع Cisco Nexus 9000 Series ACI على العديد من الأجهزة المنطقية القابلة للبرمجة (PLD) التي توفر وظائف الأجهزة في جميع الوحدات النمطية. توفر Cisco ترقيات إلكترونية لصور الأجهزة المنطقية القابلة للبرمجة (EPLD) لتحسين وظائف الأجهزة أو حل المشكلات المعروفة. تتضمن PLDs أجهزة منطقية إلكترونية قابلة للبرمجة (EPLDs) وصفيفات بوابة قابلة للبرمجة في الميدان (FPGA) وأجهزة منطقية معقدة قابلة للبرمجة (CPLDs)، ولكنها لا تتضمن ASICs.
يستخدم مصطلح EPLD لتغطية كل من FPGA و CPLDs.
إن الميزة في وجود ملفات EPLD لبعض وظائف الوحدات هي أنه عندما تكون تلك الوظائف بحاجة إلى ترقية، فما عليك سوى ترقية صور برامجها بدلا من إستبدال أجهزتها.
تعمل ترقيات صورة EPLD لوحدة الإدخال/الإخراج على تعطيل حركة مرور البيانات التي تمر عبر الوحدة النمطية لأنه يجب إيقاف تشغيل الوحدة لفترة وجيزة أثناء الترقية. وفي هيكل قابل لإضافة وحدات أخرى، يقوم النظام بعمليات ترقية EPLD على وحدة واحدة في كل مرة، وبهذا ففي أي وقت تقوم الترقية بتعطيل حركة مرور البيانات التي تمر عبر وحدة واحدة فقط.
توفر Cisco أحدث صور EPLD مع كل إصدار. عادة، تكون هذه الصور هي نفسها الموجودة في الإصدارات السابقة ولكن أحيانا يتم تحديث بعض هذه الصور. تحديثات صورة EPLD هذه ليست إلزامية ما لم يتم تحديدها خلاف ذلك. عندما تتيح Cisco ترقية صورة EPLD، تعلن ملاحظات الإصدار هذه عن توفرها، ويمكن تنزيلها من موقع Cisco على الويب.
عندما تتوفر صور EPLD جديدة، يوصى دائما بإجراء الترقيات إذا كانت بيئة الشبكة تسمح بفترة صيانة يكون فيها مستوى ما من تعطل حركة المرور مقبولا. بشكل عام، ستكون هناك حاجة إلى ترقيات EPLD عند إضافة وظائف أجهزة جديدة نتيجة ترقية البرامج.
قد تكون هناك أيضا أسباب مختلفة للحاجة إلى ترقية البرامج الثابتة EPLD أثناء وجودها بالفعل في وضع واجهة التحكم في الوصول (ACI):
- تطلبت إصدارات EPLD ترقية قبل تحويل وضع تمهيد Cisco NX-OS إلى ACI ولم تتم ترقية FPGA/EPLDs.
- تمت ترقية الورقة/العمود الرئيسي يدويا (بدلا من ترقية السياسة من APIC)، والتي لا تتضمن ترقية EPLD.
بمجرد إضافة الورقة أو العمود الفقري إلى البنية، عندئذ سيتم ترقية EPLD تلقائيا مع أي ترقية للنهج (يتم بدء الترقية العادية من علامة التبويب "البرنامج الثابت ل APIC") حيث يتوفر إصدار جديد من EPLD.
الحل
في الإصدارات الأقدم من ACI، كان من الضروري خفض درجة الورق/العمود الفقري المعني ثم ترقيته، ولكن اعتبارا من 11.2(1m)، هناك برنامجان من Shell متاحان للمستخدم المسؤول مما يبسط العملية إلى حد كبير.
fab1-leaf101# /bin/check-fpga.sh FpGaDoWnGrAdE
fab1-leaf101# /usr/sbin/chassis-power-cycle.sh
يعيد البرنامج النصي '/usr/sbin/chassis-power-cycle.sh' ضبط الطاقة، بالمقارنة مع 'reload' الذي هو ببساطة إعادة تشغيل للبرنامج. عند ترقية EPLD، يلزم إزالة الطاقة بالكامل لإعادة برمجة البرنامج الثابت على بطاقات الخط. في حالة عدم توفر '/usr/sbin/chassis-power-cycle.sh' أو عدم عمله، يلزم إزالة كبلات الطاقة لمدة 30 ثانية على الأقل ثم إعادة إرفاقها لاستعادة الطاقة.