簡介
本文檔介紹在以應用為中心的基礎設施(ACI)模式下更換Nexus 9500主幹交換機機箱的過程,該主幹交換機由於硬體問題而出現故障。
問題
當前有一個工作正常的ACI交換矩陣,Nexus 9500主幹出現故障。已確定故障是硬體故障,僅需要更換機箱。所有工作元件(管理引擎、線卡、交換矩陣模組等)都需要轉移到更換裝置中。
解決方案
完成以下步驟以替換骨幹:
- 斷開所有電源線以確保故障主幹已關閉。
- 從應用策略基礎設施控制器(APIC)GUI中選擇Fabric > Inventory > Unreachable Nodes。關閉電源幾分鐘後,此處將列出骨幹。記下其「名稱」和「節點ID」。
- 停用發生故障的脊柱並將其從控制器中移除。
- 在工作窗格中選擇骨幹。在「操作」(Actions)下拉選單中,選擇「停用」(Decommission)。
- 按一下「Remove from controller」單選按鈕,然後按一下「OK」。
提示:「從控制器中移除」選項會從ACI交換矩陣中完全移除節點,並且序列號會與節點ID取消關聯。使用「Regular」選項可臨時從ACI交換矩陣中刪除節點,期望同一節點將重新加入具有相同節點ID的交換矩陣。例如,如果節點需要臨時斷電進行維護。
附註:節點退出使用後,可能需要5-10分鐘才能將其從APIC GUI中移除和消失。
- 從機架上卸下故障主幹,然後安裝更換機箱。將所有工作元件轉移到新機箱中,與故障機箱中的配置相同。要傳輸的元件包括交換矩陣模組、管理引擎、系統控制器、電源、風扇托架和線卡。
- 通過控制檯連線到新機箱中的活動Supervisor,以清除其配置。
- 輸入cat /proc/cmdline命令以確定當前在Supervisor上運行的ACI映像。查詢「ksimg」部分。
提示:ACI交換機映像名稱始終以「aci-n9000」開頭。
- 使用ACI交換機映像名稱並輸入以下命令:
spine# /bin/prepare-mfg.sh
spine# reload
附註:<aci_image.bin>是APIC上ACI交換機映像的檔名。
- 如果錯過了重新載入視窗並且您無法重新載入裝置,請輸入vsh -c reload命令。
這會清除作用中Supervisor上的組態。重複步驟5以清除待命Supervisor上的組態。脊柱加入交換矩陣後,配置會自動從APIC下推。
- 在APIC GUI中,選擇Fabric > Inventory > Fabric Membership。主幹在工作窗格中列為一行,沒有節點ID、節點名稱和IP地址。按兩下該行,然後分配與之前相同的「節點ID」和「節點名稱」。
主幹在幾分鐘內收到IP地址,該地址反映在APIC GUI中。
主幹已完全重新加入ACI交換矩陣,APIC會自動向下推送所有相關策略。在這種情況下,節點ID為201的主幹的機箱出現故障。機箱被更換,其序列號被對映到相同的節點ID。然後,APIC將與節點201相關的所有策略推送到主幹,而無需進一步配置。