簡介
本文檔介紹用於替換交換矩陣群集中由於硬體問題導致故障的單個APIC的流程。
問題
存在可操作的以應用為中心的基礎設施(ACI)交換矩陣,並且應用策略基礎設施控制器(APIC)出現故障。確定故障與硬體問題有關,必須更換整個裝置。
解決方案
完成以下步驟即可解決此問題:
- 確定發生故障的APIC和當前的交換矩陣設定:
- 從運行APIC的Web介面中選擇System > Controllers。
- 在螢幕左側,選擇Controllers >(any APIC)> Cluster。
- 出現故障的APIC在Operational State列中顯示為Unavailable。請注意發生故障的APIC的交換矩陣名稱、目標大小和節點ID,以及隧道終端(TEP)地址空間:
提示:也可以在APIC的CLI中輸入acidiag avread命令以獲取此資訊。
- 停用失敗的APIC:
- 突出顯示出現故障的APIC。
- 在「操作」(Actions)下拉選單中,選擇「停用」(Decommission)。APIC現在可更改為「服務外管理」狀態。
- 從機架中取出故障的APIC並安裝更換部件。新的APIC可以引導至初始設定指令碼。
- 使用您在步驟1中收集的資訊來匹配失敗的APIC的值並繼續執行設定指令碼。
註:確保使用從舊APIC中記錄的相同配置設定(如交換矩陣名稱、控制器ID和TEP地址池)。如果未能使用相同的設定配置APIC,可能會導致交換矩陣進入部分發散狀態。此外,替換APIC必須運行與其餘兩個APIC相同版本的ACI軟體才能加入群集。
- 委託新的APIC:
- APIC啟動後,在Cluster(群集)頁面上突出顯示Current Out of Service APIC(當前服務中斷APIC)。
- 從「操作」下拉選單中,選擇「佣金」。
APIC接收IP地址,該地址反映在APIC的Web介面中。
注意:發生這種情況之前最多可能需要10分鐘。新APIC還可以在其運行狀況狀態顯示為「完全適合」之前,在「可用」和「不可用」操作狀態之間循環。
- 要驗證新APIC是否已加入交換矩陣,請使用新APIC的CLI登入交換矩陣。使用登入時為交換矩陣的其餘部分配置的憑據。