問題陳述:
更換RAID控制器後,VD的NAA ID在外部配置匯入過程中發生更改,從而導致資料儲存裝載失敗。
受影響的硬體:
UCSB-MRAID12G
UCSC-MRAID12G
帶UCSB-MRAID12G RAID控制器的伺服器:
UCS B200 M4
UCS B200 M5
UCS B480 M5
UCS B420 M4
UCS C220 M4
UCS C240 M4
受影響的韌體:
RAID控制器韌體: 24.5.x.x和24.6.x.x
範例#
***mrsasctlr.24.5.0-0043_6.19.05.0_NA.bin
在3.2之前的所有UCSM版本中均可看到24.5.x.x控制器韌體。*
3.1 #版本說明
https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/release/notes/CiscoUCSManager-RB-3-1.htmlhttps://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/release/notes/CiscoUCSManager-RB-3-1.html
受影響的作業系統:
VMware ESXi
原因:
在舊韌體版本中,如果發現DDF(裝置資料格式)工作區版本不匹配,則控制器韌體無法在外部匯入期間從DDF恢復NAA ID。
MR6.4有DDF_WORK_SPACE版本1,而MR6.10有DDF_WORK_SPACE版本3。MR 6.4之後的FW更高版本進行了修復,允許控制器FW從DDF恢復NAA IDD,即使發現DDF工作區不匹配。 更換控制器韌體較舊時,無法正確分析NAA ID(示例:24.5.x和24.6.x)。 但是,24.12.x版本可以正確解析NAA ID。
更換前:
伺服器2/2: 配備的產品名稱:Cisco UCS B200 M5雙插槽刀鋒伺服器 配備的PID:UCSB-B200-M5 配備的VID:V06 配備的串列(SN):FCH222973K5 插槽狀態:已配備 確認的產品名稱:Cisco UCS B200 M5雙插槽刀鋒伺服器 確認的PID:UCSB-B200-M5 已確認VID:V06 確認串列(SN):FCH222973K5 確認的記憶體(MB):524288 確認的有效記憶體(MB):524288 確認的核心:28 已確認的介面卡:1 虛擬驅動器0: Type:RAID 1映象 塊大小:512 塊:1560545280 可操作性:可操作的 線上狀態:已配備 大小:761985 生命週期:已分配 驅動器狀態:最佳 剝離大小(KB):64 ACCESS POLICY:讀取/寫入 讀取策略:正常 配置的寫快取策略:直寫 實際寫快取策略:直寫 IO策略:直接 驅動器快取:不變 可啟動:正確 唯一識別符號:bcc0dd21-2006-4189-86c1-132017ad0958 供應商唯一識別符號:618e7283-72eb-6460-240f-d02c0bbd9310 <<<<<<<<<<<<<<<< 更換後: 伺服器2/2: 配備的產品名稱:Cisco UCS B200 M5雙插槽刀鋒伺服器 配備的PID:UCSB-B200-M5 配備的VID:V06 配備的串列(SN):FCH222973K5 插槽狀態:已配備 確認的產品名稱:Cisco UCS B200 M5雙插槽刀鋒伺服器 確認的PID:UCSB-B200-M5 已確認VID:V06 確認串列(SN):FCH222973K5 確認的記憶體(MB):524288 確認的有效記憶體(MB):524288 確認的核心:28 已確認的介面卡:1 虛擬驅動器0: Type:RAID 1映象 塊大小:512 塊:1560545280 可操作性:可操作的 線上狀態:已配備 大小:761985 生命週期:已分配 驅動器狀態:最佳 剝離大小(KB):64 ACCESS POLICY:讀取/寫入 讀取策略:正常 配置的寫快取策略:直寫 實際寫快取策略:直寫 IO策略:直接 驅動器快取:不變 可啟動:正確 唯一識別符號:7a894b44-721a-41ae-a3bf-380102b9e64e 供應商唯一識別符號:618e7283-72ea-3f20-ff00-005a0574b04b <<<<<<<<<<<<<<<<<<<
在本例中,伺服器2/2的[供應商唯一識別符號] id已從[618e7283-72eb-6460-240f-d02c0bbd9310]更改為[618e7283-72ea-3f20-ff00-005a0574b04b] |
如何避免觸及問題?
如果在插入VD/磁碟之前更新替換控制器的韌體,就可以避免此問題。
詳細步驟:
- 關閉伺服器
- 逐個卸下所有磁碟,使同一插槽未完全插入,以免影響其放置順序(如果從插槽中完全移出,請記下插槽註,因為驅動器必須放回同一插槽中)
- 安裝新的RAID控制器進行更換,無需插入磁碟。
- 伺服器將識別新的RAID控制器
- 更新Raid控制器的韌體。
- 韌體升級成功後,關閉伺服器電源,然後將磁碟插入伺服器。
- 現在開啟伺服器電源
如果伺服器遇到此問題,如何恢復?
詳細步驟:
===================
恢複資料儲存的過程
===================
1登入到vSphere客戶端,然後從清單面板中選擇伺服器。
2按一下「配置」頁籤,然後按一下「硬體」面板中的「儲存」。
3按一下新增儲存。
4選擇磁碟/LUN儲存型別,然後按一下下一步。
5從LUN清單中,選擇在VMFS標籤列中顯示資料儲存名稱的LUN,然後按一下下一步。
附註:「VMFS標籤」列中的名稱表示LUN是包含現有VMFS資料儲存區的副本的副本。
6在Mount Options下, 將顯示以下選項:
保留現有簽名:持續裝載LUN(例如,在重新啟動後裝載LUN)
分配新簽名:重新簽名LUN
格式化磁碟:重新格式化LUN
備註: 格式化磁碟選項刪除LUN上的所有現有資料。在嘗試重新簽名之前,請確保其他主機上沒有正在運行該VMFS卷的虛擬機器,因為這些虛擬機器在vCenter Server清單中變得無效,並且要在各自的主機上再次註冊。
選擇「分配新簽名」並按一下「下一步」。
7 為您的卷選擇所需的選項
8在Ready to Complete頁面中,檢視datastore配置資訊,然後按一下Finish。
===================
下一步要做什麼
====================
重新簽名後,您可能必須執行以下操作:
1登入到vSphere客戶端,U在Inventory List(庫存清單)>按一下Datastore(資料儲存)
2按一下右鍵datastore並按一下「Browse Datastore」
3在左窗格中,按一下一個VM資料夾以顯示右窗格中的內容
4在右窗格中,按一下右鍵.vmx檔案並選擇「新增到清單」
5瀏覽「新增到清單」嚮導,完成將虛擬機器新增到ESXi主機的過程
6對所有剩餘虛擬機器重複步驟
7重新註冊所有虛擬機器後,通過按一下右鍵每個虛擬機器並選擇「從庫存中刪除」,從庫存中刪除所有無法訪問的虛擬機器
8開啟每台虛擬機器,並驗證其是否正常運行且可訪問
附註:在開啟VM之前,重新啟動ESXi主機,並在該主機重新聯機並可通過vSphere客戶端訪問之後,確認虛擬機器仍然可見且尚未進入「不可訪問」狀態
CSCvr11972 更換MRAID12G後更改供應商唯一識別符號
https://bst.cloudapps.cisco.com/bugsearch/bug/CSCvr11972