簡介
本文是文檔「Nexus 7000 Supervisor 2/2E Compact Flash Failure Recovery」的擴展,可解決所有可能的故障情況。如果快閃記憶體恢復工具無法運行,本文檔將非常方便。建議通過控制檯訪問裝置以執行更改。此外,強烈建議不要在Linux核心中進行任何變更(文檔中未提到這一點),因為這可能會影響交換器操作。建議使用Cisco TAC監督。
背景
如另一文檔所述,每個N7K Supervisor 2/2E都配備了2個eUSB快閃記憶體裝置(採用RAID1配置)、一個主裝置和一個映象。它們一起為啟動映像、啟動配置和持久應用程式資料提供非易失性儲存庫。如果機箱中的Supervisor的Raid發生故障,我們運行快閃記憶體恢復工具來修復此問題。在幾乎所有情況下,如果快閃記憶體恢復工具無法運行,我們都會重新載入/故障轉移Supervisor。在特定情況下無需重新載入/故障切換即可修復此問題。
必要條件
需求
思科建議您瞭解Cisco Nexus OS、儲存或快閃記憶體磁碟恢複方法以及Linux級調試。
採用元件
Nexus 7000系列交換器
症狀
在Supervisor上觀察到RAID故障,在嘗試恢復受影響的Supervisor的快閃記憶體時,運行快閃記憶體恢復工具時出現以下錯誤:
交換機將進入Raid故障狀態,錯誤代碼為0xe1
ERROR: Cannot perform recovery. /dev/sdb has incorrect partition info.
ERROR: Disk /dev/sdb needs to be manually inspected for errors.
INFO: No recovery was attempted on module 5. All flashes left intact.
INFO: A detailed copy of the this log was saved as volatile:flash_repair_log_mod5.tgz.
解決方案
在交換機上載入調試外掛,以登入到linux shell,
Switch# load bootflash:n7000-s2-debug-sh.6.1.4a.gbin
請在此處運行命令時小心。
收到linux提示後,根據錯誤訊息查詢受影響的分割槽。在本例中為/dev/sdb。它也可以是其他分割槽。
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
運行恢復工具時,發現缺少分割槽,從而導致錯誤。手動建立缺少的分割槽,許可權與其他塊相同。
Linux(debug)# mknod -m 664 /dev/sdb b 8 16
現在,我們可以看到/dev下的sdb分割槽,
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root root 8, 16 May 26 07:31 sdb
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
退出linux shell並再次運行快閃記憶體恢復工具。
這一次,沒有出現任何錯誤消息,並且主快閃記憶體上的Raid故障已恢復(0xf0)。 使用命令確認相同,
"slot x show system internal raid | i i cmos|block | head line 5"
它應該運行良好,沒有此類錯誤,並且應該能夠將受影響的Supervisor從Raid故障狀態中恢復。如果恢復工具繼續無法運行,則可能是由於其他原因或分割槽的實際損壞,我們可能不得不重新載入/故障切換。
相關資訊