簡介
本檔案介紹Unified Computing System Manager(UCSM)3.1.3a版本中引入的與資料管理引擎(DME)資料庫(DB)相關的功能。
必要條件
需求
思科建議您瞭解以下主題:
採用元件
本文中的資訊係根據以下軟體和硬體版本:
- UCSM軟體版本3.1.3a
- 交換矩陣互聯(FI)6200系列和6332型號
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
背景資訊
DME是UCSM軟體體系結構的中心元件,儲存系統狀態資訊。資訊儲存在
本地儲存FI裝置的嵌入式資料庫形式稱為DME DB。
由於儲存硬體裝置故障,資料庫中的資料完整性可能會損壞。在UCSM 3.1.3a版本中,許多新功能
通過定期資料庫運行狀況檢查、無縫恢復已損壞的資料庫以及自動備份DME資料庫來保護資料,可增強UCSM的恢復能力。
UCSM DME資料庫運行狀況檢查功能
定期資料庫運行狀況檢查
UCS Manager定期啟動資料庫的運行狀況檢查,以驗證資料的完整性。
系統還允許使用者手動運行運行狀況檢查並驗證資料庫完整性。
驗證預設配置
預設情況下,運行狀況檢查每12小時執行一次,以便使用以下命令顯示當前狀態:
UCS # scope system
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 12
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
更改間隔
雖然您可以修改時間間隔或禁用運行狀況檢查,但強烈建議不要更改預設配置。
注意:強烈建議不要更改預設值中的這些值
在此示例中,間隔從12小時更改為48小時。
UCS /system # set mgmt-db-check-policy health-check-interval 48
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 48
Last Integrity Check Time: 2017-05-07T14:42:47.019
Internal Backup Interval (days): 14
Last Internal Backup Time: 2017-04-28T14:52:12.648
要禁用運行狀況檢查,請將該值設定為零。
手動運行運行狀況檢查
要驗證資料庫運行狀況檢查,可以執行這些命令。如果在終端上未列印任何消息,則資料庫運行良好。
UCS # scope system
UCS /system # start-db-check
UCS /system* # commit-buffer
此外,任何錯誤消息都將記錄在主FI DME日誌檔案(UCSM技術支援捆綁包的一部分)中。
[prt:executeHealthCheck] Health Check complete with no corruption
此命令可用於進一步驗證資料庫狀態:
UCS # scope system
UCS /system # show mgmt-db
Management Database Status:
Fabric Id Corrupted Count Last Occurrence Time
--------- ----------------------- --------------------
A 0 1970-01-01T00:00:00.000
B 0 1970-01-01T00:00:00.000
資料庫損壞 — 使用者級故障和恢復機制
如果UCSM在運行狀況檢查期間檢測到資料庫損壞,則會生成故障消息。
發生一次故障時會生成INFO級別故障。如果多次發生損壞,則會記錄主要級別故障,您需要採取進一步行動並聯絡Cisco TAC。收集技術支援捆綁包。
ucs /system # show fault
Severity Code Last Transition Time ID Description
--------- -------- ------------------------ -------- -----------
Info F1899 2017-04-28T01:09:23.332 263649 Management database corruption detected and recovered on Fabric Interconnect B. Number of corruption events: 1. Last corruption event timestamp: 2017-04-28T01:09:23.332
Major F1900 2017-05-02T00:52:07.846 263651 High number of management database corruption events on Fabric Interconnect A. Number of corruption events: 3. Last corruption event timestamp: 2017-05-02T01:06:06.387
恢復機制
UCSM自動解決損壞,而不影響任何服務或資料平面流量,它從記憶體中覆蓋資料庫或從對等FI複製完好的資料庫。
損壞事件 |
系統恢復機制 |
主要FI |
從記憶體管理資訊樹(MIT)中恢複資料庫 |
下級FI |
從主FI檢索資料庫檔案 |
重置損壞計數
DB損壞將一直存在,直到手動將其清除。例如,如果根據進一步調查來更換了FI硬體以解決損壞,您可以執行此命令重置損壞故障計數。
ucs-A # scope system
ucs-A /system # set mgmt-db-check-policy reset-corruption-count yes
ucs-A /system* # commit-buffer
定期備份
為了最大限度地保護資料,UCSM每兩週對UCSM配置(DME DB)進行完整狀態備份,以用於恢復目的。
此外,DB完整性檢查被驗證,以便備份包括從正常狀態開始配置。
完整狀態備份檔案儲存在每個FI的/workspace/backup目錄中。
UCS # connect local-mgmt
UCS(local-mgmt)# dir backup/
1 1823454 Apr 28 14:53:23 2017 internalBackup.1493391132.tgz
更改備份作業間隔
備份作業的頻率可以從1天更改為60天。如本例所示,我們將值更改為28天。
UCS # scope system
UCS /system # set mgmt-db-check-policy internal-backup-interval 28
UCS /system* # commit-buffer
UCS /system # show mgmt-db-check-policy detail
Management Database Integrity Check Policy:
Health Check Interval (hours): 24
Last Integrity Check Time: 2017-05-10T10:35:24.909
Internal Backup Interval (days): 28
Last Internal Backup Time: 2017-04-28T14:52:12.648
UCS /system #
相關資訊