簡介
本文介紹如何排除和解決基於語音作業系統(VOS)的系統上的不正常關機問題。
必要條件
需求
思科建議您瞭解以下一個或多個主題:
- 思科整合通訊管理員(CUCM)
- Cisco Unified Instant Messaging & Presence(IM&P)
- 思科緊急回應端(CER)
- Cisco Unity Connection(CUC)
採用元件
本文中的資訊係根據以下軟體和硬體版本:
- CUCM 12.5或更高版本
- IM&P 12.5或更高版本
- CER 12.5或更高版本
- CUC 12.5或更高版本
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
什麼是「不正常關機」?
不正常的關閉是指不執行適當的關閉程式而突然或突然終止VOS。當系統被迫意外停止或關閉電源,而不允許必要的進程和服務正常關閉時,通常會發生這種情況。
發生不正常關閉時,伺服器管理網站上將顯示一條警告消息。
Ungraceful Shutdown Web介面警告
如果通過SSH或VMWare控制檯登入,也會顯示此警告。
不正常關閉CLI
不正常關機的常見原因包括:
- 停電
- 硬體故障
- 不正確的虛擬機器關閉、重新啟動或停止過程
警告:不正常的關閉可能會導致服務中斷、資料丟失和系統不穩定。
驗證不正常關機事件
要確認出現不正常關閉,請登入到CLI並執行file view install system-history.log。
檢視system-history.log的輸出。如果兩個引導事件連續發生而沒有繼續關機或重新啟動事件,則發生不正常關機。
admin:file view install system-history.log
06/20/2023 10:22:48 | root: Shutdown 14.0.1.13900-155 Start
06/20/2023 10:24:35 | 根:引導14.0.1.13900-155開始= OK,前一個關機
07/10/2023 10:29:08 | root:重新啟動14.0.1.13900-155 Start
07/10/2023 10:30:05 | root: Boot 14.0.1.13900-155 Start = OK,先重新啟動
07/15/2023 11:14:29 | root: Boot 14.0.1.13900-155 Start = Ungraceful Shutdown, no previous Restart or Shutdown語句
驗證系統運行狀況
必須確定不正常關機的根本原因,以採取適當的措施防止再次發生這種故障,並儘量減少對系統及其使用者的影響。
驗證電源
檢查VOS伺服器的電源是否穩定並已正確連線到電源。確保電源線連線牢固,並且未損壞。
驗證硬體
訪問伺服器整合管理控制器(IMC)或整合戴爾遠端訪問控制器(iDRAC)以檢視伺服器日誌。檢視伺服器日誌,瞭解表明硬體元件出現問題的任何硬體錯誤或警告。
許多伺服器提供可在引導過程中訪問的診斷工具。這些工具可執行全面的硬體測試,包括記憶體測試、CPU測試和磁碟檢查。使用這些診斷工具可確定任何硬體問題或故障。
註:有關如何驗證和排除硬體故障的具體說明,請查閱伺服器製造商文檔和支援資源,這一點非常重要。
驗證關閉程式
使用按電源按鈕或拔下伺服器而不允許作業系統執行必要的關機過程等方法強制VOS伺服器關閉會導致不正常的關機。
VOS穩定性檢查
為了驗證VOS系統的穩定性,可以使用多個實用程式。這些實用程式提供有關服務、診斷、網路、資料庫完整性和時間同步的重要資訊。
公用事業 |
說明 |
utils service list |
此VOS命令用於檢查伺服器上運行的服務的狀態和健康狀況。檢查服務清單可確保所有基本服務均按預期運行。任何停止的服務或遇到問題都可能表示系統內存在潛在的穩定性問題。 |
實用程式診斷測試 |
此VOS命令啟動診斷測試,該測試對系統元件、配置和服務執行各種檢查。它有助於確定可能影響系統穩定性的任何潛在問題或配置錯誤。診斷輸出為管理員提供診斷資訊和建議,用於解決任何已確定的問題。 |
show network cluster |
此VOS命令驗證群集節點之間的網路連線並顯示每個群整合員的狀態。管理員可以檢查輸出資料,以確保網路配置正確,所有群整合員均處於聯機狀態,並且它們之間的通訊穩定。網路問題或不一致會顯著影響VOS系統的穩定性和可靠性。 |
show tech dbintegrity |
此VOS命令生成一個技術支援檔案,其中包括有關資料庫完整性的資訊。它驗證複製狀態、計數器以及與資料庫相關的其他關鍵詳細資訊。檢查資料庫完整性對於確保資料一致性和系統穩定性至關重要。此命令檢測到的任何問題都有助於識別和解決潛在的資料庫問題。 |
實用程式ntp狀態 |
此VOS命令顯示伺服器上的網路時間協定(NTP)同步狀態。其中顯示了正在使用的NTP源、同步狀態以及伺服器和已配置NTP源之間的時間偏移。適當的時間同步對於各種系統功能來說是非常重要的。檢驗NTP狀態可以確保VOS系統時間準確,並最大程度地減少與時間相關的潛在問題。 |
恢復ISO檔案檢查 |
此ISO實用程式用於檢查和驗證VOS伺服器上檔案系統的完整性。執行檔案檢查以確認檔案系統是否正常且沒有任何損壞或錯誤。檔案檢查不包括可能包含損壞元素的單個檔案的完整性 有關下載和使用恢復ISO的資訊,請參閱在CUCM VM上獲取和運行恢復軟體指南。 |
緩解
要減輕非正常關閉的影響,必須實施預防性措施,如常規備份、監控和冗餘策略。
如果在維護活動、系統升級、虛擬機器重新啟動或虛擬機器關閉期間未遵循正確的關閉過程,則可能導致不正常的關閉。
補救
對於VOS級別的不正常關閉,建議的補救措施是重建受影響的節點並從良好的備份中恢復。這可確保系統的檔案完整性,並將系統還原到穩定狀態。
有關如何從備份還原的說明,請參閱所提供的連結。
在無法重建或重建不利的局勢中還有另一種選擇。VOS命令utils ungraceful warn disable 用於抑制Web管理和控制檯非正常關閉警告。
指令 |
說明 |
utils ungraceful warn disable |
此vos命令可用於禁用檢測到不正常關閉時顯示的Web管理和控制檯警告消息。 此命令不會執行任何檔案損壞的系統檢查。 |
這不是推薦的解決方案,因為這僅抑制警告,不會解決不正常關機的根本原因。解決根本原因和確保VOS系統的穩定性和完整性至關重要
註:如果伺服器無法執行utils ungraceful warn disable命令,請查閱Cisco錯誤ID CSCvy68211,因為啟用該命令需要COP文件。