简介
本文档介绍如何排除和解决基于语音操作系统(VOS)的系统上的不正常关机问题。
先决条件
要求
思科建议您了解以下一个或多个主题:
- 思科统一通信管理器 (CUCM)
- 思科统一即时消息和在线状态(IM&P)
- 思科应急响应器(CER)
- 思科 Unity Connection (CUC)
使用的组件
本文档中的信息基于以下软件和硬件版本:
- CUCM 12.5或更高版本
- IM&P 12.5或更高版本
- CER 12.5或更高版本
- CUC 12.5或更高版本
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
什么是“不正常关闭”?
非正常关闭是指不执行正确的关闭程序而突然或突然终止VOS。当系统被迫意外停止或关闭电源,而不允许必要的进程和服务正常关闭时,通常会发生这种情况。
发生不正常关闭时,服务器管理网站上会显示警告消息。
Ungraceful Shutdown Web界面警告
如果通过SSH或VMWare控制台登录,也会显示此警告。
非正常关闭CLI
导致不正常关机的常见原因包括:
- 停电
- 硬件故障
- 不正确的虚拟机关闭、重新启动或停止过程
警告:不正常的关闭可能会导致服务中断、数据丢失和系统不稳定。
检验不正常的关闭事件
要确认出现不正常的关闭,请登录CLI并执行file view install system-history.log。
查看system-history.log的输出。如果两个引导事件连续发生而没有继续关闭或重新启动事件,则发生不正常关闭。
admin:file view install system-history.log
06/20/2023 10:22:48 | 根:关闭14.0.1.13900-155 Start
06/20/2023 10:24:35 | root:启动14.0.1.13900-155开始= OK,先前Shutdown
07/10/2023 10:29:08 | root:重新启动14.0.1.13900-155 Start
07/10/2023 10:30:05 | root:Boot 14.0.1.13900-155 Start = OK,先于Restart
07/15/2023 11:14:29 | root:Boot 14.0.1.13900-155 Start =不正常关闭,no previous Restart或Shutdown语句
验证系统运行状况
必须确定不正常关机的根本原因,以采取适当措施,防止再次发生此类故障,最大限度地减少对系统及其用户的影响。
检验电源
检查VOS服务器是否有稳定的电源并已正确连接到电源。确保电源线连接牢固,且未损坏。
验证硬件
访问服务器集成管理控制器(IMC)或集成戴尔远程访问控制器(iDRAC),查看服务器日志。查看服务器日志,了解表明硬件组件存在问题的任何硬件错误或警告。
许多服务器提供可在引导过程中访问的诊断工具。这些工具可执行全面的硬件测试,包括内存测试、CPU测试和磁盘检查。使用这些诊断工具可确定任何硬件问题或故障。
注意:有关如何验证和排除硬件故障的具体说明,请查阅服务器制造商文档和支持资源非常重要。
检验关闭过程
使用按电源按钮或拔下服务器而不允许操作系统执行必要的关机过程等方法强制VOS服务器关闭会导致不正常的关机。
VOS稳定性检查
为了检验VOS系统的稳定性,可以使用多个实用程序。这些实用程序提供有关服务、诊断、网络、数据库完整性和时间同步的重要信息。
实用程序 |
描述 |
utils service list |
此VOS命令用于检查服务器上运行的服务的状态和运行状况。检查服务列表可以确保所有基本服务按预期运行。任何停止的服务或遇到问题的服务都可能表示系统中存在潜在的稳定性问题。 |
utils诊断测试 |
此VOS命令启动诊断测试,对系统组件、配置和服务执行各种检查。它有助于识别可能影响系统稳定性的任何潜在问题或配置错误。诊断输出为管理员提供诊断信息和建议,用于解决任何已确定的问题。 |
show network cluster |
此VOS命令验证集群节点之间的网络连接并显示每个集群成员的状态。管理员可以检查输出数据,以确保网络配置正确,所有集群成员均在线,并且它们之间的通信稳定。网络问题或不一致会显着影响VOS系统的稳定性和可靠性。 |
show tech dbintegrity |
此VOS命令生成一个技术支持文件,其中包含有关数据库完整性的信息。它验证复制状态、计数器以及与数据库相关的其他关键详细信息。检查数据库完整性对于确保数据一致性和系统稳定性至关重要。此命令检测到的任何问题都有助于识别和解决潜在的数据库问题。 |
utils ntp status |
此VOS命令显示服务器上的网络时间协议(NTP)同步状态。它显示正在使用的NTP源、同步状态以及服务器和已配置的NTP源之间的时间偏移。正确的时间同步对于各种系统功能至关重要。验证NTP状态可以确保VOS系统时间准确并最大程度地减少与计时相关的潜在问题。 |
恢复ISO文件检查 |
此ISO实用程序用于检查和验证VOS服务器上文件系统的完整性。执行文件检查以确认文件系统运行正常,并且没有任何损坏或错误。文件检查不包括可能包含损坏元素的单个文件的完整性 有关下载和使用恢复ISO的信息,请参阅在CUCM VM上获取并运行恢复软件指南。 |
缓解
要减轻不正常的关闭的影响,必须实施预防性措施,例如定期备份、监控和冗余策略。
如果在维护活动、系统升级、虚拟机重启或虚拟机关机期间未遵循正确的关机程序,则可能导致不正常的关机。
补救
对于VOS级别的不正常关闭,建议的补救措施是重建受影响的节点并从良好的备份恢复。这可确保系统的文件完整性并将系统恢复到稳定状态。
有关如何从备份进行恢复的说明,请参阅提供的链接。
在无法重建或重建不利的情况下,还有另一种选择。VOS命令utils ungraceful warn disable用于抑制Web管理和控制台非正常关闭警告。
命令 |
描述 |
utils ungraceful warn disable |
此vos命令可用于禁用检测到不正常关闭时显示的Web管理和控制台警告消息。 此命令不会执行任何系统检查文件损坏。 |
这不是推荐的解决方案,因为这仅抑制警告,不会解决不正常关闭的根本原因。解决根本原因和确保VOS系统的稳定性和完整性至关重要
注意:如果您的服务器无法执行utils ungraceful warn disable命令,请查阅Cisco Bug ID CSCvy68211,因为启用该命令需要COP文件。