简介
本文档介绍如何排除与此错误相关的问题:访问CUCM页时出现“ Database Communication Error ”。
先决条件
要求
Cisco 建议您了解以下主题:
- Cisco Unified Communications Manager (CUCM) 11.5 版
使用的组件
本文档中的信息基于CCM版本11.5
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
背景信息
本文档可帮助您了解在访问CUCM GUI页面时遇到数据库通信错误时要排除故障的场景和TAC技术。此消息表明Cisco DB服务有问题,或者可能与ODBC驱动程序有关,但是,本文档涉及当Cisco DB服务不按预期工作时用户可以检查的所有内容以及TAC检查的一些内容。
造成这种情况的最大原因之一可能是系统意外关闭。在Linux操作系统上不正常关闭可能导致文件损坏,当系统关闭时文件突然关闭。发生这种情况时,需要正常关闭一系列文件。然后,系统可能需要这些文件才能稍后完成启动过程。
其他原因可能是FQDN的更改、从IP地址更改为FQDN的更改,或者相反,没有正确的过程。
当出现上述问题时,应遵循一些措施项来保存系统。提到保存系统是因为,如果Linux中的任何特定服务未正确启动(停滞在启动或停止状态),则可能是负责启动该特定服务的守护程序/进程中的问题。只能在服务器重建时更正。
故障排除步骤
步骤1.系统健全性检查。
使用utils diagnose test和show status命令输出,查看是否有其它错误正在引发,以便可以相应地规划进一步的操作。例如,确保活动分区未通过show status完成100%填充。如果不正确,则需要先进行故障排除,然后才能解决其他问题。
admin:show status
Host Name : CUCM11
Date : Wed Jul 25, 2018 00:10:07
Time Zone : India Standard Time (Asia/Kolkata)
Locale : en_US.UTF-8
Product Ver : 11.0.1.22045-1
Unified OS Version : 6.0.0.0-2
Uptime:
00:10:09 up 48 days, 10:56, 1 user, load average: 0.17, 0.29, 0.27
CPU Idle: 97.74% System: 01.26% User: 01.00%
IOWAIT: 00.00% IRQ: 00.00% Soft: 00.00%
Memory Total: 3925432K
Free: 188156K
Used: 3737276K
Cached: 610140K
Shared: 203520K
Buffers: 27696K
Total Free Used
Disk/active 14154228K 1154116K 12854984K (92%)
Disk/inactive 14154228K 1195212K 12813888K (92%)
Disk/logging 49573612K 3454524K 43594160K (93%)
步骤2.重新启动服务。
utils service restart A Cisco DB — 通过CLI重新启动服务。
admin:utils service restart A Cisco DB
Do not press Ctrl+C while the service is restarting. If the service has not restarted properly, execute the same command again.
Service Manager is running
A Cisco DB[STOPPING]
A Cisco DB[STARTING]
A Cisco DB[STARTED]
admin:
步骤3.检查主机、主机和sqlhosts文件。
虽然只有主机文件可以通过服务器的正常CLI进行匹配(请记住,GUI不能用于转到报告页面),但使用show tech network hosts 命令可匹配集群所有服务器中的条目。如果任何服务器中都不匹配,则可以在尝试更正群集管理器服务后重新启动该服务。
admin:show tech network hosts
-------------------- show platform network --------------------
/etc/hosts File:
#This file was generated by the /etc/hosts cluster manager.
#It is automatically updated as nodes are added, changed, removed from the cluster.
127.0.0.1 localhost
::1 localhost
10.106.112.122 cucmsub.emea.lab cucmsub
10.106.112.123 imnp10.emea.lab imnp10
10.106.112.126 CUCM-10.emea.lab CUCM-10
admin:
步骤4.从根目录检查文件。
只有在获得对系统的根帐户访问权限后,TAC才会执行此步骤和后续步骤。使用controlcentre.sh脚本从外壳重新启动一次服务。
从位置/home/informix/.rhosts和$INFORMIXDIR/etc/sqlhosts中,手动匹配所有服务器中的文件。之后,重新启动群集管理器服务以更新启动过程中可能需要的任何文件中的详细信息。
步骤5.检查Informix。
Informix是负责Cisco DB服务的流程,当根用户切换为informix并检查状态时,它应显示为联机状态。
注意:所有这些步骤一旦选中,只有当问题出在主机/主机文件不匹配或信息暂时滞留时,才有助于使服务恢复。如前所述,可能还有其他许多原因导致这些不匹配。上面的文档突出显示了逐一检查的步骤,以缩小问题的可能位置。
在大多数情况下,如果系统文件损坏时无法从的根重新启动服务,则需要重建节点。
用于重建发布服务器的参考链接:https://www.cisco.com/c/en/us/support/docs/unified-communications/unified-communications-manager-callmanager/116946-technote-product-00.html
要重建用户,请执行以下操作:新用户安装时的系统配置与旧用户相同