本文檔介紹對Cisco Unity Connection(CUC)中可能的解決方案進行overwritedb問題故障排除的步驟。
思科建議您瞭解以下主題:
本檔案中的資訊是根據以下軟體和硬體版本:
overwritedb故障將以此語句結束。
Cluster overwritedb failed.
The overwritedb log cuc-cluster-overwritedb_yyyy-mm-dd_hh.mm.ss.log can be found in the installation log location through the CLI or Real-Time Monitoring Tool (RTMT).
若要獲取此日誌:
在CLI上(您需要安全FTP(SFTP)伺服器來傳輸記錄檔),
file get install cuc-cluster-overwritedb_yyyy-mm-dd_hh.mm.ss.log
或
在RTMT上,
Choose Trace & Log Central > Collect Install Logs > Select the Node > Proceed.
在某些情況下,日誌的最後10行將提供錯誤消息,因此可以使用以下命令在CLI上檢視該消息:檔案尾部安裝cuc-cluster-overwritedb_yyyy-mm-dd_hh.mm.ss.log
本節提供用於疑難排解overwritedb問題的各種案例。
問題:案例 1
Overwritedb在第一步失敗。第一步嘗試建立到遠端伺服器的連線。
記錄檔
+ sudo -u cucluster ssh cuc01 ' sh -lc '\''source /usr/local/cm/db/informix/local/ids.env && t=$(mktemp);ontape -r -v -t STDIO > $t 2>&1; rc=$?; cat $t; exit $rc'\'''@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!Someone could be eavesdropping on you right now (man-in-the-middle attack)!It is also possible that the Rivest-Shamir-Addleman (RSA) host key has just been changed.The fingerprint for the RSA key sent by the remote host isb0:f8:19:75:63:f7:30:aa:e4:ec:3b:dc:20:4a:d9:92.Please contact the system administrator.Add correct host key in /home/cucluster/.ssh/known_hosts to get rid of this message.Offending key in /home/cucluster/.ssh/known_hosts:5RSA host key for 10.1.1.100 has changed and you have requested strict checking.Host key verification failed.Physical restore failed - function read archive backup failed code 1 errno 0
Program over.TERM environment variable not set.+ ontape_rc=1+ [[ 1 -eq 0 ]]+ echo ontape returned 1.ontape returned 1.+ [[ 1 -ne 0 ]]+ echo Failed to restore database on cuc01. Ontape returned 1.
Failed to restore database on cuc01. Ontape returned 1.+ exit 1++ error++ echo 'Overwritedb failed.'++ echo 'The overwritedb log cuc-cluster-overwritedb_2014-01-22_20.20.44.log can be found in the installation log location through the CLI or RTMT.'++ exit
解決方案
聯絡Cisco TAC。此解決方案需要根訪問許可權。
問題:案例 2
Overwritedb失敗,錯誤為:
Failed to restore database on
Overwritedb failedThe overwritedb log cuc-cluster-overwritedb_yyyy-mm-dd_hh.mm.ss.log can be found in the installation log location through the CLI or RTMT
解決方案
伺服器可能受到CSCto87784的影響。請檢查此缺陷的固定版本。如果當前版本沒有修補程式,請再次運行utils cuc cluster overwritedb命令。
問題:案例 3
Overwritedb在此步驟中失敗,出現以下錯誤:
yy/mm/dd hh:mm:ss同步Unity Connection資料庫……
命令失敗 — 已定義企業複製(92)
記錄檔
+ local primary_server=g_ciscounity_na_cucn01+ sudo_informix cdr define server -A /var/opt/cisco/connection/spool/ats/ -c g_ciscounity_na_cucn01 -I g_ciscounity_na_cucn01+ [[ cucluster != \i\n\f\o\r\m\i\x ]]+ sudo -u informix cdr define server -A /var/opt/cisco/connection/spool/ats/ -c g_ciscounity_na_cucn01 -I g_ciscounity_na_cucn01command failed -- Enterprise Replication already defined (92)++ error++ echo 'Overwritedb failed.'++ echo 'The overwritedb log cuc-cluster-overwritedb_2012-11-16_02.32.09.log can be found in the installation logging location through the CLI or RTMT.'++ exit 1
解決方案
以下是解決此問題的幾個選項。
選項1:
逐一運行這些命令。在當前命令完成之前,不要繼續執行下一個命令。
選項2:
之所以會出現此問題,是因為企業複製隊列已滿。為了解決此問題,您可以重新啟動發佈伺服器,等待大約30分鐘以確保服務已啟動,然後重新啟動訂閱伺服器。當服務在訂閱伺服器上啟動時,overwritedb應成功完成。
以下是指向此問題的伺服器角色管理器日誌:
SRM,3,<CM> Command: /opt/cisco/connection/bin/db-replication-control status cuc02 execution completed abnormally. Error number: 6|
SRM,3,<Timer-0> Replication queue size: 90.0 has exceeded the maximum threshold value. Stopping replication.|
SRM,5,<evt> [PUB_PRIMARY] [replication_failed] ignored|
選項3:如果問題仍然存在,請聯絡Cisco TAC。
問題:案例 4
Overwritedb在此步驟中失敗,出現此錯誤,
yy/mm/dd hh:mm:ss正在同步Unity Connection資料庫……
Overwritedb失敗
記錄檔
sudo -u cucluster ssh cuc02 ' sh -lc '\''source /usr/local/cm/db/informix/local/ids.env && dbaccess' 'unitydyndb'\'''
329: Database not found or no system permission.
解決方案
請與Cisco TAC聯系,瞭解需要root訪問許可權的解決方法。
問題:案例 5
在以下任一情況下出現故障:
CLI「utils cuc cluster overwritedb」在PUB或SUB上失敗。
SUB上的CLI「utils cuc cluster renegotiate」失敗。
在訂閱伺服器上升級失敗。
此問題的根本原因是嘗試建立複製時它在定義伺服器步驟時失敗。
記錄檔
對於群集重新協商/覆蓋資料庫故障,
+ sudo -u informix cdr define server -A /var/opt/cisco/connection/spool/ats/ -cg_ciscounity_sub1 -I g_ciscounity_sub1 -S g_ciscounity_pubcommand failed -- fatal server error (100)++ error++ '[' 0 -eq 1 ']'++ echo 'Cluster renegotiation failed.'Or the same errors with the last line as
++ echo 'Cluster overwritedb failed.'
對於使用者安裝失敗,
Thu Oct 17 06:09:47 GMT+2 2013 + sudo -u informix cdr define server -A /var/opt/cisco/connection/spool/ats/ -c g_ciscounity_pub -I g_ciscounity_pubThu Oct 17 06:13:07 GMT+2 2013 command failed -- fatal server error (100)Thu Oct 17 06:13:07 GMT+2 2013 + LOADDBRC=100Thu Oct 17 06:13:07 GMT+2 2013 + '[' 100 -ne 0 ']'Thu Oct 17 06:13:07 GMT+2 2013 + echo 'loaddb.sh return code was 100'Thu Oct 17 06:13:07 GMT+2 2013 loaddb.sh return code was 100Thu Oct 17 06:13:07 GMT+2 2013 + exit 1Thu Oct 17 06:13:07 GMT+2 2013 /opt/cisco/connection/lib/install/post.d/06_load-database had an exit code of 1error: %post(cuc-9.1.1.10000-32.i386) scriptlet failed, exit status 1
解決方案
伺服器受CSCue78730影響 .請聯絡Cisco TAC以尋求解決方法。或者,將伺服器升級到缺陷的固定版本。
問題:案例 6
Overwritedb在此步驟中失敗,出現此錯誤,
yy/mm/dd hh:mm:ss同步平台和LDAP資料庫……
Overwritedb失敗。
記錄檔
+ sudo -u informix cdr delete server -f -c g_ciscounity_pub g_ciscounity_pubconnect to g_ciscounity_pub failed Attempt to connect to database server (g_ciscounity_pub) failed.(-908)command failed -- unable to connect to server specified (5)+ true
解決方案
聯絡Cisco TAC。SQL hosts檔案很可能由於不正確或損壞的條目而出現問題。在IP地址/主機名更改後也會看到,此更改不會反映在SQL hosts檔案中。
問題:案例 7
當伺服器上的主機名/IP地址發生更改時,會出現此問題。
Overwritedb在此步驟中失敗,
yy/mm/dd hh:mm:ss同步平台和LDAP資料庫……
Overwritedb失敗。
「utils service list」顯示此服務關閉,
Cisco DB[NOTRUNNIG]組件未運行
記錄檔
ssh: connect to host 192.168.1.2 port 22: No route to hostPhysical restore failed - function read archive backup failed code 1 errno 0
Program over.+ ontape_rc=1+ [[ 1 -eq 0 ]]+ echo ontape returned 1.ontape returned 1.+ [[ 1 -ne 0 ]]+ echo Failed to restore database on cuc02. Ontape returned 1.Failed to restore database on cuc02. Ontape returned
解決方案
與Cisco TAC聯系。TAC將檢查vmsserver表條目和根目錄的主機檔案。此外,在訂閱伺服器上運行overwriteDB之前,請確保思科資料庫服務已啟動。
問題:案例 8
在此場景中,失敗是由於NTP問題。
記錄檔
+ sudo -u informix cdr define server -A /var/opt/cisco/connection/spool/ats/ -cg_ciscounity_sub1 -I g_ciscounity_sub1 -S g_ciscounity_pubcommand failed -- System clocks difference is too large. (90)++ error++ echo 'Overwritedb failed.'
解決方案
為了解決此問題,您必須修復所有網路時間協定(NTP)問題,並分配具有良好層值的NTP。對於Unity Connection,首選第1層或第2層源。
問題:案例 9
在這種情況下,由於許可權問題,伺服器無法訪問遠端伺服器。
記錄檔
+ sudo -u cucluster ssh cuc01 ' sh -lc '\''source /usr/local/cm/db/informix/local/ids.env && onstat' '-'\'''Permission denied (publickey,password).+ return -1+ exit 255++ error++ echo 'Overwritedb failed.'
或
+ sudo -u cucluster ssh cuc01 ' sh -lc '\''source /usr/local/cm/db/informix/local/ids.env && t=$(mktemp); ontape -r -v -t STDIO > $t 2>&1; rc=$?; cat $t; exit $rc'\'''Permission denied (publickey,password).Physical restore failed - function read archive backup failed code 1 errno 0
Program over.
TERM environment variable not set.
解決方案
請與Cisco TAC聯系以同步根帳戶的密碼。
問題:案例 10
在此場景中,失敗是由於伺服器上缺少DNS/域名條目,或者發佈伺服器上未定義訂閱伺服器所致。
記錄檔
connect to g_ciscounity_sub1 failed Incorrect password or user g_ciscounity_sub1 is not known on the database server. (-951)command failed -- unable to connect to server specified (5)
解決方案
確保在System Settings > Cluster頁面下提供了訂戶伺服器IP地址/主機名詳細資訊。
如果配置了DNS和域名資訊,請確保這兩個伺服器的資訊正確。
如果問題仍然存在,請聯絡CISCO TAC。TAC將從根目錄檢查SQL Hosts檔案。
問題:案例 11
OverwriteDB失敗,錯誤為:
SSH trust renegotiation failed.The security password on the publisher and subscriber servers do not match. Run the the CLI command "set password user security" on one or both servers to update the security password, then re-run "utils cuc cluster overwritedb".Overwritedb failed.
解決方案
在一個或兩個伺服器上運行set password user security命令以更新安全密碼。
如果未在發佈伺服器的System Settings > Cluster頁中輸入訂閱伺服器的IP地址/主機名,也會出現此錯誤。
如果問題仍然存在,請聯絡Cisco TAC。
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
21-Apr-2014 |
初始版本 |