소개
이 문서에서는 데이터베이스 복제 문제를 진단하는 방법을 설명하고 이러한 문제를 해결하는 데 필요한 단계를 제공합니다.
데이터베이스 복제 진단 단계
이 섹션에서는 데이터베이스 복제가 중단된 시나리오에 대해 설명하고 문제를 진단하고 격리하기 위한 문제 해결 방법을 제공합니다.
1단계. 데이터베이스 복제가 손상되었는지 확인
데이터베이스 복제가 손상되었는지 여부를 확인하려면 복제에 대한 RTMT(실시간 모니터링 도구)의 다양한 상태를 알아야 합니다.
가치 |
의미 |
설명 |
0 |
초기화 상태 |
복제를 설정하는 중입니다. 복제가 이 상태에 1시간 이상 있는 경우 설정 오류가 발생할 수 있습니다. |
1 |
복제본 수가 올바르지 않음 |
설정이 아직 진행 중입니다. 이 상태는 버전 6.x 및 7.x에서는 거의 표시되지 않습니다. 버전 5.x에서는 설치가 아직 진행 중임을 나타냅니다. |
2 |
복제가 양호함 |
논리적 연결이 설정되고 테이블이 클러스터의 다른 서버와 일치합니다. |
3 |
불일치 테이블 |
논리적 연결이 설정되지만 테이블이 일치하는지 여부는 불확실합니다. 버전 6.x 및 7.x에서는 한 서버가 클러스터에서 중단되더라도 모든 서버가 상태 3을 표시할 수 있습니다. 이 문제는 다른 서버가 가입자로부터 클러스터의 다른 디바이스로 전달되지 않은 UFF(User Facing Feature)에 대한 업데이트가 있는지 여부를 확신하지 못하기 때문에 발생할 수 있습니다. |
4 |
설정 실패/삭제 |
서버에 네트워크를 통해 데이터베이스 테이블을 수신하기 위한 활성 논리적 연결이 더 이상 없습니다. 이 상태에서는 복제가 발생하지 않습니다. |
데이터베이스 복제를 확인하려면 이 이미지에 표시된 것처럼 게시자 노드의 CLI에서 utils dbreplication runtimestate 명령을 실행합니다.
출력에서 클러스터 복제 상태에 이전 동기화 정보가 포함되어 있지 않은지 확인합니다. 동일하게 선택하고 타임스탬프를 사용합니다.
브로드캐스트 동기화가 최근 날짜로 업데이트되지 않은 경우 utils dbreplication status 명령을 실행하여 모든 테이블과 복제를 확인합니다. 오류/불일치가 발견되면 출력에 표시되고 RTMT 상태가 그에 따라 변경됩니다(이 이미지 참조).
o
명령을 실행한 후 모든 테이블의 일관성이 확인되고 정확한 복제 상태가 표시됩니다.
참고: 모든 테이블을 검사하도록 허용한 다음 문제를 해결하기 위해 계속 진행합니다.
정확한 복제 상태가 표시되면 첫 번째 출력에 표시된 것과 같이 RTMT(복제 설정) 및 세부 정보를 확인합니다. 모든 노드의 상태를 확인해야 합니다. 노드가 2 이외의 상태인 경우 계속해서 문제를 해결합니다.
2단계. CUCM의 Cisco Unified Reporting 페이지에서 CM 데이터베이스 상태 수집
- 1단계를 완료한 후 이 이미지에 표시된 대로 CUCM(Cisco Unified Communications Manager) 게시자의 Navigation(탐색) 드롭다운 목록에서 Cisco Unified Reporting 옵션을 선택합니다.
2. 이 이미지에 표시된 것과 같이 시스템 보고서로 이동하고 통합 CM 데이터베이스 상태를 클릭합니다.
3. 새 보고서를 생성하려면 이 이미지에 표시된 대로 새 보고서 생성 아이콘을 누릅니다.
4. 새 보고서가 생성될 때까지 기다립니다.
5. 보고서가 생성되면 아이콘을 클릭하여 보고서를 다운로드하고 저장하여 서비스 요청(SR)을 열어야 하는 경우 TAC 엔지니어에게 제공할 수 있도록 합니다.
3단계. 오류로 플래그가 지정된 구성 요소의 Unified CM 데이터베이스 보고서를 검토합니다.
구성 요소에 오류가 있으면 이 이미지에 표시된 것처럼 빨간색 X 아이콘으로 오류가 표시됩니다.
- 오류가 있는 경우 노드 간 네트워크 연결을 확인하십시오. A Cisco DB 서비스가 노드의 CLI에서 실행되고 utils service list 명령을 사용하는지 확인합니다.
- A Cisco DB 서비스가 중단된 경우 utils service start A Cisco DB 명령을 실행하여 서비스를 시작합니다. 실패할 경우 Cisco TAC에 문의하십시오.
- 모든 노드에 대해 복제 서버 목록(cdr list serv)이 채워져 있는지 확인합니다.
이 이미지는 이상적인 출력을 보여 줍니다.
일부 노드에 대해 CDR(Cisco Database Replicator) 목록이 비어 있는 경우 8단계를 참조하십시오.
- Unified CM Host, Rhost 및 Sqlhost가 모든 노드에서 동일해야 합니다.
이는 중요한 단계입니다. 이 이미지에 표시된 것과 같이 Unified CM Host, Rhost 및 Sqlhost가 모든 노드에서 동일합니다.
Host 파일 불일치:
IP 주소가 변경되거나 서버의 호스트 이름으로 업데이트될 때 활동이 잘못될 수 있습니다.
CUCM의 호스트 이름에 대한 IP 주소를 변경하려면 이 링크를 참조하십시오.
IP 주소 및 호스트 이름 변경
게시자 서버의 CLI에서 이러한 서비스를 다시 시작하고 불일치가 지워졌는지 확인합니다. 대답이 "예"인 경우 8단계로 이동하고, "아니요"인 경우 Cisco TAC에 문의하십시오. GUI/CLI를 변경할 때마다 새 보고서를 생성하여 변경 사항이 포함되었는지 확인합니다.
Cluster Manager ( utils service restart Cluster Manager)
A Cisco DB ( utils service restart A Cisco DB)
Rhost 파일 불일치:
Rhost 파일이 호스트 파일과 불일치하는 경우 호스트 파일 불일치에 있는 단계를 수행합니다. Rhost 파일만 불일치하는 경우 CLI에서 다음 명령을 실행합니다.
A Cisco DB ( utils service restart A Cisco DB )
Cluster Manager ( utils service restart Cluster Manager)
새 보고서를 생성하고 Rhost 파일이 모든 서버에서 동일한지 확인합니다. 대답이 "예"인 경우 8단계로 이동하고, "아니요"인 경우 Cisco TAC에 문의하십시오.
Sqlhost 불일치:
Sqlhost가 호스트 파일과 불일치하는 경우 호스트 파일 불일치에 있는 단계를 수행합니다. Sqlhost 파일만 불일치하는 경우 CLI에서 다음 명령을 실행합니다.
utils service restart A Cisco DB
새 보고서를 생성하고 Sqlhost 파일이 모든 서버에서 동일한지 확인합니다. 대답이 "예"인 경우 8단계로 이동합니다. "아니요"인 경우 Cisco TAC에 문의하십시오.
특정 노드에서 RPC hello가 작동하지 않는 경우:
- 특정 노드와 퍼블리셔 간의 네트워크 연결을 확인합니다.
- 네트워크에서 포트 번호 1515가 허용되는지 확인합니다.
TCP/UDP 포트 사용에 대한 자세한 내용은 이 링크를 참조하십시오.
Cisco Unified Communications Manager TCP 및 UDP 포트 사용
- 다음 이미지에 표시된 것과 같이 노드 간 네트워크 연결이 성공적인지 확인합니다.
노드에 대한 네트워크 연결이 실패하는 경우:
- 노드 간에 네트워크 연결성이 있는지 확인합니다.
- 네트워크에서 적절한 TCP/UDP 포트 번호가 허용되는지 확인합니다.
새 보고서를 생성하고, 연결이 성공적인지 확인합니다. 연결이 성공적이지 않은 경우 8단계로 이동합니다.
4단계. Utils Diagnose Test 명령을 사용하는 개별 구성 요소를 확인합니다
utils diagnostic test 명령은 모든 구성 요소를 확인하고 통과/실패 값을 반환합니다. 데이터베이스 복제가 올바르게 작동하는 데 필요한 구성 요소는 다음과 같습니다.
validate_network 명령은 클러스터에 있는 모든 노드와의 네트워크 연결에 대한 모든 측면을 확인합니다. 연결에 문제가 있는 경우 종종 DNS/RDNS(도메인 이름 서버/역방향 도메인 이름 서버)에 오류가 표시됩니다. validate_network 명령은 300초 내에 작업을 완료합니다. 네트워크 연결 테스트에 표시되는 일반적인 오류 메시지:
1. 이 이미지에 표시된 대로 "클러스터 내 통신이 끊어졌습니다." 오류
이 오류는 클러스터의 하나 이상의 노드에 네트워크 연결 문제가 있을 때 발생합니다. 모든 노드에 ping 연결성이 있는지 확인합니다.
클러스터 내 통신이 중단되는 경우 데이터베이스 복제 문제가 발생합니다.
2. 역방향 DNS 조회 실패.
이 오류는 노드에서 역방향 DNS 조회가 실패할 때 발생합니다. 그러나 다음 명령을 사용할 때 DNS가 구성되어 제대로 작동하는지 확인할 수 있습니다.
utils network eth0 all - Shows the DNS configuration (if present)
utils network host <ip address/Hostname> - Checks for resolution of ip address/Hostname
DNS가 올바르게 작동하지 않으면 서버를 정의하고 호스트 이름을 사용할 때 데이터베이스 복제 문제가 발생할 수 있습니다.
NTP는 서버의 시간을 참조 시계와 동기화해야 합니다. 퍼블리셔는 항상 IP가 NTP 서버로 나열된 디바이스와 시간을 동기화합니다. 반면 가입자는 퍼블리셔와 시간을 동기화합니다.
데이터베이스 복제 문제를 방지하려면 NTP가 완전히 작동하는 것이 매우 중요합니다.
NTP 계층(상위 참조 시계에 대한 홉 수)이 5보다 작아야 합니다. 그렇지 않으면 신뢰할 수 없습니다.
NTP 상태를 확인하려면 다음 단계를 완료하십시오.
- 이 이미지에 표시된 것과 같이 utils diagnostic test 명령을 사용하여 출력을 확인합니다.
2 . 또한 다음 명령을 실행할 수 있습니다.
utils ntp status
5단계. 모든 노드에서 연결 상태를 확인하고 인증되었는지 여부 확인
- 4단계를 완료한 후 보고된 문제가 없는 경우 이 이미지에 표시된 것과 같이 모든 노드에서 utils network connectivity 명령을 실행하여 데이터베이스에 대한 연결이 성공적인지 확인합니다.
2. 오류 메시지로 "Cannot send TCP/UDP packets(TCP/UDP 패킷을 보낼 수 없음)"를 받으면 네트워크에서 재전송을 확인하거나 TCP/UDP 포트를 차단합니다. show network cluster 명령은 모든 노드의 인증을 확인합니다.
3. 노드 상태가 인증되지 않은 경우 이 이미지에 표시된 것처럼 네트워크 연결 및 보안 암호가 모든 노드에서 동일한지 확인합니다.
링크를 참조하여 보안 비밀번호 변경/복구:
CUCM에서 비밀번호를 재설정하는 방법
CUCM 운영 체제 관리자 비밀번호 복구
6단계. utils dbreplication runtimestate 명령으로 동기화되지 않았거나 요청되지 않은 상태 표시
데이터베이스 복제는 실제 테이블을 클러스터의 모든 노드로 푸시하므로 네트워크 집약적인 작업이라는 점을 이해해야 합니다. 다음 사항을 확인합니다.
utils dbreplication setprocess <1-40>
참고: 이 매개변수를 변경하면 복제 설정 성능이 향상되지만 추가 시스템 리소스가 사용됩니다.
Server 1-5 = 1 Minute Per Server Servers 6-10 = 2 Minutes Per Server Servers >10 = 3 Minutes Per Server.
Example: 12 Servers in Cluster : Server 1-5 * 1 min = 5 min, + 6-10 * 2 min = 10 min, + 11-12 * 3 min = 6 min,
Repltimeout should be set to 21 Minutes.
복제 시간 초과를 확인/설정하는 명령:
show tech repltimeout ( To check the current replication timeout value )
utils dbreplication setrepltimeout ( To set the replication timeout )
7단계와 8단계는 체크리스트가 충족된 후에 수행해야 합니다.
체크리스트:
- 모든 노드가 서로 연결되어 있습니다. 5단계를 참조하십시오.
- RPC에 연결할 수 있습니다. 3단계를 참조하십시오.
- 8보다 큰 노드의 경우 7단계와 8단계를 진행하기 전에 Cisco TAC에 문의하십시오.
7단계. 데이터베이스 복제를 위한 모든/선택적 테이블 복구
utils dbreplication runtimestate 명령에서 오류/불일치 테이블이 표시되는 경우 다음 명령을 실행합니다.
Utils dbreplication repair all
utils dbreplication runtimestate 명령을 실행하여 상태를 다시 확인합니다.
상태가 변경되지 않는 경우 8단계로 진행합니다.
8단계. 데이터베이스 복제를 처음부터 다시 설정합니다.
데이터베이스 복제를 재설정하고 프로세스를 처음부터 시작하려면 시퀀스를 참조하십시오.
utils dbreplication stop all (Only on the publisher)
utils dbreplication dropadmindb (First on all the subscribers one by one then the publisher)
utils dbreplication reset all ( Only on the publisher )
프로세스를 모니터링하려면 RTMT/utils dbreplication runtimestate 명령을 실행합니다.
순서를 참조하여 특정 노드에 대한 데이터베이스 복제를 재설정합니다.
utils dbreplication stop <sub name/IP> (Only on the publisher)
utils dbreplcation dropadmindb (Only on the affected subscriber)
utils dbreplication reset <sub name/IP> (Only on the publisher )
추가 지원을 받기 위해 Cisco TAC에 문의할 경우 다음 출력 및 보고서가 제공되는지 확인합니다.
utils dbreplication runtimestate
utils diagnose test
utils network connectivity
보고서:
- Cisco Unified Reporting CM 데이터베이스 보고서(2단계 참조).
- CLI의 utils create report database 명령. .tar 파일을 다운로드하고 SFTP 서버를 사용합니다.
관련 정보