Inleiding
In dit document wordt beschreven hoe u problemen met databasereplicatie kunt diagnosticeren en welke stappen nodig zijn om deze problemen te troubleshooten.
Stappen om de databasereplicatie te diagnosticeren
In deze sectie worden scenario's beschreven waarin databasereplicatie is verbroken en wordt de methodologie voor probleemoplossing beschreven om het probleem te diagnosticeren en te isoleren.
Stap 1. Controleer of de databasereplicatie niet functioneert
Om te bepalen of de databasereplicatie niet functioneert, moet u de verschillende statussen kennen van de Real Time Monitoring Tool (RTMT) voor de replicatie.
Waarde |
Betekenis |
Beschrijving |
0 |
Initialisatiestatus |
De replicatie wordt ingesteld. Er kan een setup-fout optreden als de replicatie langer dan een uur in deze staat is. |
1 |
Het aantal replicaties is onjuist |
Het instellen is nog niet voltooid. Deze status komt zelden voor in versies 6.x en 7.x; in versie 5.x duidt deze status aan dat het instellen nog bezig is. |
2 |
Replicatie is goed |
Er zijn logische verbindingen tot stand gebracht en de tabellen komen overeen met de andere servers in het cluster. |
3 |
Niet-overeenkomende tabellen |
Logische verbindingen zijn tot stand gebracht, maar het is niet zeker of de tabellen overeenkomen. In versies 6.x en 7.x kunnen alle servers de status 3 tonen, zelfs als één server in het cluster is uitgevallen. Dit probleem kan optreden als de andere servers niet zeker zijn of er een update is van de User Facing Feature (UFF) die niet is doorgegeven van de abonnee naar het andere apparaat in het cluster. |
4 |
Setup mislukt/afgebroken |
De server heeft geen actieve logische verbinding meer om databasetabellen via het netwerk te ontvangen. In deze status vindt geen replicatie plaats. |
Om de gegevensbestandreplicatie te verifiëren, stel het bevel van de utilisatie runtimestate van CLI van de uitgeversknoop, zoals aangetoond in dit beeld in werking.
Controleer in de output of de Cluster Replication State niet de oude synchronisatie-informatie bevat. Controleer het zelfde en gebruik de Tijdstempel.
Als de BROADCAST SYNC niet wordt bijgewerkt met een recente datum, voer dan de opdracht utils dbreplication status uit om alle tabellen en de replicatie te controleren. Als er fouten/mismatches worden ontdekt, dan worden deze in de output aangegeven en verandert de RTMT-status dienovereenkomstig, zoals weergegeven in deze afbeelding.
o
Nadat u de opdracht heeft uitgevoerd, worden alle tabellen gecontroleerd op consistentie en wordt een nauwkeurige replicatiestatus weergegeven.
Opmerking: Laat alle tabellen controleren en ga vervolgens verder met probleemoplossing.
Zodra er een nauwkeurige replicatiestatus wordt weergegeven, controleert u de replicatie-setup (RTMT) en de details zoals aangegeven in de eerste output. U moet de status voor elk knooppunt controleren. Als een knooppunt een andere status heeft dan 2, ga dan door met troubleshooten.
Stap 2. Verzamel de SCM-databasestatus van de Cisco Unified Reporting Page op CUCM
- Nadat u Stap 1 hebt voltooid, kiest u de optie Cisco Unified Reporting in de vervolgkeuzelijst Navigatie in de uitgever van Cisco Unified Communications Manager (CUCM), zoals in deze afbeelding.
2. Ga naar System Reports en klik op Unified CM Database Status zoals weergegeven in deze afbeelding.
3. Genereert een nieuw rapport, klik op het pictogram Generate New Report zoals in deze afbeelding.
4. Wacht tot het nieuwe rapport succesvol gegenereerd is.
5. Zodra het gegenereerd is, klik op het pictogram om het rapport te downloaden en op te slaan, zodat het aan een TAC engineer kan worden geleverd voor het geval dat een service aanvraag (SR) moet worden geopend.
Stap 3. Bekijk het Unified CM Database Report van alle componenten die als fout zijn gemarkeerd
Als de onderdelen fouten bevatten, worden de fouten gemarkeerd met een rood X-pictogram, zoals in deze afbeelding wordt weergegeven.
- Controleer in het geval van een fout de netwerkconnectiviteit tussen de knooppunten. Controleer of de A Cisco DB-service vanaf de CLI van het knooppunt wordt uitgevoerd en of de opdracht Servicelijst hulpprogramma’s wordt gebruikt.
- Als de A DB-service inactief is, voer dan de opdracht utils service start A Cisco DB uit om de service te starten. Als dit mislukt, neemt u contact op met Cisco TAC.
- Zorg dat de replicatieserverlijst (cdr list serv) voor alle knooppunten is ingevuld.
Dit beeld illustreert een ideale uitvoer.
Als de Cisco Database Replicator-lijst (CDR) leeg is voor sommige knooppunten, raadpleeg dan stap 8.
- Zorg dat de Unified CM-hosts, rhosts en sqlhosts hetzelfde zijn op alle knooppunten.
Dit is een belangrijke stap. Zoals in deze afbeelding is weergegeven, zijn de Unified CM-hosts, de rhosts en sqlhosts hetzelfde op alle knooppunten.
De hosts-bestanden komen niet overeen:
Er kan sprake zijn van een onjuiste activiteit wanneer een IP-adres verandert of wordt bijgewerkt naar de hostnaam op de server.
Raadpleeg deze link om het IP-adres te wijzigen naar de hostnaam voor de CUCM.
IP-adres en hostnaam wijzigen
Start deze services opnieuw vanaf de CLI van de uitgeversserver en controleer of de mismatch is gewist. Zo ja, ga naar Stap 8. Als dit niet het geval is, neem dan contact op met Cisco TAC. Genereer altijd een nieuw rapport als u iets wijzigt via de GUI/CLI, om te controleren of de wijzigingen zijn doorgevoerd.
Cluster Manager ( utils service restart Cluster Manager)
A Cisco DB ( utils service restart A Cisco DB)
De rhosts-bestanden komen niet overeen:
Als de rhosts-bestanden niet overeenkomen met de host-bestanden, volg dan de stappen die zijn beschreven onder De hosts-bestanden komen niet overeen. Als alleen de rhosts-bestanden niet overeenkomen, voert u de opdrachten uit vanaf de CLI:
A Cisco DB ( utils service restart A Cisco DB )
Cluster Manager ( utils service restart Cluster Manager)
Genereer een nieuw rapport en controleer of de rhost-bestanden hetzelfde zijn op alle servers. Zo ja, ga naar Stap 8. Als dit niet het geval is, neem dan contact op met Cisco TAC.
De sqlhosts komen niet overeen:
Als de sqlhosts niet overeenkomen met de host-bestanden, volg dan de stappen die zijn beschreven onder De hosts-bestanden komen niet overeen. Als alleen de sqlhosts-bestanden niet overeenkomen, voert u de opdracht uit vanaf de CLI:
utils service restart A Cisco DB
Genereer een nieuw rapport en controleer of de sqlhost-bestanden hetzelfde zijn op alle servers. Zo ja, ga naar Stap 8. Zo niet, neem dan contact op met Cisco TAC
Als de RPC-hello niet werkt voor een bepaald knooppunt:
- Verzeker de netwerkconnectiviteit tussen het bepaalde knooppunt en de uitgever.
- Zorg ervoor dat het poortnummer 1515 is toegestaan op het netwerk.
Raadpleeg deze link voor meer informatie over TCP/UDP-poortgebruik:
Cisco Unified Communications Manager – TCP- en UDP-poortgebruik
- Zorg ervoor dat de netwerkverbinding tussen de knooppunten succesvol is, zoals weergegeven in deze afbeelding:
Als de netwerkconnectiviteit voor de knooppunten mislukt:
- Zorg ervoor dat de netwerkbereikbaarheid aanwezig is tussen de knooppunten.
- Zorg ervoor dat de juiste TCP/UDP-poortnummers op het netwerk zijn toegestaan.
Genereer een nieuw rapport, en controleer op een succesvolle verbinding. Als de verbinding mislukt, gaat u naar stap 8.
Stap 4. Controleer de afzonderlijke componenten die de testopdracht Diagnose van hulpprogramma gebruiken
De opdracht utils diagnose test controleert alle componenten en retourneert de waarde passed (geslaagd) of failed (mislukt). De componenten die essentieel zijn voor het goed functioneren van de databasereplicatie zijn:
De opdracht validate_network controleert alle aspecten van de netwerkverbinding voor alle knooppunten in het cluster. Als er een probleem is met de verbinding ofwel connectiviteit, wordt er vaak een fout weergegeven op de Domain Name Server/Reverse Domain Name Server (DNS/RDNS). De opdracht validate_network voert de bewerking in 300 seconden uit. De meest voorkomende foutmeldingen die worden weergegeven bij de netwerkverbindingstests:
1. Fout "De communicatie binnen een cluster is verbroken", zoals in deze afbeelding wordt weergegeven.
Deze fout treedt op wanneer één of meer knooppunten in het cluster een probleem hebben met de netwerkverbinding. Zorg ervoor dat alle knooppunten bereikbaar zijn voor ping.
Als de intra-clustercommunicatie is verbroken, treden er problemen op met de databasereplicatie.
2. Omgekeerde DNS-zoekactie is mislukt.
Deze fout treedt op wanneer de omgekeerde DNS-zoekactie op een knooppunt mislukt. U kunt echter wel controleren of de DNS correct is geconfigureerd en functioneert wanneer u deze opdrachten gebruikt:
utils network eth0 all - Shows the DNS configuration (if present)
utils network host <ip address/Hostname> - Checks for resolution of ip address/Hostname
Als DNS niet correct werkt, kan het gegevensbestandreplicatiekwesties veroorzaken wanneer de servers worden bepaald en de hostnames gebruiken.
Het NTP is verantwoordelijk voor het synchroniseren van de tijd van de server met de referentieklok. De Publisher synchroniseert de tijd altijd met het apparaat waarvan het IP als NTP-server is aangegeven; terwijl de abonnees de tijd synchroniseren met de Publisher.
Het is van zeer groot belang dat het NTP volledig functioneel is om problemen met de databasereplicatie te voorkomen.
Het is van essentieel belang dat het NTP-stratum (aantal hop naar de referentieklok van de moederplant) kleiner is dan 5 of dat dit onbetrouwbaar wordt geacht.
Voltooi deze stappen om de NTP-status te controleren:
- Gebruik de opdracht utils diagnose test om de output te controleren, zoals weergegeven in deze afbeelding.
2. Daarnaast kunt u deze opdracht uitvoeren:
utils ntp status
Stap 5. Controleer de verbindingsstatus van alle knooppunten en zorg dat ze zijn geverifieerd
- Nadat u stap 4 heeft voltooid, en er geen problemen zijn gemeld, voert u de opdracht utils network connectivity uit op alle knooppunten om te controleren of de connectiviteit met de databases succesvol is, zoals weergegeven in deze afbeelding.
2. Als u "Kan TCP/UDP-pakketten niet verzenden" als een foutbericht ontvangt, controleert u op elke heruitzending van het netwerk of blokkeert u de TCP/UDP-poorten. De opdracht show network cluster controleert de verificatie van alle knooppunten.
3. Als de status van het knooppunt niet is geverifieerd, controleert u of de netwerkverbinding en het beveiligingswachtwoord op alle knooppunten hetzelfde zijn, zoals in deze afbeelding wordt weergegeven.
Raadpleeg deze links om de security wachtwoorden te wijzigen of herstellen:
Wachtwoorden opnieuw instellen in CUCM
Wachtwoordherstel voor beheerders van het CUCM-besturingssysteem
Stap 6. De opdracht utils dbreplication runtimestate toont de statussen ‘niet gesynchroniseerd’ of ‘niet aangevraagd’
Het is belangrijk te realiseren dat de databasereplicatie veel van het netwerk vraagt doordat hierbij de eigenlijke tabellen naar alle knooppunten in het cluster worden geduwd. Zorg ervoor dat:
utils dbreplication setprocess <1-40>
Opmerking: Wanneer u deze parameter verandert, verbetert het de prestaties van de replicatieopstelling, maar verbruikt extra systeemmiddelen.
Server 1-5 = 1 Minute Per Server Servers 6-10 = 2 Minutes Per Server Servers >10 = 3 Minutes Per Server.
Example: 12 Servers in Cluster : Server 1-5 * 1 min = 5 min, + 6-10 * 2 min = 10 min, + 11-12 * 3 min = 6 min,
Repltimeout should be set to 21 Minutes.
Opdrachten om de replicatietime-out te controleren/in te stellen:
show tech repltimeout ( To check the current replication timeout value )
utils dbreplication setrepltimeout ( To set the replication timeout )
De stappen 7 en 8 moeten worden uitgevoerd nadat de controlelijst is uitgevoerd:
Checklist:
- Alle knooppunten hebben verbinding met elkaar. Raadpleeg stap 5.
- RPC is bereikbaar. Raadpleeg stap 3.
- Raadpleeg Cisco TAC voordat u doorgaat met Stap 7 en 8 in het geval van knooppunten groter dan 8.
- Voer de procedure buiten kantooruren uit.
Stap 7. Repareer alle/selectieve tabellen voor databasereplicatie
Als de opdracht utils dbreplication runtimestate aangeeft dat er foutieve/niet overeenkomende tabellen zijn, voer dan deze opdracht uit:
Utils dbreplication repair all
Voer de opdracht utils dbreplication runtimestate uit om de status opnieuw te controleren.
Ga verder naar stap 8 als de status niet verandert.
Stap 8. Zet de databasereplicatie terug vanaf nul
Verwijs naar de opeenvolging om de gegevensbestandreplicatie terug te stellen en het proces van kras te beginnen.
utils dbreplication stop all (Only on the publisher)
utils dbreplication dropadmindb (First on all the subscribers one by one then the publisher)
utils dbreplication reset all ( Only on the publisher )
Om het proces te monitoren voert u de RTMT-opdracht utils dbreplication runtimestate uit.
Raadpleeg de procedure om de databasereplicatie te resetten voor een bepaald knooppunt:
utils dbreplication stop <sub name/IP> (Only on the publisher)
utils dbreplcation dropadmindb (Only on the affected subscriber)
utils dbreplication reset <sub name/IP> (Only on the publisher )
Als u Cisco TAC bereikt voor verdere assistentie, zorg dan dat deze uitgangen en de rapporten worden geleverd:
utils dbreplication runtimestate
utils diagnose test
utils network connectivity
Rapporten:
- Het Cisco Unified Reporting CM Database-rapport (zie stap 2).
- De opdracht utils create report database vanaf de opdrachtregelinterface. Download het .tar bestand en gebruik een SFTP server.
Gerelateerde informatie