Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document est conçu pour vous aider à dépanner le Cisco PGW 2200 lorsque vous recevez le message 'MSO refusé, Warm start-up Failed'. Ce message d'erreur apparaît après l'exécution de la commande MML sw-over::confirm. Comme le démarrage à chaud est une activité asynchrone et de faible priorité, plusieurs composants peuvent être en train de démarrer à chaud leurs homologues de secours. L'alarme aide l'opérateur à savoir quand une unité de secours est prête à prendre le relais en tant que secours. Soulève l'alarme lorsque procM envoie une demande Make Peer Standby à IOCM. Effacez l'alarme uniquement après la réussite du démarrage à chaud.
Cisco vous recommande de prendre connaissance des rubriques suivantes :
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
Logiciel Cisco PGW 2200 versions 9.3(2) et ultérieures
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Pour plus d'informations sur les conventions utilisées dans ce document, reportez-vous à Conventions relatives aux conseils techniques Cisco.
Après avoir exécuté la commande MML sw-over::Confirm sur le PGW 2200 Cisco actif, vous recevez cette erreur.
PGW2200 mml> sw-over::Confirm MGC-01 - Media Gateway Controller 2004-05-26 11:37:37.061 MEST M DENY SROF "Proc Mgr" /* MSO refused, Warm start-up Failed. */ ; PGW2200 mml>
Note : Un « Redémarrage à chaud » indique que le STANDBY est prêt à recevoir des données de pointage. Cela se produit généralement sur des processus tels que le réplicateur et IOCC MTP3 via l'IOCM. Il se peut que SS7 IOCC soit la raison pour laquelle IOCM rejette la commande sw-over. D'autres questions peuvent également être soulevées. Dans ce cas, collectez les informations du journal avec les informations de cette section.
Lorsque l'utilisateur tente une commutation manuelle (MSO) et est refusé, MML répond avec l'une des raisons suivantes :
MSO refusé, système de secours non prêt—Échec de la commutation car le système de secours n'était pas prêt.
MSO a refusé, démarrage à chaud en cours - Échec de la commutation car le démarrage du système de secours était en cours.
MSO refusé, échec de démarrage à chaud - MSO refusé et échec de la transition à chaud.
MSO refusé, le système n'est pas à l'état actif—Échec de la commutation car l'hôte PGW 2200 n'est pas à l'état actif.
MSO refusé, indicateur autonome détecté - Échec de la commutation car aucun hôte PGW 2200 de secours n'est configuré.
PGW2200 mml> rtrv-alms MGC-01 - Media Gateway Controller 2004-05-26 11:37:40.732 MEST M RTRV "lnk-1-cisco1: 2004-04-29 18:24:43.766 MEST,ALM=\"SC FAIL\",SEV=MJ" "lnk-1-cisco2: 2004-04-29 18:24:43.779 MEST,ALM=\"SC FAIL\",SEV=MJ" "lnk-2-cisco3: 2004-04-29 18:24:43.797 MEST,ALM=\"SC FAIL\",SEV=MJ"
Remarque : Vérifiez toujours avec la commande rtrv-alms MML les alarmes qui se produisent pendant la commande sw-over::confirm. Faites cela en combinaison avec la commande UNIX tail -f platform.log sous le répertoire /opt/CiscoMGC/var/log. Vérifiez également le message d'erreur lié à la commande sw-over.
Les messages d'erreur platform.log liés à cette situation sont les suivants :
Wed May 1 16:13:47:752 2004 MEST | ProcessManager (PID 698) <Error>GEN_ERR_HA_MSO: Cannot comply with Manual Switch Over request. Reason Warm start up failed
L'alarme de démarrage à chaud de secours est définie dans la boîte active au début du processus de démarrage à chaud dans IOCM.
L'alarme est automatiquement effacée de la zone Active uniquement lorsque le processus Warm-Start est terminé.
En cas de défaillance de Warm-Start, cette alarme n'est pas effacée. Si cela se produit, l'alarme n'est effacée que lorsque le démarrage à chaud est traité avec succès ultérieurement.
L'effet de l'alarme est qu'un basculement manuel est refusé.
Il s'agit de l'action corrective si l'alarme ne se dissipe pas :
Assurez-vous que le paramètre pom.dataSync est défini sur true dans le PGW 2200 actif et veille.
Arrêtez et démarrez le logiciel PGW 2200 de secours.
Si l'alarme n'est toujours pas effacée, ouvrez une demande de service d'assistance technique et enregistrez le fichier platform.log dans le répertoire /opt/CiscoMGC/var/log et mml.log - alarm.log, la configuration actuelle de PGW 2200, les deux répertoires de configuration précédents (CFG_) lorsque l'alarme a été vue, et platform.log des deux PGW 2220000000000.
Voici un exemple de procédure de dépannage :
Vérifiez les notes de version pour tous les éléments liés à ce message d'erreur. Celles-ci sont corrigées dans les versions ultérieures de Cisco PGW 2200.
Assurez-vous de ne pas rencontrer de correctif endommagé. Vérifiez les fichiers platform.log au moment où le problème est signalé dans le répertoire /opt/CiscoMGC/var/log. Recherchez également les messages de fichier liés aux messages d'erreur UNIX dans le répertoire /var/adm.
Cisco vous recommande de mettre à niveau les derniers correctifs Cisco PGW 2200.
Si tout est correct dans cette étape, passez à l'étape 2.
Exécutez la commande netstat -a pour voir si la réplication est en mode établi (par exemple, En veille active <->).
Émettez la commande MML-sync pour voir si cela fonctionne correctement. Émettez également une nouvelle commande sw-over::confirm et vérifiez l'état. Le Cisco PGW 2200 utilise le port TCP de réplication 2970 2974.
Sur un Cisco PGW 2200 actif, exécutez la commande UNIX netstat -a | grep 29\[0-9\]\[0-9\].
Sur la passerelle de secours Cisco PGW 2200, exécutez la commande UNIX netstat -a | grep 29\[0-9\]\[0-9\].
Par exemple, vérifiez que le système actif est en mode ESTABLISHED.
mgc-bru-20 mml> rtrv-ne MGC-01 - Media Gateway Controller 2004-05-28 11:03:46.236 GMT M RTRV "Type:MGC" "Hardware platform:sun4u sparc SUNW,UltraAX-i2" "Vendor:"Cisco Systems, Inc."" "Location:MGC-01 - Media Gateway Controller" "Version:"9.3(2)"" "Platform State:ACTIVE" ; mgc-bru-20 mml> mgcusr@mgc-bru-20% netstat -a | grep 29\[0-9\]\[0-9\] mgc-bru-20.2974 *.* 0 0 24576 0 LISTEN mgc-bru-20.2970 *.* 0 0 24576 0 LISTEN mgc-bru-20.37637 mgc-bru-22.2974 24820 0 24820 0 ESTABLISHED mgc-bru-20.37638 mgc-bru-22.2970 24820 0 24820 0 ESTABLISHED mgc-bru-20.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2906 65256 3 25D mgcusr@mgc-bru-20%
Cet exemple vérifie le système de secours pour le mode ESTABLISHED.
mgc-bru-22 mml> rtrv-ne MGC-01 - Media Gateway Controller 2004-05-28 13:09:20.552 MSD M RTRV "Type:MGC" "Hardware platform:sun4u sparc SUNW,Ultra-5_10" "Vendor:"Cisco Systems, Inc."" "Location:MGC-01 - Media Gateway Controller" "Version:"9.3(2)"" "Platform State:STANDBY" ; mgc-bru-22 mml> mgcusr@mgc-bru-22% netstat -a | grep 29\[0-9\]\[0-9\] mgc-bru-22.2974 *.* 0 0 24576 0 LISTEN mgc-bru-22.2970 *.* 0 0 24576 0 LISTEN mgc-bru-22.2974 mgc-bru-20.37637 24820 0 24820 0 ESTABLISHED mgc-bru-22.2970 mgc-bru-20.37638 24820 0 24820 0 ESTABLISHED mgc-bru-22.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2910 65256 1 25D mgcusr@mgc-bru-22%
Si cela fonctionne, passez à l'étape 3.
Vérifiez si les deux configurations sont identiques sur Active et Standby avec la commande diff UNIX.
Exécutez la commande UNIX netstat -i pour voir si vous n'avez pas d'augmentation dans les compteurs pour les valeurs Ierrs, Oerrs et Collis.
mgcusr@PGW2200% netstat -i Name Mtu Net/Dest Address Ipkts Ierrs Opkts Oerrs Collis Queue lo0 8232 loopback localhost 28389215 0 28389215 0 0 0 eri0 1500 mgc-bru-20 mgc-bru-20 187731714 231 185007958 3 0 eri1 1500 mgc-bru-20b mgc-bru-20b 0 0 82 2 0 0 mgcusr@PGW2200%
Vérifiez la configuration sur le Cisco PGW 2200 et créez un fichier de secours Cisco PGW 2200 sous le répertoire /opt. Il s'agit d'un répertoire temporaire que vous supprimez après une dernière vérification.
#mkdir temp
Utilisez FTP pour copier toutes les informations du Cisco PGW 2200 Active sous le répertoire /opt/CiscoMGC/etc. Déplacez ces informations vers la veille Cisco PGW 2200 sous le répertoire /opt/temp et les sous-répertoires. Assurez-vous de disposer d'une sauvegarde de Cisco PGW 2200 Active/Standby avant de procéder.
Remarque : Seul XECfgParm.dat change lors de la commande dircmp UNIX. Vous pouvez également exécuter la commande UNIX diff.
# dircmp -d /opt/temp /opt/CiscoMGC/etc/ May 31 13:52 2004 Comparison of /opt/temp /opt/CiscoMGC/etc/ Page 1 directory . same ./accRespCat.dat same ./alarmCats.dat same ./alarmTable.dat same ./auxSigPath.dat same ./bearChan.dat same ./bearChanSwitched.dat same ./buckets.dat same ./cable.dat same ./charge.dat same ./chargeholiday.dat same ./codec.dat same ./components.dat same ./compTypes.dat same ./condRoute.dat same ./Copyright same ./crossConnect.dat same ./dependencies.dat same ./dialplan.dat same ./digitAnalysis.dat same ./dmprSink.dat same ./dns.dat same ./dpc.dat same ./extNodes.dat same ./extNodeTypes.dat same ./extProcess.dat same ./files.dat same ./gtdParam.dat same ./linkSetProtocol.dat same ./mclCallReject.dat same ./mclThreshold.dat same ./mdlProcess.dat same ./measCats.dat same ./measProfs.dat same ./mmlCommands.dat same ./percRoute.dat same ./physLineIf.dat same ./processes.dat same ./procGroups.dat same ./profileComps.dat same ./profiles.dat same ./profileTypes.dat same ./properties.dat same ./propSet.xml.dat same ./propSet.xml.dat.old.newfile same ./propSet.xml.dat.old.newfile.newfile same ./propSet.xml.dat.old.newfile.newfile.newfile same ./propVal.xsd.dat same ./routeAnalysis.bin same ./routeAnalysis.dat same ./routes.dat same ./services.dat same ./sigChanDev.dat same ./sigChanDevIp.dat same ./sigPath.dat same ./snmpmgr.dat same ./stp.dat same ./tables.dat same ./tariff.dat same ./testLine.dat same ./thresholds.dat same ./trigger.dat same ./trigger.template same ./trunkGroup.dat same ./variant.dat same ./variant.dat.old.newfile same ./variant.dat.old.newfile.newfile same ./variant.dat.old.newfile.newfile.newfile same ./version.dat different ./XECfgParm.dat
Pour vous aider à résoudre les problèmes, vous devez également réfléchir à ce qui a changé dans le réseau au moment où ces problèmes se sont produits. Par exemple, les mises à niveau de passerelle, les modifications de configuration, les nouveaux circuits ajoutés, etc.
Passez à l'étape 4 si tout est correct dans cette étape.
Dans la plupart des cas, ce message d'erreur est lié aux processus IOCC (I/O channel controller) qui ne s'exécutent pas ou qui échouent sur le Cisco PGW 2200 de secours. Si c'est le cas, arrêtez et démarrez l'application Cisco PGW 2200 en veille avec la commande UNIX ./CiscoMGC stop. Redémarrez ensuite l'application avec la commande ./CiscoMGC start sous le répertoire /etc/init.d.
Exécutez la commande MML rtrv-softw : all sur l'hôte de secours Cisco PGW 2200 pour vous assurer que tous les processus s'exécutent correctement.
PGW2200 mml> rtrv-softw:all MGC-01 - Media Gateway Controller 2004-05-31 13:04:21.410 MSD M RTRV "CFM-01:RUNNING STANDBY" "ALM-01:RUNNING STANDBY" "MM-01:RUNNING STANDBY" "AMDMPR-01:RUNNING STANDBY" "CDRDMPR-01:RUNNING STANDBY" "DSKM-01:RUNNING IN N/A STATE" "MMDB-01:RUNNING IN N/A STATE" "POM-01:RUNNING STANDBY" "MEASAGT:RUNNING STANDBY" "OPERSAGT:RUNNING STANDBY" "ss7-i-1:RUNNING IN N/A STATE" "mgcp-1:RUNNING IN N/A STATE" "Replic-01:RUNNING STANDBY" "ENG-01:RUNNING STANDBY" "IOCM-01:RUNNING STANDBY" "TCAP-01:RUNNING IN N/A STATE" "eisup-1:RUNNING IN N/A STATE" "FOD-01:RUNNING IN N/A STATE" "sip-1:RUNNING IN N/A STATE" ; PGW2200 mml>
Si tous les processus montrent qu'ils s'exécutent correctement mais affichent toujours le message d'erreur lors de la commande MML sw-over, passez à l'étape 5. Sinon, vérifiez la raison de l'échec.
Par exemple, si vous mettez à jour et ajoutez de nouvelles agrégations SS7 et exécutez ce message d'échec sw-over. À ce stade, changez le processus ss7-i-1 en mode de débogage. Ceci fournit plus de détails sur le message d'erreur dans le fichier /opt/CiscoMGC/var/log/platform.log. La valeur par défaut est égale à l'état de l'erreur.
PGW2200 mml>rtrv-log:all MGC-01 - Media Gateway Controller 2004-05-31 13:10:35.376 MSD M RTRV "CFM-01:ERR" "ALM-01:ERR" "MM-01:ERR" "AMDMPR-01:ERR" "CDRDMPR-01:ERR" "DSKM-01:ERR" "MMDB-01:ERR" "POM-01:ERR" "MEASAGT:ERR" "OPERSAGT:ERR" "ss7-i-1:ERR" "mgcp-1:ERR" "Replic-01:ERR" "ENG-01:ERR" "IOCM-01:ERR" "TCAP-01:ERR" "eisup-1:ERR" "FOD-01:ERR" "sip-1:ERR" ; PGW2200 mml>
Modifiez le processus ss7-i-1 en mode de débogage à l'aide de cette commande MML sur l'hôte de secours Cisco PGW 2200.
mml> set-log:ss7-i-1:debug,confirm
Exécutez la commande UNIX vi pour supprimer le #caractère sous le répertoire /opt/CiscoMGC/etc pour le fichier XECfgParm.dat sur la veille.
ioChanMgr.logPrio = Debug foverd.logPrio = Debug
Sous le répertoire /etc/init.d, exécutez les commandes ./CiscoMGC/stop et ./CiscoMGC/start sur le routeur Cisco PGW 2200 de secours.
Exécutez la commande MML sw-over::confirm à nouveau. Vérifiez ensuite la commande MML rtrv-alms et la commande UNIX tail -f platform.log pour obtenir les informations sur le message d'erreur.
Vérifiez si le processus de réplication sur le Cisco PGW 2200 actif est à l'état Actif.
PGW2200 mml> rtrv-softw:all <snip> "Replic-01:RUNNING ACTIVE" <snip>
Collectez toutes les informations et ajoutez-les à la demande de service.
Si toutes ces étapes sont testées/cochées, vous pouvez poursuivre cette étape car le problème peut toujours exister sur le PGW 2200 de Cisco actif.
Pendant la fenêtre de maintenance, vous devez arrêter le Cisco PGW 2200 actif à l'aide de la commande /etc/init.d/CiscoMGC stop.
La veille doit prendre le relais. Cependant, avant d'exécuter cette étape, assurez-vous que toutes les informations de configuration du système actif (étape 3) et de la commande rtrv-tc:all indiquent que l'état des appels est supérieur ou égal à l'état Active Cisco PGW 2200. Utilisez également la commande rtrv-softw : all pour vérifier que tous les processus sont en état STANDBY.
Si cette étape échoue, ouvrez une demande de service qui inclut tous les détails et informations liés au message d'erreur.
Révision | Date de publication | Commentaires |
---|---|---|
1.0 |
02-Feb-2006 |
Première publication |