O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.
A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.
Este documento foi projetado para ajudá-lo a solucionar problemas do Cisco PGW 2200 quando você recebe a mensagem 'MSO recusado, Warm start-up Failed'. Esta mensagem de erro é exibida depois que você emite o comando MML sw-over::confirm. Como o início a quente é uma atividade de baixa prioridade e assíncrona, vários componentes podem estar no processo de início a quente de seus peers em standby. O alarme ajuda um operador a saber quando uma unidade de standby está pronta para assumir o controle como um standby. Aumente o alarme quando o procM enviar uma solicitação Make Peer Standby para o IOCM. Somente apague o alarme depois que o início a quente for bem-sucedido.
A Cisco recomenda que você tenha conhecimento destes tópicos:
As informações neste documento são baseadas nestas versões de software e hardware:
Software Cisco PGW 2200 versões 9.3(2) e posteriores
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
Depois de emitir o comando MML sw-over::Confirm no Cisco PGW 2200 ativo, você recebe este erro.
PGW2200 mml> sw-over::Confirm MGC-01 - Media Gateway Controller 2004-05-26 11:37:37.061 MEST M DENY SROF "Proc Mgr" /* MSO refused, Warm start-up Failed. */ ; PGW2200 mml>
Observação: uma "reinicialização a quente" é uma indicação de que o STANDBY está pronto para receber dados de verificação. Isso geralmente acontece em processos como o replicador e IOCC MTP3 através do IOCM. Pode ser que o SS7 IOCC seja a razão pela qual o IOCM rejeita o comando sw-over. Outros problemas também podem ser o caso. Para esse caso, colete as informações de log com as informações desta seção.
Quando o usuário tenta um switchover manual (MSO) e é negado, a MML responde com um dos seguintes motivos:
MSO recusado, sistema de espera não pronto — O switchover falhou porque o sistema de espera não estava pronto.
MSO recusado, inicialização a quente em andamento — A comutação falhou porque a inicialização do sistema em espera estava em andamento.
MSO recusado, Falha na inicialização a quente — MSO é recusado e o switchover de inicialização a quente falhou.
MSO recusado, o sistema não está no estado ativo — falha na comutação porque o host PGW 2200 não está no estado ativo.
MSO recusado, Detectado sinalizador autônomo — Falha na comutação porque nenhum host PGW 2200 em standby está configurado.
PGW2200 mml> rtrv-alms MGC-01 - Media Gateway Controller 2004-05-26 11:37:40.732 MEST M RTRV "lnk-1-cisco1: 2004-04-29 18:24:43.766 MEST,ALM=\"SC FAIL\",SEV=MJ" "lnk-1-cisco2: 2004-04-29 18:24:43.779 MEST,ALM=\"SC FAIL\",SEV=MJ" "lnk-2-cisco3: 2004-04-29 18:24:43.797 MEST,ALM=\"SC FAIL\",SEV=MJ"
Observação: sempre verifique com o comando MML rtrv-alms os alarmes que ocorrem durante o comando sw-over::confirm. Faça isso em combinação com o comando UNIX tail -f platform.log no diretório /opt/CiscoMGC/var/log. Verifique também a mensagem de erro vinculada ao comando sw-over.
As mensagens de erro platform.log vinculadas a esta situação são:
Wed May 1 16:13:47:752 2004 MEST | ProcessManager (PID 698) <Error>GEN_ERR_HA_MSO: Cannot comply with Manual Switch Over request. Reason Warm start up failed
O alarme Standby Warm Start é definido na Ative Box no início do processo Warm-Start no IOCM.
O alarme é automaticamente apagado da caixa Ativa somente quando o processo Warm-Start é concluído com êxito.
No caso de uma falha de início de aquecimento, esse alarme não é limpo. Se isso ocorrer, o alarme será cancelado somente quando o Warm-Start for processado com êxito posteriormente.
O efeito do alarme é que um switch-over manual é negado.
Esta é a ação corretiva se o alarme não limpar:
Verifique se o parâmetro pom.dataSync está definido como verdadeiro no PGW 2200 Ativo e em standby.
Pare e inicie o software PGW 2200 em standby.
Se o alarme ainda não estiver limpo, abra uma solicitação de serviço do Suporte Técnico e registre o platform.log no diretório /opt/CiscoMGC/var/log e mml.log - alarm.log, a configuração atual PGW 2200, os dois diretórios de configuração anteriores (CFG_) quando o alarme tiver sido visto, e platform.log do PGW 2200 para a solicitação de serviço.
Este é um exemplo de um procedimento de solução de problemas:
Verifique as notas de versão de qualquer item vinculado a esta mensagem de erro. Eles são corrigidos em versões posteriores do Cisco PGW 2200.
Certifique-se de que não está com nenhum patch corrompido. Verifique os arquivos platform.log no momento em que o problema é relatado no diretório /opt/CiscoMGC/var/log. Verifique também as mensagens de arquivo relacionadas a mensagens de erro UNIX no diretório /var/adm.
A Cisco recomenda que você faça o upgrade para os patches mais recentes do Cisco PGW 2200.
Se tudo nessa etapa estiver OK, vá para a etapa 2.
Emita o comando netstat -a para ver se a replicação está em um modo estabelecido (por exemplo, Ative <-> Standby).
Emita o comando MML prov-sync para ver se isso funciona corretamente. Além disso, emita um comando sw-over::confirm novamente e verifique o status. O Cisco PGW 2200 usa a porta 2970.2974 do Replication TCP.
Em um Cisco PGW 2200 ativo, execute o comando UNIX netstat -a | grep 29\[0-9\]\[0-9\].
No Cisco PGW 2200 em standby, execute o comando UNIX netstat -a | grep 29\[0-9\]\[0-9\].
Por exemplo, verifique o sistema ativo para ver se ele está em um modo ESTABLISHED.
mgc-bru-20 mml> rtrv-ne MGC-01 - Media Gateway Controller 2004-05-28 11:03:46.236 GMT M RTRV "Type:MGC" "Hardware platform:sun4u sparc SUNW,UltraAX-i2" "Vendor:"Cisco Systems, Inc."" "Location:MGC-01 - Media Gateway Controller" "Version:"9.3(2)"" "Platform State:ACTIVE" ; mgc-bru-20 mml> mgcusr@mgc-bru-20% netstat -a | grep 29\[0-9\]\[0-9\] mgc-bru-20.2974 *.* 0 0 24576 0 LISTEN mgc-bru-20.2970 *.* 0 0 24576 0 LISTEN mgc-bru-20.37637 mgc-bru-22.2974 24820 0 24820 0 ESTABLISHED mgc-bru-20.37638 mgc-bru-22.2970 24820 0 24820 0 ESTABLISHED mgc-bru-20.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2906 65256 3 25D mgcusr@mgc-bru-20%
Este exemplo verifica se o sistema de Standby está no modo ESTABLISHED.
mgc-bru-22 mml> rtrv-ne MGC-01 - Media Gateway Controller 2004-05-28 13:09:20.552 MSD M RTRV "Type:MGC" "Hardware platform:sun4u sparc SUNW,Ultra-5_10" "Vendor:"Cisco Systems, Inc."" "Location:MGC-01 - Media Gateway Controller" "Version:"9.3(2)"" "Platform State:STANDBY" ; mgc-bru-22 mml> mgcusr@mgc-bru-22% netstat -a | grep 29\[0-9\]\[0-9\] mgc-bru-22.2974 *.* 0 0 24576 0 LISTEN mgc-bru-22.2970 *.* 0 0 24576 0 LISTEN mgc-bru-22.2974 mgc-bru-20.37637 24820 0 24820 0 ESTABLISHED mgc-bru-22.2970 mgc-bru-20.37638 24820 0 24820 0 ESTABLISHED mgc-bru-22.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2910 65256 1 25D mgcusr@mgc-bru-22%
Se estiver tudo bem, vá para a etapa 3.
Verifique se ambas as configurações são as mesmas em Ativo e em Standby com o comando diff UNIX.
Emita o comando UNIX netstat -i para ver se você não tem nenhum aumento nos contadores dos valores Ierrs, Oerrs e Collis.
mgcusr@PGW2200% netstat -i Name Mtu Net/Dest Address Ipkts Ierrs Opkts Oerrs Collis Queue lo0 8232 loopback localhost 28389215 0 28389215 0 0 0 eri0 1500 mgc-bru-20 mgc-bru-20 187731714 231 185007958 3 0 eri1 1500 mgc-bru-20b mgc-bru-20b 0 0 82 2 0 0 mgcusr@PGW2200%
Verifique a configuração no Cisco PGW 2200 e crie um arquivo Cisco PGW 2200 Standby no diretório /opt. Este é um diretório temporário que você remove após uma verificação final.
#mkdir temp
Use o FTP para copiar todas as informações do Cisco PGW 2200 Ative no diretório /opt/CiscoMGC/etc. Mova essas informações para o Cisco PGW 2200 Standby no diretório /opt/temp e nos subdiretórios. Antes de fazer isso, certifique-se de ter um backup do Cisco PGW 2200 Ative/Standby.
Observação: somente XECfgParm.dat é alterado durante o comando dircmp UNIX. Você também pode executar o comando UNIX diff.
# dircmp -d /opt/temp /opt/CiscoMGC/etc/ May 31 13:52 2004 Comparison of /opt/temp /opt/CiscoMGC/etc/ Page 1 directory . same ./accRespCat.dat same ./alarmCats.dat same ./alarmTable.dat same ./auxSigPath.dat same ./bearChan.dat same ./bearChanSwitched.dat same ./buckets.dat same ./cable.dat same ./charge.dat same ./chargeholiday.dat same ./codec.dat same ./components.dat same ./compTypes.dat same ./condRoute.dat same ./Copyright same ./crossConnect.dat same ./dependencies.dat same ./dialplan.dat same ./digitAnalysis.dat same ./dmprSink.dat same ./dns.dat same ./dpc.dat same ./extNodes.dat same ./extNodeTypes.dat same ./extProcess.dat same ./files.dat same ./gtdParam.dat same ./linkSetProtocol.dat same ./mclCallReject.dat same ./mclThreshold.dat same ./mdlProcess.dat same ./measCats.dat same ./measProfs.dat same ./mmlCommands.dat same ./percRoute.dat same ./physLineIf.dat same ./processes.dat same ./procGroups.dat same ./profileComps.dat same ./profiles.dat same ./profileTypes.dat same ./properties.dat same ./propSet.xml.dat same ./propSet.xml.dat.old.newfile same ./propSet.xml.dat.old.newfile.newfile same ./propSet.xml.dat.old.newfile.newfile.newfile same ./propVal.xsd.dat same ./routeAnalysis.bin same ./routeAnalysis.dat same ./routes.dat same ./services.dat same ./sigChanDev.dat same ./sigChanDevIp.dat same ./sigPath.dat same ./snmpmgr.dat same ./stp.dat same ./tables.dat same ./tariff.dat same ./testLine.dat same ./thresholds.dat same ./trigger.dat same ./trigger.template same ./trunkGroup.dat same ./variant.dat same ./variant.dat.old.newfile same ./variant.dat.old.newfile.newfile same ./variant.dat.old.newfile.newfile.newfile same ./version.dat different ./XECfgParm.dat
Para ajudá-lo a solucionar problemas, você também precisa pensar sobre o que mudou na rede no momento em que esses problemas ocorreram. Por exemplo, atualizações de gateway, alterações de configuração, novos circuitos adicionados e assim por diante.
Vá para a etapa 4 se tudo nessa etapa estiver OK.
Na maioria dos casos, essa mensagem de erro é vinculada a processos do controlador de canal de E/S (IOCC) que não são executados ou a uma falha no Cisco PGW 2200 em standby. Se esse for o caso, pare e inicie o aplicativo Cisco PGW 2200 em standby com o comando UNIX ./CiscoMGC stop. Em seguida, reinicie o aplicativo com o comando ./CiscoMGC start no diretório /etc/init.d.
Execute o comando MML rtrv-softw:all no host de standby Cisco PGW 2200 para garantir que todos os processos sejam executados corretamente.
PGW2200 mml> rtrv-softw:all MGC-01 - Media Gateway Controller 2004-05-31 13:04:21.410 MSD M RTRV "CFM-01:RUNNING STANDBY" "ALM-01:RUNNING STANDBY" "MM-01:RUNNING STANDBY" "AMDMPR-01:RUNNING STANDBY" "CDRDMPR-01:RUNNING STANDBY" "DSKM-01:RUNNING IN N/A STATE" "MMDB-01:RUNNING IN N/A STATE" "POM-01:RUNNING STANDBY" "MEASAGT:RUNNING STANDBY" "OPERSAGT:RUNNING STANDBY" "ss7-i-1:RUNNING IN N/A STATE" "mgcp-1:RUNNING IN N/A STATE" "Replic-01:RUNNING STANDBY" "ENG-01:RUNNING STANDBY" "IOCM-01:RUNNING STANDBY" "TCAP-01:RUNNING IN N/A STATE" "eisup-1:RUNNING IN N/A STATE" "FOD-01:RUNNING IN N/A STATE" "sip-1:RUNNING IN N/A STATE" ; PGW2200 mml>
Se todos os processos mostrarem que estão sendo executados corretamente, mas ainda exibirem a mensagem de erro durante o comando MML sw-over, vá para a etapa 5. Caso contrário, verifique o motivo da falha.
Um exemplo é se você atualiza e adiciona alguns troncos SS7 novos e executa esta mensagem de falha sw-over. Nesse ponto, altere o processo ss7-i-1 para o modo de depuração. Isso fornece mais detalhes da mensagem de erro no arquivo /opt/CiscoMGC/var/log/platform.log. O padrão é o status do erro.
PGW2200 mml>rtrv-log:all MGC-01 - Media Gateway Controller 2004-05-31 13:10:35.376 MSD M RTRV "CFM-01:ERR" "ALM-01:ERR" "MM-01:ERR" "AMDMPR-01:ERR" "CDRDMPR-01:ERR" "DSKM-01:ERR" "MMDB-01:ERR" "POM-01:ERR" "MEASAGT:ERR" "OPERSAGT:ERR" "ss7-i-1:ERR" "mgcp-1:ERR" "Replic-01:ERR" "ENG-01:ERR" "IOCM-01:ERR" "TCAP-01:ERR" "eisup-1:ERR" "FOD-01:ERR" "sip-1:ERR" ; PGW2200 mml>
Altere o processo ss7-i-1 para o modo de depuração com este comando MML no host de standby Cisco PGW 2200.
mml> set-log:ss7-i-1:debug,confirm
Emita o comando UNIX vi para remover o # caractere no diretório /opt/CiscoMGC/etc para o arquivo XECfgParm.dat no modo de espera.
ioChanMgr.logPrio = Debug foverd.logPrio = Debug
No diretório /etc/init.d, execute os comandos ./CiscoMGC/stop e ./CiscoMGC/start no Cisco PGW 2200 em standby.
Emita o comando MML sw-over::confirm novamente. Em seguida, verifique o comando MML rtrv-alms e o comando UNIX tail -f platform.log para obter as informações da mensagem de erro.
Verifique se o processo de replicação no Cisco PGW 2200 ativo está no estado Ativo.
PGW2200 mml> rtrv-softw:all <snip> "Replic-01:RUNNING ACTIVE" <snip>
Colete todas as informações e adicione esses detalhes à solicitação de serviço.
Se todas essas etapas forem testadas/marcadas, você poderá prosseguir com essa etapa, pois o problema ainda pode existir no Cisco PGW 2200 ativo.
Durante a janela de manutenção, você precisa desligar o Cisco PGW 2200 ativo com o comando /etc/init.d/CiscoMGC stop.
O Standby precisa assumir. No entanto, antes de executar esta etapa, certifique-se de que todas as informações de configuração do sistema ativo (etapa 3) e do comando rtrv-tc:all mostrem que o status das chamadas é maior ou igual ao Cisco PGW 2200 ativo. Use também o comando rtrv-softw:all para verificar se todos os processos estão no status STANDBY.
Se essa etapa falhar, abra uma Solicitação de serviço que inclua todos os detalhes e informações relacionados à mensagem de erro.
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
02-Feb-2006 |
Versão inicial |