소개
이 문서는 'MSO rejected, Warm start-up Failed' 메시지가 표시될 때 Cisco PGW 2200 문제를 해결하는 데 도움이 되도록 작성되었습니다.이 오류 메시지는 MML 명령 sw-over::confirm을 실행한 후 나타납니다.warm-start는 낮은 우선 순위와 비동기 작업이므로 여러 구성 요소가 대기 피어를 워밍으로 시작하는 중일 수 있습니다.경보는 스탠바이 유닛이 스탠바이 유닛으로 인계될 준비가 된 시점을 운영자가 알 수 있도록 도와줍니다.procM이 IOCM에 피어 대기 만들기 요청을 보낼 때 경보를 표시합니다.Warm-start가 성공한 후에만 알람을 지웁니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
표기 규칙
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참고하십시오.
문제 해결
활성 Cisco PGW 2200에서 MML 명령 sw-over::Confirm을 실행하면 이 오류가 표시됩니다.
PGW2200 mml> sw-over::Confirm
MGC-01 - Media Gateway Controller 2004-05-26 11:37:37.061 MEST
M DENY
SROF
"Proc Mgr"
/* MSO refused, Warm start-up Failed. */
;
PGW2200 mml>
참고: "Warm Restart"는 STANDBY가 체크포인트 데이터를 수신할 준비가 되었음을 나타냅니다.일반적으로 IOCM을 통한 복제기 및 IOCC MTP3와 같은 프로세스에서 발생합니다.IOCM이 sw-over 명령을 거부하는 이유는 SS7 IOCC가 원인일 수 있습니다.다른 문제도 있을 수 있습니다.이 경우 이 섹션의 정보와 함께 로그 정보를 수집합니다.
사용자가 수동 전환(MSO)을 시도하고 거부되면 MML은 다음 이유 중 하나로 응답합니다.
-
MSO가 거부됨, 대기 시스템이 준비되지 않음 - 대기 시스템이 준비되지 않아 전환이 실패했습니다.
-
MSO가 거부됨, 준비 시작 중이 진행 중입니다 - 대기 시스템의 시작이 진행 중이므로 전환이 실패했습니다.
-
MSO가 거부됨, Warm start-up Failed - MSO가 거부되고 Warm Start-Up 전환이 실패했습니다.
-
MSO가 거부됨, 시스템이 활성 상태가 아닙니다—PGW 2200 호스트가 활성 상태가 아니므로 전환하지 못했습니다.
-
MSO 거부됨, Detected standalone Flag(MSO 거부됨, 독립형 플래그 탐지됨) - 구성된 스탠바이 PGW 2200 호스트가 없으므로 스위치가 실패했습니다.
PGW2200 mml> rtrv-alms
MGC-01 - Media Gateway Controller 2004-05-26 11:37:40.732 MEST
M RTRV
"lnk-1-cisco1: 2004-04-29 18:24:43.766 MEST,ALM=\"SC FAIL\",SEV=MJ"
"lnk-1-cisco2: 2004-04-29 18:24:43.779 MEST,ALM=\"SC FAIL\",SEV=MJ"
"lnk-2-cisco3: 2004-04-29 18:24:43.797 MEST,ALM=\"SC FAIL\",SEV=MJ"
참고: 항상 sw-over::confirm 명령 중에 발생하는 경보를 MML rtrv-alms 명령으로 확인합니다./opt/CiscoMGC/var/log 디렉토리 아래의 UNIX 명령 tail -f platform.log와 함께 이 작업을 수행합니다.sw-over 명령에 연결된 오류 메시지도 확인합니다.
이 상황에 연결된 platform.log 오류 메시지는 다음과 같습니다.
Wed May 1 16:13:47:752 2004 MEST | ProcessManager
(PID 698) <Error>GEN_ERR_HA_MSO: Cannot comply with Manual
Switch Over request. Reason Warm start up failed
문제 해결 절차 예
대기 준비 시작 경보는 IOCM에서 Warm-Start 프로세스가 시작될 때 활성 상자에 설정됩니다.
Warm-Start 프로세스가 성공적으로 완료된 경우에만 활성 상자에서 경보가 자동으로 지워집니다.
Warm-Start 장애 시 이 경보는 지워지지 않습니다.이 경우 나중에 Warm-Start가 성공적으로 처리될 때만 경보가 지워집니다.
알람의 영향을 받는 것은 수동 전환이 거부된다는 것입니다.
알람이 명확하지 않은 경우 이는 수정 조치입니다.
-
pom.dataSync 매개 변수가 Active 및 Standby PGW 2200에서 true로 설정되었는지 확인합니다.
-
스탠바이 PGW 2200 소프트웨어를 중지하고 시작합니다.
-
알람이 아직 명확하지 않은 경우 기술 지원 서비스 요청을 열고 platform.log를 /opt/CiscoMGC/var/log 및 mml.log 디렉토리(alarm.log), 현재 PGW 2200 구성, 경보가 표시될 때 이전 두 개의 구성 디렉토리(CFG_), 두 PGW 2200의 platform.log를 서비스 요청에 기록합니다.
다음은 문제 해결 절차의 예입니다.
-
이 오류 메시지에 연결된 항목이 있는지 릴리스 정보를 확인합니다.이러한 기능은 이후 Cisco PGW 2200 릴리스에서 수정되었습니다.
손상된 패치와 충돌하지 않아야 합니다./opt/CiscoMGC/var/log 디렉터리에 문제가 보고되는 즉시 platform.log 파일을 확인합니다.또한 /var/adm 디렉터리에서 UNIX 오류 메시지와 관련된 파일 메시지를 확인합니다.
최신 Cisco PGW 2200 패치로 업그레이드할 것을 권장합니다.
이 단계의 모든 것이 정상이면 2단계로 진행합니다.
-
netstat -a 명령을 실행하여 복제가 설정 모드(예: 활성 <-> 대기)인지 확인합니다.
MML prov-sync 명령을 실행하여 제대로 작동하는지 확인합니다.또한 sw-over::confirm 명령을 다시 실행하고 상태를 확인합니다.Cisco PGW 2200은 복제 TCP 포트 2970,2974를 사용합니다.
예를 들어, 활성 시스템이 ESTABLISHED 모드에 있는지 확인합니다.
mgc-bru-20 mml> rtrv-ne
MGC-01 - Media Gateway Controller 2004-05-28 11:03:46.236 GMT
M RTRV
"Type:MGC"
"Hardware platform:sun4u sparc SUNW,UltraAX-i2"
"Vendor:"Cisco Systems, Inc.""
"Location:MGC-01 - Media Gateway Controller"
"Version:"9.3(2)""
"Platform State:ACTIVE"
;
mgc-bru-20 mml>
mgcusr@mgc-bru-20% netstat -a | grep 29\[0-9\]\[0-9\]
mgc-bru-20.2974 *.* 0 0 24576 0 LISTEN
mgc-bru-20.2970 *.* 0 0 24576 0 LISTEN
mgc-bru-20.37637 mgc-bru-22.2974 24820 0 24820 0 ESTABLISHED
mgc-bru-20.37638 mgc-bru-22.2970 24820 0 24820 0 ESTABLISHED
mgc-bru-20.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2906 65256 3 25D
mgcusr@mgc-bru-20%
이 예에서는 스탠바이 시스템에서 ESTABLISHED 모드를 확인합니다.
mgc-bru-22 mml> rtrv-ne
MGC-01 - Media Gateway Controller 2004-05-28 13:09:20.552 MSD
M RTRV
"Type:MGC"
"Hardware platform:sun4u sparc SUNW,Ultra-5_10"
"Vendor:"Cisco Systems, Inc.""
"Location:MGC-01 - Media Gateway Controller"
"Version:"9.3(2)""
"Platform State:STANDBY"
;
mgc-bru-22 mml>
mgcusr@mgc-bru-22% netstat -a | grep 29\[0-9\]\[0-9\]
mgc-bru-22.2974 *.* 0 0 24576 0 LISTEN
mgc-bru-22.2970 *.* 0 0 24576 0 LISTEN
mgc-bru-22.2974 mgc-bru-20.37637 24820 0 24820 0 ESTABLISHED
mgc-bru-22.2970 mgc-bru-20.37638 24820 0 24820 0 ESTABLISHED
mgc-bru-22.telnet dhcp-peg3-cl31144-254-5-149.cisco.com.2910 65256 1 25D
mgcusr@mgc-bru-22%
이 문제가 정상이면 3단계로 진행합니다.
-
UNIX diff 명령을 사용하여 활성 및 대기 구성에서 두 컨피그레이션이 동일한지 확인합니다.
UNIX 명령 netstat -i를 실행하여 Ierrs, Oerrs 및 Collis 값에 대한 카운터가 증가하지 않았는지 확인합니다.
mgcusr@PGW2200% netstat -i
Name Mtu Net/Dest Address Ipkts Ierrs Opkts Oerrs Collis Queue
lo0 8232 loopback localhost 28389215 0 28389215 0 0 0
eri0 1500 mgc-bru-20 mgc-bru-20 187731714 231 185007958 3 0
eri1 1500 mgc-bru-20b mgc-bru-20b 0 0 82 2 0 0
mgcusr@PGW2200%
Cisco PGW 2200의 컨피그레이션을 확인하고 /opt 디렉토리 아래에 Cisco PGW 2200 Standby 파일을 생성합니다.이 디렉토리는 최종 확인 후 제거하는 임시 디렉토리입니다.
#mkdir temp
FTP를 사용하여 Cisco PGW 2200 Active의 모든 정보를 /opt/CiscoMGC/etc 디렉토리 아래에 복사합니다.이 정보를 /opt/temp 디렉토리 및 하위 디렉토리 아래의 Cisco PGW 2200 Standby로 이동합니다.이 작업을 수행하기 전에 Cisco PGW 2200 액티브/스탠바이 백업이 있는지 확인하십시오.
참고: UNIX dircmp 명령 중 XECfgParm.dat만 변경됩니다.UNIX 명령 diff를 실행할 수도 있습니다.
# dircmp -d /opt/temp /opt/CiscoMGC/etc/
May 31 13:52 2004 Comparison of /opt/temp /opt/CiscoMGC/etc/ Page 1
directory .
same ./accRespCat.dat
same ./alarmCats.dat
same ./alarmTable.dat
same ./auxSigPath.dat
same ./bearChan.dat
same ./bearChanSwitched.dat
same ./buckets.dat
same ./cable.dat
same ./charge.dat
same ./chargeholiday.dat
same ./codec.dat
same ./components.dat
same ./compTypes.dat
same ./condRoute.dat
same ./Copyright
same ./crossConnect.dat
same ./dependencies.dat
same ./dialplan.dat
same ./digitAnalysis.dat
same ./dmprSink.dat
same ./dns.dat
same ./dpc.dat
same ./extNodes.dat
same ./extNodeTypes.dat
same ./extProcess.dat
same ./files.dat
same ./gtdParam.dat
same ./linkSetProtocol.dat
same ./mclCallReject.dat
same ./mclThreshold.dat
same ./mdlProcess.dat
same ./measCats.dat
same ./measProfs.dat
same ./mmlCommands.dat
same ./percRoute.dat
same ./physLineIf.dat
same ./processes.dat
same ./procGroups.dat
same ./profileComps.dat
same ./profiles.dat
same ./profileTypes.dat
same ./properties.dat
same ./propSet.xml.dat
same ./propSet.xml.dat.old.newfile
same ./propSet.xml.dat.old.newfile.newfile
same ./propSet.xml.dat.old.newfile.newfile.newfile
same ./propVal.xsd.dat
same ./routeAnalysis.bin
same ./routeAnalysis.dat
same ./routes.dat
same ./services.dat
same ./sigChanDev.dat
same ./sigChanDevIp.dat
same ./sigPath.dat
same ./snmpmgr.dat
same ./stp.dat
same ./tables.dat
same ./tariff.dat
same ./testLine.dat
same ./thresholds.dat
same ./trigger.dat
same ./trigger.template
same ./trunkGroup.dat
same ./variant.dat
same ./variant.dat.old.newfile
same ./variant.dat.old.newfile.newfile
same ./variant.dat.old.newfile.newfile.newfile
same ./version.dat
different ./XECfgParm.dat
트러블슈팅을 지원하려면 이러한 문제가 발생한 시점에 네트워크에서 변경된 사항을 고려해야 합니다.예를 들어, 게이트웨이 업그레이드, 컨피그레이션 변경, 추가된 모든 새 회로 등이 있습니다.
이 단계의 모든 것이 정상이면 4단계로 진행합니다.
-
대부분의 경우 이 오류 메시지는 대기 Cisco PGW 2200에서 실행되지 않거나 장애가 발생한 I/O 채널 컨트롤러(IOCC) 프로세스에 연결됩니다.이 경우 UNIX 명령을 사용하여 Standby에서 Cisco PGW 2200 애플리케이션을 중지하고 시작합니다./CiscoMGC stop.그런 다음 /etc/init.d 디렉토리에서 ./CiscoMGC start 명령을 사용하여 애플리케이션을 재시작합니다.
Cisco PGW 2200 Standby 호스트에서 MML 명령 rtrv-softw:all을 실행하여 모든 프로세스가 올바르게 실행되도록 합니다.
PGW2200 mml> rtrv-softw:all
MGC-01 - Media Gateway Controller 2004-05-31 13:04:21.410 MSD
M RTRV
"CFM-01:RUNNING STANDBY"
"ALM-01:RUNNING STANDBY"
"MM-01:RUNNING STANDBY"
"AMDMPR-01:RUNNING STANDBY"
"CDRDMPR-01:RUNNING STANDBY"
"DSKM-01:RUNNING IN N/A STATE"
"MMDB-01:RUNNING IN N/A STATE"
"POM-01:RUNNING STANDBY"
"MEASAGT:RUNNING STANDBY"
"OPERSAGT:RUNNING STANDBY"
"ss7-i-1:RUNNING IN N/A STATE"
"mgcp-1:RUNNING IN N/A STATE"
"Replic-01:RUNNING STANDBY"
"ENG-01:RUNNING STANDBY"
"IOCM-01:RUNNING STANDBY"
"TCAP-01:RUNNING IN N/A STATE"
"eisup-1:RUNNING IN N/A STATE"
"FOD-01:RUNNING IN N/A STATE"
"sip-1:RUNNING IN N/A STATE"
;
PGW2200 mml>
모든 프로세스가 올바르게 실행되었지만 MML 명령 sw-over 중에 오류 메시지를 표시하는 경우 5단계로 진행합니다. 그렇지 않으면 실패 사유를 확인합니다.
예를 들어, 새 SS7 트렁크를 업데이트 및 추가하고 이 sw-over 실패 메시지를 실행하는 경우를 들 수 있습니다.이때 ss7-i-1 프로세스를 디버그 모드로 변경합니다./opt/CiscoMGC/var/log/platform.log 파일에서 오류 메시지에 대한 자세한 내용을 볼 수 있습니다.기본값은 오류 상태와 같습니다.
PGW2200 mml>rtrv-log:all
MGC-01 - Media Gateway Controller 2004-05-31 13:10:35.376 MSD
M RTRV
"CFM-01:ERR"
"ALM-01:ERR"
"MM-01:ERR"
"AMDMPR-01:ERR"
"CDRDMPR-01:ERR"
"DSKM-01:ERR"
"MMDB-01:ERR"
"POM-01:ERR"
"MEASAGT:ERR"
"OPERSAGT:ERR"
"ss7-i-1:ERR"
"mgcp-1:ERR"
"Replic-01:ERR"
"ENG-01:ERR"
"IOCM-01:ERR"
"TCAP-01:ERR"
"eisup-1:ERR"
"FOD-01:ERR"
"sip-1:ERR"
;
PGW2200 mml>
-
Cisco PGW 2200 Standby 호스트에서 이 MML 명령을 사용하여 ss7-i-1 프로세스를 디버그 모드로 변경합니다.
mml> set-log:ss7-i-1:debug,confirm
-
UNIX 명령 vi를 실행하여 대기의 XECfgParm.dat 파일에 대한 /opt/CiscoMGC/etc 디렉토리 아래에서 #문자를 제거합니다.
ioChanMgr.logPrio = Debug
foverd.logPrio = Debug
-
/etc/init.d 디렉토리에서 대기 Cisco PGW 2200에서 /CiscoMGC/stop 및 /CiscoMGC/start 명령을 실행합니다.
-
MML 명령 sw-over::confirm을 다시 실행합니다.그런 다음 MML rtrv-alms 명령 및 UNIX 명령 tail -f platform.log에서 오류 메시지 정보를 확인합니다.
-
활성 Cisco PGW 2200의 복제 프로세스가 활성 상태인지 확인합니다.
PGW2200 mml> rtrv-softw:all
<snip>
"Replic-01:RUNNING ACTIVE"
<snip>
모든 정보를 수집하고 이러한 세부 정보를 서비스 요청에 추가합니다.
-
이 모든 단계를 테스트/선택한 경우 활성 Cisco PGW 2200에 문제가 계속 있을 수 있으므로 이 단계를 진행할 수 있습니다.
유지 보수 기간 동안 /etc/init.d/CiscoMGC stop 명령을 사용하여 활성 Cisco PGW 2200을 종료해야 합니다.
스탠바이가 인계해야 합니다.그러나 이 단계를 수행하기 전에 활성 시스템(3단계) 및 rtrv-tc:all 명령의 모든 컨피그레이션 정보가 활성 Cisco PGW 2200보다 크거나 같은지 확인합니다.또한 rtrv-softw:all 명령을 사용하여 모든 프로세스가 STANDBY 상태에 있는지 확인합니다.
이 단계가 실패하면 오류 메시지와 관련된 모든 세부사항 및 정보가 포함된 서비스 요청을 엽니다.
관련 정보