简介
本文描述如何检测由于IP池刷新问题而导致的基于RCM的UPF(用户平面功能)升级故障。
故障排除
1. 从活动冗余配置管理器(RCM)控制器运行 rcm show-statistics switchover-verbose 命令,如果它只有start_ip_pool_flush字段但end_ip_pool_flush缺失,则查找失败的UPF切换详细信息。
[RCM-active] rcm# rcm show-statistics switchover-verbose
2018年1月18日星期四21:52:11.781 UTC+00:00
邮件:
{
"stats_verbose": [
{
"状态": "失败",
“开始”: “1月18日05:08:59.442”,
"切换原因":"计划的切换",
"switchoverfailreason": "由于接收待机状态下的超时(计划的切换),旧的活动状态从PendingStandby移至活动状态",
"source_endpoint": "192.168.100.3",
"destination_endpoint":"192.168.100.2",
"start_chkpt_flush": "1月18日05:09:01.783",
"end_chkpt_flush_each": {
“1”:“1月18日05:09:05.776”,
“10”:“1月18日05:09:06.056”,
“11”:“1月18日05:09:05.909”,
“12”:“1月18日05:09:06.189”,
“13”:“1月18日05:09:05.991”,
“14”:“1月18日05:09:05.981”,
“15”:“1月18日05:09:05.531”,
“16”:“1月18日05:09:05.502”,
“17”:“1月18日05:09:05.751”,
“18”:“1月18日05:09:06.116”,
“19”:“1月18日05:09:05.834”,
“2”:“1月18日05:09:05.932”,
“20”:“1月18日05:09:05.889”,
“21”:“1月18日05:09:05.354”,
“22”: “1月18日05:09:05.780”,
“3”: “1月18日05:09:05.671”,
“4”:“1月18日05:09:05.996”,
“5”:“1月18日05:09:05.455”,
“6”:“1月18日05:09:05.839”,
“7”:“1月18日05:09:06.111”,
“8”: “1月18日05:09:06.019”,
“9”:“1月18日05:09:05.996”
},
"end_chkpt_flush": "1月18日05:09:06.189",
"start_cfg_push": "1月18日05:08:59.495",
"end_cfg_push": "Jan 18 05:09:01.774",
"start_ip_pool_flush": "Jan 18 05:09:01.783" /*此行“end_ip_pool_flush”下缺少观察结果*/
},
2. 收集源和目标UPF系统日志,涵盖切换时间+/- 30分钟。
3. 深入了解目标终端UPF(输出中为192.168.100.2)系统日志和UPF切换前后vpnmgr6(情景n6)报告与IP池/区块相关的多个错误。
日志事件示例:
- 1月18日05:09:01 <UPF> evlogd: [local-60sec1.767] [srp 84220 error] [1/0/9589 <vpnmgr:6> vpnmgr_rcm.c:6235] [context: rcm, contextID: 6] [software internal system syslog] 安装池路由失败。邮件已退回。
- evlogd: [local-60sec12.192] [vpn 5013错误] [1/0/9370 <vpnmgr:3> vpn_ip_pool.c:15699] [context: n6, contextID: 3] [software internal system syslog ] #012前缀<IP池的IPv4地址>未分配给此UP:找到的id3145764start_addr: <IP池的IPv4地址> end_addr: <IP池的IPv4地址>
注意:只有思科注册用户才能访问思科内部信息和工具。
相关信息