はじめに
このドキュメントでは、Redundancy Configuration Manager(RCM)のスイッチオーバー後のユーザプレーン機能(UPF)アップグレードのトラブルシューティングについて説明します。
問題
ステップ1:Active UPF(RCMベース)で、欠落チャンクのインスタンスが確認されます。
[local]UPF# context n6
[n6]UPF# show ipv6 chunks
Failure: This CLI is only for User-plane
注:UPFをホストしている送信元とターゲットのUCSサーバでDIMM/ECC/UEC/ADDDCエラーが発生していないかを常に確認し、RCM tac debug/
ステップ2:アクティブUPFで、チャンクがない場合は、UPF状態がスタンバイからアクティブに移行するためのSNMPトラップイベントを監視します。
[n6]UPF# show snmp trap history verbose | grep RCM
Tuesday November 14 21:16:45 UTC 2023
Mon Oct 13 08:24:42 2023 Internal trap notification 1426 (RCMChassisState) RCM Chassis State: (0) Chassis State Init
Mon Oct 13 08:24:49 2023 Internal trap notification 1414 (RCMServiceStart) Context Name:rcm Service Name:rcm started
Mon Oct 13 08:25:04 2023 Internal trap notification 1425 (RCMTCPConnect) Context Name: rcm
Mon Oct 13 08:25:04 2023 Internal trap notification 1421 (RCMConfigPushCompleteSent) Context Name: rcm
Mon Oct 13 08:25:04 2023 Internal trap notification 1426 (RCMChassisState) RCM Chassis State: (2) Chassis State Standby
Mon Oct 13 08:33:47 2023 Internal trap notification 1420 (RCMConfigPushCompleteReceived) Context Name:
Mon Oct 13 08:33:47 2023 Internal trap notification 1421 (RCMConfigPushCompleteSent) Context Name: rcm
Mon Oct 13 08:48:10 2023 Internal trap notification 1421 (RCMConfigPushCompleteSent) Context Name: rcm
Mon Oct 13 08:48:10 2023 Internal trap notification 1420 (RCMConfigPushCompleteReceived) Context Name: up
Mon Oct 13 08:48:12 2023 Internal trap notification 1426 (RCMChassisState) RCM Chassis State: (1) Chassis State Active
ステップ3:アクティブUPFでチャンクの欠落が発生した場合、スタンバイUPFがアクティブ状態に移行する間、syslogを調べて、対応する冗長グループ(RG-1)内のrest(5) sx-demuxサービスの停止を示すログイベントがないか確認します。
Oct 13 08:48:11 UPF evlogd: [local-60sec11.091] [sessctrl 8066 info] [1/0/9050 <sessctrl:0> ctrl_mgrs_cfg.c:2201] [context: up, contextID: 2] [software internal system critical-info syslog] Session Controller: stopping SX-DEMUX service up1 2023-10-13T08:48:11.000+0000
Oct 13 08:48:11 UPF evlogd: [local-60sec11.483] [sessctrl 8066 info] [1/0/9050 <sessctrl:0> ctrl_mgrs_cfg.c:2201] [context: up, contextID: 2] [software internal system critical-info syslog] Session Controller: stopping SX-DEMUX service up2 2023-10-13T08:48:11.000+0000
Oct 13 08:48:11 UPF evlogd: [local-60sec11.582] [sessctrl 8066 info] [1/0/9050 <sessctrl:0> ctrl_mgrs_cfg.c:2201] [context: up, contextID: 2] [software internal system critical-info syslog] Session Controller: stopping SX-DEMUX service up3 2023-10-13T08:48:11.000+0000
Oct 13 08:48:11 UPF evlogd: [local-60sec11.726] [sessctrl 8066 info] [1/0/9050 <sessctrl:0> ctrl_mgrs_cfg.c:2201] [context: up, contextID: 2] [software internal system critical-info syslog] Session Controller: stopping SX-DEMUX service up5 2023-10-13T08:48:11.000+0000
Oct 13 08:48:18 UPF evlogd: [local-60sec18.749] [sessctrl 8066 info] [1/0/9050 <sessctrl:0> ctrl_mgrs_cfg.c:2201] [context: up, contextID: 2] [software internal system critical-info syslog] Session Controller: stopping SX-DEMUX service up6 2023-10-13T08:48:18.000+0000
ステップ4:チャンクが欠落しているアクティブUPFで、デバッグモード(cli test-commands password <password>)を有効にし、UPFアクティブ期間に合ったSx DeRegトランザクションを監視するコマンドを実行します。
[n6]UPF# show ip pool vpn-sx-transactions
Context: n6
Sx transactions:
sent: 0, received: 0
Failed transactions: 0
**************************************************************************************
Sx Deregistration transactions:
**************************************************************************************
Peer Address Deregistration Time
================================ ====================================================
192.168.1.55 Mon Oct 13 08:48:18 2023
192.168.1.49 Mon Oct 13 08:48:18 2023
192.168.1.49 Mon Oct 13 08:48:18 2023
192.168.2.55 Mon Oct 13 08:48:18 2023
192.168.2.55 Mon Oct 13 08:48:18 2023
192.168.2.49 Mon Oct 13 08:48:18 2023
192.168.2.49 Mon Oct 13 08:48:18 2023
[n6]UPF#
ステップ5:チャンクが欠落しているアクティブUPFで、syslogを検索して、UPFの近くで発生しているログがアクティブ状態に移行しているかどうかを確認します。
Oct 13 08:48:12 UPF evlogd: [local-60sec12.060] [vpn 5013 error] [1/0/9399 <vpnmgr:3> _cups_ip_pool.c:16149] [context: n6, contextID: 3] [software internal system syslog] #01Prefix fd12:3456:7890:abcd::/64 is not allocated to this UP: Closest chunk found with id -2146435055 prefix0: 638057330 start_prefix1: -1391067126 end_prefix1: -1391050752 2023-10-13T08:48:12.000+0000
Vpnmgrインスタンス3タスク(vpnmgr:3)から継続的に発生するログイベントを確認します。
localsystem:$ less UPF-Destination-UPF-Syslog.log | grep "Pool_name is not present" | head -1
Oct 13 08:48:18 UPF evlogd: [local-60sec18.811] [vpn 5013 error] [1/0/9399 <vpnmgr:3> vpn_ip_pool.c:27493] [context: n6, contextID: 3] [software internal system syslog] #01Pool_name is not present in release request for prefixfd1:3456:7892:abcd::/64 2023-10-13T08:48:18.000+0000
localsystem:$
localsystem:$ less UPF-Destination-UPF-Syslog.log | grep "Pool_name is not present" | tail -1
Oct 13 09:29:59 UPF evlogd: [local-60sec59.671] [vpn 5013 error] [1/0/9399 <vpnmgr:3> vpn_ip_pool.c:27493] [context: n6, contextID: 3] [software internal system syslog] #01Pool_name is not present in release request forprefixfd1:3456:7894:abcd::/64 2023-10-13T09:29:59.000+0000
localsystem:$
解決方法
この問題に対処するための詳細については、Cisco Bug ID CSCwh97931のバグレポートを参照してください。
この問題の修正には、SRP移行時にIPチャンクのクリーンアップを防止するSxDemuxの拡張と、ログデバッグ機能の改善が含まれます。
記載されているCDETS修正がまだ使用中のUPFビルドで使用できない場合は、次の回避策を使用できます。
MWのタイムフレーム内にStandard N4アソシエーションDis-associate/Associate MOPを実行します。