簡介
本檔案將說明如何疑難排解由於SGSN/MME和GGSN/服務閘道或PDN閘道(SPGW)之間的重新啟動計數器值不符而觀察到的演化GPRS通道通訊協定(EGTP)路徑失敗。
疑難排解指令
show egtpc peers interface
show egtpc peers path-failure-history
show egtpc statistics path-failure-reasons
show egtp-service all
show egtpc sessions
show egtpc statistics
egtpc test echo gtp-version 2 src-address <source node IP address> peer-address <remote node IP address>
For more details about this commands refer this mentioned link
https://www.cisco.com/c/en/us/support/docs/wireless-mobility/gateway-gprs-support-node-ggsn/119246-technote-ggsn-00.html
分析
從日誌和統計資訊中,確定移動管理實體(MME)端的重新啟動計數器值為11,EPG端的重新啟動計數器值為12。
您可以觀察此處所述的陷阱:
Internal trap notification 1112 (EGTPCPathFail) context s11mme, service s11-mme, interface type mme, self address <X.X.X.X>, peer address <Y.Y.Y.Y>, peer old restart counter 4, peer new restart counter 4, peer session count 240, failure reason no-response-from-peer, path failure detection Enabled.
Internal trap notification 1112 (EGTPCPathFail) context XGWin, service EGTP1, interface type pgw-ingress, self address <X.X.X.X>, peer address <Y.Y.Y.Y>, peer old restart counter 54, peer new restart counter 12, peer session count 1107240, failure reason restart-counter-change
Internal trap notification 1112 (EGTPCPathFail) context XGWin, service EGTP1, interface type pgw-ingress, self address <X.X.X.X>, peer address <Y.Y.Y.Y>, peer old restart counter 12, peer new restart counter 54, peer session count 1107207, failure reason create-sess-restart-counter-change
如果重新啟動計數器已變更,則供應商網關(GW)無法接受服務GPRS支援節點(SGSN)中較小的值。如果供應商GW儲存了較高的值(舊值),並且在節點重新載入後,如果Cisco SGSN傳送了較小的值,則供應商GW不接受該值。
註:根據TS 29.060:
1. 如果SGSN第一次與網關GPRS支援節點(GGSN)聯絡,或者最近重新啟動了,但沒有向GGSN指示新的重新啟動計數器值,則它將恢復資訊元素併入建立策略決策點(PDP)上下文請求中。必要時,SGSN會包含此元素。在建立PDP上下文請求消息元素中接收恢復資訊元素的GGSN會在接收回聲響應消息時像處理一樣處理恢復資訊。建立PDP上下文請求消息被視為消息中包含的PDP上下文的有效啟用請求。
2. 如果GGSN首次與SGSN聯絡,或者GGSN最近重新啟動,並且尚未向SGSN指示新的重新啟動計數器值,則GGSN會在建立PDP情景響應中包含恢復資訊元素。接收恢復資訊元素的SGSN會將其視為接收回聲響應消息時進行處理。但是,如果響應指示在GGSN中成功啟用了上下文,則它會將建立的PDP上下文視為活動。
3. GTP介面使用重新啟動計數器來跟蹤重新啟動次數。根據TS 23.060,GTP節點必須使用永久儲存以跟蹤其本地GTP重新啟動計數器,因此希望這些重新啟動計數器始終向上運行。然而,當對等節點檢測到重新啟動計數器的減少時,在TS 23.007的會話「18 GTP-C型重新啟動過程」中詳述GTP節點的行為。假設先前為對等體儲存的重新啟動計數器的值大於在Echo Response消息或GTP-C消息中接收的重新啟動計數器的值(將整數變換考慮在內)。在這種情況下,這表示可能存在爭用條件(較新的消息在較舊的消息之前到達)。收到的新Restart計數器值將被丟棄並記錄錯誤。換句話說,當GTP節點檢測到來自對等體的較低的重新啟動計數器時,它永遠不會記錄該新的重新啟動計數器。
StarOS視角
從StarOS端,您可以從升級時完成的路徑/flash/restart_file_cntr.txt顯式更改StarOS中的RC值。
根據這一理論,當與當前配置進行比較時,MME RC值低於供應商GW RC值。為了解決此問題,修改了供應商GW節點的RC值。
現在,在更改RC值後,可以看到EGTPC路徑故障已停止,但仍然存在,會話沒有增加,並且EGTPC鏈路仍然顯示非活動狀態。
以下是故障排除期間使用的命令:
show sgtp-service all | grep "restart" ----------------- to check RC value
[local]Nodename# show egtp-service all | more
Service name : egtpc_sv_service
Service-Id : 5
Context : SGs
Interface Type : mme
Status : STARTED
Restart Counter : 11 ----------------- RC value to verify
Max Remote Restart Counter Change : 255
Message Validation Mode : Standard
GTPU-Context :
GTPC Retransmission Timeout : 5000 (milliseconds)
GTPC Maximum Request Retransmissions : 4
GTPC IP QOS DSCP value : 10
GTPC Echo : Enabled
GTPC Echo Mode : Default
[local]Nodename# show egtpc peers ------------ To check link status
Sunday February 05 15:31:00 IST 2023
+----Status: (I) - Inactive (A) - Active
|
|+---GTPC Echo: (D) - Disabled (E) - Enabled
||
||+--Restart Counter Sent: (S) - Sent (N) - Not Sent
|||
|||+-Peer Restart Counter: (K) - Known (U) - Unknown
||||
||||+-Type of Node: (S) - SGW (P) - PGW
||||| (M) - MME (G) - SGSN
||||| (L) - LGW (E) - ePDG
||||| (C) - CGW (B) - MBMS
||||| (U) - Unknown
|||||
||||| Service Restart--------+ No. of
||||| ID Counter | restarts
||||| | | | Current Max
vvvvv v Peer Address v v sessions sessions LCI OCI
----- --- --------------------------------------- --- --- ----------- ------------------
IDSKS 10 X.X.X.X 91 0 0 0 X X
IDNKS 11 Y.Y.Y.Y 4 95 0 34005 X X
IDNKS 11 Z.Z.Z.Z 10 103 0 16805 X X
IDNKS 11 A.A.A.A 104 95 0 7250 X X
AESKS 11 B.B.B.B 0 0 4004 47649 X X
AESKS 11 C.C.C.C 0 0 4053 46571 X X
AESKS 11 D.D.D.D 0 0 4026 46734 X X
ABove output peers if you see no sessions on this peer and also link are inactive
進一步檢查回應要求/回應(以隱藏模式檢查):
egtpc test echo gtp-version 2 src-address <MME end IP> peer-address <EPG end IP>
這是當重新開始計數器的值被糾正並且配置與受影響的EGTP對等體的S11介面的MME值相同,然後Echo請求/響應正常但鏈路仍處於非活動狀態時的輸出。
[s11mme]Nodename# egtpc test echo gtp-version 2 src-address <X.X.X.X> peer-address <Y.Y.Y.Y>
Sunday February 05 16:22:42 IST 2023
EGTPC test echo
---------------
Peer: X.X.X.X Tx/Rx: 1/1 RTT(ms): 1 (COMPLETE) Recovery: 10 (0x0A)
然而,對於其他有問題的受影響網關,這並沒有達到預期的效果。如前所述,您仍然會收到回應請求/回應的失敗。
[s11mme]Nodename# egtpc test echo gtp-version 2 src-address <X.X.X.X> peer-address <Y.Y.Y.Y>
Sunday February 05 16:46:11 IST 2023
EGTPC test echo
---------------
Peer: X.X.X.X Tx/Rx: 1/0 RTT(ms): 0 (FAILURE)
因應措施
1. 要解決此問題,請在VNF停用之前注意/flash/restart_file_cntr.txt中當前的重新啟動計數器。稍後,當使用新軟體啟動時,請登入CF並使用舊重新啟動計數器更新檔案/flash/restart_file_cntr.txt。然後,作為正常升級過程,使用第N天配置重新載入VNF。
2. 將cat/flash/restart_file_cntr.txt修改為所需值,並以目前組態重新載入節點。
注意:您可以嘗試將SGTPC重新啟動作為初始步驟一次。