概要
このドキュメントでは、Grafanaダッシュボードを使用して、Common Execution Environment(CEE)で生成されたアラートをトラブルシューティングする方法について説明します。
CEEのアラート
アラートルールはCEE Ops Centerで設定できます。次に例を示します。
alerts rules group Pod
interval-seconds 300
rule Memory_Major
expression "(go_memstats_heap_inuse_bytes{pod=~\"rest-ep.*|smf-service.*|gtpc-ep.*|protocol.*|udp-proxy.*|cache-pod.*\"} /16000000000) >= 0.5"
duration 15m
severity major
type "Processing Error Alarm"
annotation summary
value "\"POD {{ $labels.pod }} in Namespace: {{ $labels.namespace }} has reached 50% of utilization\""
exit
exit
exit
この式はPromQLに依存しており、この例では、指定された各ポッドのgo_memstats_heap_inuse_bytes(=メモリ使用量)を監視しています。また、合計メモリを16 GBとしてメモリ使用率を計算し、使用率が75%を超えるとアラートを生成します。生成されたアラートは、show alerts historyまたはshow alerts active CLIで表示できます。
[unknown] cee# show alerts active summary | include Memory_Major
Memory_Major 68e812264ed6 major 10-28T02:23:44 worker1 POD cache-pod-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 627af1cdd01c major 10-28T02:23:44 worker1 POD cache-pod-1 in Namespace: smf-data has reached 50% of utilization
Memory_Major 394d713e294b major 10-28T02:23:44 worker1 POD gtpc-ep-n0-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major bd95b1a35ef5 major 10-28T02:23:44 worker1 POD smf-rest-ep-n0-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 57254fd42f1a major 10-28T02:23:44 worker1 POD smf-udp-proxy-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 56135a34c635 major 10-28T02:23:44 worker1 POD smf-service-n0-0 in Namespace: smf-data has reached 50% of utilization
アラートの詳細については、このドキュメントを参照してください。
アプリケーションベースのアラート
https://www.cisco.com/c/en/us/td/docs/wireless/ucc/smf/b_SMF/b_SMF_chapter_0110101.html
トラブルシューティング方法
CLIでは、実際の測定値や傾向分析データは提供されません。さらにトラブルシューティングする最善の方法は、Grafanaダッシュボードを使用することです。前述のように、アラートはPromQLによって定義されるため、同じ構文を適用してGrafanaにグラフを作成できます。
ルールを例として、この構文を使用してグラフを作成できます。
(go_memstats_heap_inuse_bytes{pod=~"rest-ep.*|smf-service.*|gtpc-ep.*|protocol.*|udp-proxy.*|cache-pod.*"}/16000000000)*100
注:
1.エスケープシーケンスとして使用される構文の"\"を削除する
2.100を掛けて、パーセント表示にします