Introduction
Este documento descreve como solucionar problemas de alertas gerados no Common Execution Environment (CEE) com o painel Grafana.
Alertas em CEE
As regras de alerta podem ser configuradas no Centro de Operações CEE, aqui está um exemplo:
alerts rules group Pod
interval-seconds 300
rule Memory_Major
expression "(go_memstats_heap_inuse_bytes{pod=~\"rest-ep.*|smf-service.*|gtpc-ep.*|protocol.*|udp-proxy.*|cache-pod.*\"} /16000000000) >= 0.5"
duration 15m
severity major
type "Processing Error Alarm"
annotation summary
value "\"POD {{ $labels.pod }} in Namespace: {{ $labels.namespace }} has reached 50% of utilization\""
exit
exit
exit
A expressão depende do PromQL, no exemplo que ele monitora go_memstats_heap_inuse_bytes(= uso da memória) para cada pods especificado. Ele calcula a utilização da memória com a memória total como 16 GB e, se a utilização exceder 75%, gera um alerta. Os alertas gerados podem ser vistos por show alert history ou show alert ative CLI.
[unknown] cee# show alerts active summary | include Memory_Major
Memory_Major 68e812264ed6 major 10-28T02:23:44 worker1 POD cache-pod-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 627af1cdd01c major 10-28T02:23:44 worker1 POD cache-pod-1 in Namespace: smf-data has reached 50% of utilization
Memory_Major 394d713e294b major 10-28T02:23:44 worker1 POD gtpc-ep-n0-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major bd95b1a35ef5 major 10-28T02:23:44 worker1 POD smf-rest-ep-n0-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 57254fd42f1a major 10-28T02:23:44 worker1 POD smf-udp-proxy-0 in Namespace: smf-data has reached 50% of utilization
Memory_Major 56135a34c635 major 10-28T02:23:44 worker1 POD smf-service-n0-0 in Namespace: smf-data has reached 50% of utilization
Mais explicações sobre Alertas podem ser encontradas neste documento.
Alertas baseados em aplicativos
https://www.cisco.com/c/en/us/td/docs/wireless/ucc/smf/b_SMF/b_SMF_chapter_0110101.html
Como solucionar problemas
As CLIs não fornecem valor medido real ou dados de tendência. A melhor maneira de solucionar problemas ainda mais é usar o painel Grafana. Conforme descrito, os alertas são definidos pelo PromQL, portanto, a mesma sintaxe pode ser aplicada para criar gráficos no Grafana.
Tomando a regra como um exemplo, essa sintaxe pode ser usada para criar um gráfico.
(go_memstats_heap_inuse_bytes{pod=~"rest-ep.*|smf-service.*|gtpc-ep.*|protocol.*|udp-proxy.*|cache-pod.*"}/16000000000)*100
Notas:
1. Remova "\" na sintaxe usada como sequência de escape
2. Multiplique por 100 para torná-lo como uma representação percentual