Introduzione
In questo documento vengono descritti i problemi relativi al modello di generazione dei file di log in RCM e al relativo ripristino.
Panoramica
Nota: Cisco raccomanda la conoscenza di RCM (Redundancy Configuration Manager).
In RCM i file di log vengono creati per ciascun componente (pod) e conservati per un massimo di 4 giorni, dopo di che RCM li elimina automaticamente.
In base alla configurazione in RCM:
Max number of files which can be generated = 10
(can vary as per the RCM docker config but it should be 9/10)
Max size of per file =10Mb
(can vary as per the RCM docker config but 10Mb is majorly defined)
Problema
I file di registro vengono creati in un intervallo di tempo compreso tra 3 e 10 minuti. Non appena vengono accumulati 10 file, vengono rimossi quelli meno recenti. Per questo motivo, i file di registro degli ultimi 4 giorni non vengono conservati.
Risoluzione dei problemi
Punto preoccupante: il problema che richiede attenzione è la rapida generazione di un numero elevato di file, che porta al rapido raggiungimento del valore di soglia di 10 file.
Dopo aver esaminato uno dei file di registro, sono stati identificati gli eventi di errore. Alcuni eventi aggiuntivi sono stati attivati a livello di debug, come descritto di seguito.
{"log":"2023/03/14 10:04:44.399 [DEBUG] [ApplicationContext.go:1922] [infra.application.core] Ping method is found for the rpc rcm-checkpointmgr-19, host rcm-checkpointmgr-191\n","stream":"stdout","time":"2023-03-14T10:04:44.399280518Z"}
{"log":"2023/03/14 10:04:44.399 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 4 Name: rcm-checkpointmgr-193 Setname: rcm-checkpointmgr-19 Host: rcm-checkpointmgr-19 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:44.399284297Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 2 Name: rcm-checkpointmgr-141 Setname: rcm-checkpointmgr-14 Host: rcm-checkpointmgr-14 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:47.418602948Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 2 Name: rcm-checkpointmgr-111 Setname: rcm-checkpointmgr-11 Host: rcm-checkpointmgr-11 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:47.418606903Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1922] [infra.application.core] Ping method is found for the rpc rcm-checkpointmgr-14, host rcm-checkpointmgr-141\n","stream":"stdout","time":"2023-03-14T10:04:47.418610757Z"}
Gli eventi di errore identificati sono correlati ai registri dell'infrastruttura configurati a livello di debug. Questi eventi producono una quantità eccessiva di eventi di raggiungibilità di Ping che non sono essenziali. Di conseguenza, ogni file di log raggiunge rapidamente la dimensione di soglia di 10 MB, causando un accumulo di più file di log.
Secondo le raccomandazioni:
È necessario configurare i registri a livello di debug esclusivamente per l'applicazione RCM. È necessario attivare questa configurazione di registrazione per consentire a RCM di filtrare gli eventi di registro non necessari provenienti da altre origini.
Livello di registrazione di RCM Ops-Center
Questo è il livello di registrazione consigliato per RCM.
logging level application debug
logging level transaction debug
logging level tracing off
logging name infra.application.core level application warn
logging name infra.application.core level transaction warn
logging name infra.application.core level tracing off
logging name infra.dpd.core level application warn
logging name infra.dpd.core level transaction warn
logging name infra.dpd.core level tracing off
logging name infra.config.core level application warn
logging name infra.config.core level transaction warn
logging name infra.config.core level tracing off
logging name infra.heap_dump.core level application warn
logging name infra.heap_dump.core level transaction warn
logging name infra.heap_dump.core level tracing off
logging name infra.resource_monitor.core level application warn
logging name infra.resource_monitor.core level transaction warn
logging name infra.resource_monitor.core level tracing off
logging name infra.topology.core level application warn
logging name infra.topology.core level transaction warn
logging name infra.topology.core level tracing off
logging name infra.transaction.core level application warn
logging name infra.transaction.core level transaction warn
logging name infra.transaction.core level tracing off
logging name infra.diagnostics.core level application warn
logging name infra.diagnostics.core level transaction warn
logging name infra.diagnostics.core level tracing off
Dopo aver corretto queste configurazioni di registrazione errate, il problema con i file di registro errati viene risolto.