Introdução
Este documento descreve os problemas relacionados ao padrão dos arquivos de log de geração de log no RCM e sua recuperação.
Overview
Observação: a Cisco recomenda que você tenha conhecimento do Redundancy Configuration Manager (RCM).
No RCM, os arquivos de coleta de log são produzidos para cada componente (pods) e são retidos por até 4 dias, após o que o RCM exclui automaticamente esses arquivos de log.
De acordo com a configuração no RCM:
Max number of files which can be generated = 10
(can vary as per the RCM docker config but it should be 9/10)
Max size of per file =10Mb
(can vary as per the RCM docker config but 10Mb is majorly defined)
Problema
Os arquivos de log são criados em um período de 3 a 10 minutos. Assim que o RCM acumula 10 arquivos, ele remove os mais antigos, por isso os arquivos de log dos últimos 4 dias não são retidos.
Troubleshooting
Ponto de preocupação: o problema que requer atenção é a geração rápida de um grande número de arquivos, levando à rápida obtenção do valor limite de 10 arquivos.
Ao revisar um dos arquivos de log, você identificou eventos de erro. Parece que alguns eventos extras foram acionados no nível de depuração, conforme descrito aqui.
{"log":"2023/03/14 10:04:44.399 [DEBUG] [ApplicationContext.go:1922] [infra.application.core] Ping method is found for the rpc rcm-checkpointmgr-19, host rcm-checkpointmgr-191\n","stream":"stdout","time":"2023-03-14T10:04:44.399280518Z"}
{"log":"2023/03/14 10:04:44.399 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 4 Name: rcm-checkpointmgr-193 Setname: rcm-checkpointmgr-19 Host: rcm-checkpointmgr-19 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:44.399284297Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 2 Name: rcm-checkpointmgr-141 Setname: rcm-checkpointmgr-14 Host: rcm-checkpointmgr-14 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:47.418602948Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1760] [infra.dpd.core] Ping reachable client Id 2 Name: rcm-checkpointmgr-111 Setname: rcm-checkpointmgr-11 Host: rcm-checkpointmgr-11 Port: 9003 Url: \n","stream":"stdout","time":"2023-03-14T10:04:47.418606903Z"}
{"log":"2023/03/14 10:04:47.418 [DEBUG] [ApplicationContext.go:1922] [infra.application.core] Ping method is found for the rpc rcm-checkpointmgr-14, host rcm-checkpointmgr-141\n","stream":"stdout","time":"2023-03-14T10:04:47.418610757Z"}
Os eventos de erro identificados estão relacionados aos logs de infraestrutura configurados no nível de depuração. Esses eventos produzem uma quantidade excessiva de eventos de alcançabilidade de Ping que não são essenciais. Consequentemente, cada arquivo de log atinge rapidamente o tamanho limite de 10 MB, causando um acúmulo de vários arquivos de log.
De acordo com as recomendações:
Você deve configurar logs de nível de depuração exclusivamente para o aplicativo RCM. Essa configuração de log deve ser habilitada para que o RCM filtre todos os eventos de log desnecessários de outras fontes.
Nível de Log do Centro de Operações do RCM
Este é o nível de registro recomendado para estar presente no RCM.
logging level application debug
logging level transaction debug
logging level tracing off
logging name infra.application.core level application warn
logging name infra.application.core level transaction warn
logging name infra.application.core level tracing off
logging name infra.dpd.core level application warn
logging name infra.dpd.core level transaction warn
logging name infra.dpd.core level tracing off
logging name infra.config.core level application warn
logging name infra.config.core level transaction warn
logging name infra.config.core level tracing off
logging name infra.heap_dump.core level application warn
logging name infra.heap_dump.core level transaction warn
logging name infra.heap_dump.core level tracing off
logging name infra.resource_monitor.core level application warn
logging name infra.resource_monitor.core level transaction warn
logging name infra.resource_monitor.core level tracing off
logging name infra.topology.core level application warn
logging name infra.topology.core level transaction warn
logging name infra.topology.core level tracing off
logging name infra.transaction.core level application warn
logging name infra.transaction.core level transaction warn
logging name infra.transaction.core level tracing off
logging name infra.diagnostics.core level application warn
logging name infra.diagnostics.core level transaction warn
logging name infra.diagnostics.core level tracing off
Após a correção dessas configurações de registro incorretas, o problema com os arquivos de registro incorretos é resolvido.