El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento analiza las alertas de la Herramienta de supervisión en tiempo real (RTMT) de Cisco y muestra cómo resolver problemas con algunas alertas que se ven habitualmente.
Cisco recomienda que tenga conocimiento de Cisco Call Manager Web Administration.
La información de este documento se basa en Cisco CallManager Server 11.0.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
El RTMT que se ejecuta como una aplicación del cliente utiliza HTTPS y TCP para monitorear el rendimiento del sistema, el estado del dispositivo, la detección de dispositivos, las aplicaciones de Integración de telefonía informática (CTI) y los puertos de mensajería de voz. RTMT se puede utilizar para configurar alertas para el clúster que está monitoreando.
El sistema genera mensajes de alerta para notificar al administrador cuando se cumple una condición predefinida, como cuando un servicio activado pasa de un estado de hasta abajo. El sistema puede enviar alertas como correo electrónico o página electrónica.
RTMT, que admite la definición, configuración y visualización de alertas, contiene alertas preconfiguradas y definidas por el usuario. Aunque puede realizar tareas de configuración para ambos tipos, no puede eliminar alertas preconfiguradas.
Unified RTMT muestra las alertas preconfiguradas y las alertas personalizadas en la central de alertas, como se muestra en la imagen.
También puede acceder a la central de alertas haciendo clic en el icono de la central de alertas del árbol de jerarquía de la sección del sistema.
Unified RTMT organiza las alertas bajo las fichas aplicables: System, CallManager, Cisco Unity Connection y Custom.
Puede activar o desactivar las alertas preconfiguradas y personalizadas en Alert Central; sin embargo, no puede eliminar alertas preconfiguradas.
Las alertas en RTMT se clasifican como se muestra:
Esta lista incluye las alertas del sistema preconfiguradas:
Error de autenticación
CiscoDRFFailure
CoreDumpFileFound
CpuPegging
CriticalAuditEventGenerado
CríticoServicioAbajo
HardwareFailure
LogFileSearchStringFound
LogPartitionHighWaterMarkExceeded
LogPartitionLowWaterMarkExceeded
LowActivePartitionAvailableDiskSpace
MemoriaVirtualDeBajaDisponibilidad
LowInactivePartitionAvailableDiskSpace
LowSwapPartitionAvailableDiskSpace
ServerDown (se aplica a los clústeres de Unified Communications Manager (CUCM))
ParticiónDeRepuestoAltaMarcaDeAguaExcedida
ParticiónDeRepuestoBajaMarcaDeAguaExcedida
SyslogSeverityMatchFound
SyslogStringMatchFound
SystemVersionMismatch
TotalProcesosYHilosExceededThreshold
Esta lista incluye las alertas preconfiguradas del CallManager.
Los servidores Linux tienden a "no borrar" el uso de la memoria virtual durante un período de tiempo y se ha visto que se acumula y por lo tanto esas alertas.
Linux funciona un poco diferente como un sistema operativo.
Una vez que la memoria se asigna a un proceso, el procesador no la recuperará a menos que otros procesos soliciten más memoria que la memoria disponible.
Esto provoca una memoria virtual alta.
Una solicitud de aumento del umbral para la alarma en las versiones superiores del Call Manager se ha documentado en el defecto; https://bst.cloudapps.cisco.com/bugsearch/bug/CSCuq75767/?reffering_site=dumpcr
Para las particiones de intercambio, esta alerta indica que la partición de intercambio se queda con poco espacio disponible, y es muy utilizada por el sistema. La partición de intercambio se utiliza normalmente para ampliar la capacidad de RAM física cuando es necesario. En condiciones normales, si la RAM es suficiente, el intercambio no debe utilizarse demasiado.
Además, estas pueden ser alertas RTMT provocadas por una acumulación de archivos temporales, se recomienda reiniciar el servidor para borrar cualquier archivo temporal innecesario.
Al ejecutar show status en la CLI de un servidor CUCM, se muestra un valor que especifica el porcentaje ocupado y libre de registro de partición en el espacio de disco de CUCM. También conocidos como partición común, estos valores especifican el espacio ocupado por los registros/seguimientos y los archivos CDR en el servidor, que aunque son inofensivos, pueden causar problemas en el procedimiento de instalación/actualización debido a la falta de espacio a lo largo del tiempo. Estas alertas sirven como advertencia al administrador para que borre los registros que podrían haberse acumulado con el tiempo en el clúster/servidor.
LogPartitionLowWaterMarkExceeded: Esta alerta se genera cuando el espacio relleno alcanza los valores de umbral configurados para la alerta. Esta alerta sirve como indicador de verificación previa para el uso del disco.
LogPartitionHighWaterMarkExceeded: Esta alerta se genera cuando el espacio relleno alcanza los valores de umbral configurados para la alerta. Una vez que se genera la alerta, el servidor comienza a purgar automáticamente los registros más antiguos para reducir el espacio al valor menos que el umbral HighWaterMark.
La práctica recomendada sería purgar manualmente los registros tan pronto como se reciba la alerta LogPartitionLowWaterMarkExceeded.
Los pasos para hacerlo son:
Paso 1. Inicie RTMT.
Paso 2. Seleccione Alert Central y, a continuación, realice estas tareas:
Seleccione LogPartitionHighWaterMarkExceeded, anote su valor y cambie su valor de umbral al 60%.
Seleccione LogPartitionLowWaterMarkExceeded, anote su valor y cambie su valor de umbral al 50%.
El sondeo se realiza cada 5 minutos, por lo que espere entre 5 y 10 minutos y, a continuación, verifique que el espacio en disco requerido esté disponible. Si desea liberar más espacio en disco en la partición común, vuelva a cambiar los valores de subproceso LogPartitionHighWaterMarkExceeded y LogPartitionLowWaterMarkExceeded a valores más bajos (por ejemplo, 30% y 20%).
Dedique de 15 a 20 minutos a despejar el espacio en la partición común. Puede monitorear la disminución en el uso del disco con el comando show status desde CLI.
Eso reduciría la partición común.
La alerta CpuPegging monitorea el uso de la CPU en función del umbral configurado.
Cuando se recibe la alerta de vinculación de CPU, el proceso que ocupa la CPU más alta se puede ocupar yendo a la Sección de Sistema de la izquierda, es decir, Proceso.
Desde la CLI del servidor correspondiente, estos resultados proporcionarán cierta información.
Se recomienda observar si el pico de la CPU ocurre a una hora específica o aleatoriamente. Si ocurre aleatoriamente, entonces los seguimientos detallados de CUCM requeridos, así como los registros perfmon de RisDC para verificar qué está accionando el pico en la CPU. Si las alertas se producen a una hora específica del día, podría deberse a alguna actividad programada como la copia de seguridad del Sistema de recuperación ante desastres (DRS), la carga de CDR, etc.
Además, sobre la base de la información sobre qué proceso ocupa más CPU, se toman registros específicos para una investigación más detallada. Por ejemplo, si el culpable es Tomcat, se necesitan los registros relacionados con Tomcat.
Utilize esta sección para confirmar que su configuración funcione correctamente.
Si las alertas no se descartan después de seguir las soluciones sugeridas aquí, o si las alertas parecen tener un impacto inmediato en el servicio, póngase en contacto con el TAC de Cisco con los detalles necesarios sobre la versión del administrador de llamadas, el número de nodos en el clúster, la hora y duración de la alerta y la restricción del proceso necesaria en caso de vinculación de la CPU.
Actualmente, no hay información específica de troubleshooting disponible para esta configuración.