Alertas de herramientas de supervisión en tiempo real

Opciones de descarga

PDF (487.3 KB)
Visualice con Adobe Reader en una variedad de dispositivos
ePub (521.8 KB)
Visualice en diferentes aplicaciones en iPhone, iPad, Android, Sony Reader o Windows Phone
Mobi (Kindle) (505.5 KB)
Visualice en dispositivo Kindle o aplicación Kindle en múltiples dispositivos

Actualizado:27 de abril de 2018

ID del documento:213291

Lenguaje no discriminatorio

El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.

Acerca de esta traducción

Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).

Contenido

Introducción

Prerequisites

Requirements

Componentes Utilizados

Antecedentes

Alertas RTMT

Configurar

Alertas del sistema

Alertas de CallManager

LowAvailableVirtualMemory y LowSwapPartitionAvailableDiskSpace

LogPartitionHighWaterMarkExceeded y LogPartitionLowWaterMarkExceeded

CpuPegging

Verificación

Troubleshoot

Introducción

Este documento analiza las alertas de la Herramienta de supervisión en tiempo real (RTMT) de Cisco y muestra cómo resolver problemas con algunas alertas que se ven habitualmente.

Prerequisites

Requirements

Cisco recomienda que tenga conocimiento de Cisco Call Manager Web Administration.

Componentes Utilizados

La información de este documento se basa en Cisco CallManager Server 11.0.

The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.

Antecedentes

El RTMT que se ejecuta como una aplicación del cliente utiliza HTTPS y TCP para monitorear el rendimiento del sistema, el estado del dispositivo, la detección de dispositivos, las aplicaciones de Integración de telefonía informática (CTI) y los puertos de mensajería de voz. RTMT se puede utilizar para configurar alertas para el clúster que está monitoreando.

El sistema genera mensajes de alerta para notificar al administrador cuando se cumple una condición predefinida, como cuando un servicio activado pasa de un estado de hasta abajo. El sistema puede enviar alertas como correo electrónico o página electrónica.

RTMT, que admite la definición, configuración y visualización de alertas, contiene alertas preconfiguradas y definidas por el usuario. Aunque puede realizar tareas de configuración para ambos tipos, no puede eliminar alertas preconfiguradas.

Alertas RTMT

Unified RTMT muestra las alertas preconfiguradas y las alertas personalizadas en la central de alertas, como se muestra en la imagen.

También puede acceder a la central de alertas haciendo clic en el icono de la central de alertas del árbol de jerarquía de la sección del sistema.

Configurar

Unified RTMT organiza las alertas bajo las fichas aplicables: System, CallManager, Cisco Unity Connection y Custom.

Puede activar o desactivar las alertas preconfiguradas y personalizadas en Alert Central; sin embargo, no puede eliminar alertas preconfiguradas.

Las alertas en RTMT se clasifican como se muestra:

Alertas del sistema

Esta lista incluye las alertas del sistema preconfiguradas:

Error de autenticación
CiscoDRFFailure
CoreDumpFileFound
CpuPegging
CriticalAuditEventGenerado
CríticoServicioAbajo
HardwareFailure
LogFileSearchStringFound
LogPartitionHighWaterMarkExceeded
LogPartitionLowWaterMarkExceeded
LowActivePartitionAvailableDiskSpace
MemoriaVirtualDeBajaDisponibilidad
LowInactivePartitionAvailableDiskSpace
LowSwapPartitionAvailableDiskSpace
ServerDown (se aplica a los clústeres de Unified Communications Manager (CUCM))
ParticiónDeRepuestoAltaMarcaDeAguaExcedida
ParticiónDeRepuestoBajaMarcaDeAguaExcedida
SyslogSeverityMatchFound
SyslogStringMatchFound
SystemVersionMismatch
TotalProcesosYHilosExceededThreshold

Alertas de CallManager

Esta lista incluye las alertas preconfiguradas del CallManager.

BeginThrottlingCallListBLFSubscriptions
CallTryBlockedByPolicy
CallProcessingNodeCpuPegging
CARIDSEngineCritical
Falla CARIDSEngine
CARSchedulerJobFailed
CDRAgentSendFileFailed
CDRFileDeliveryFailed
CDRHighWaterMarkExceeded
CDRMamaximumDiskSpaceExceeded
CódigoAmarillo
DBChangeNotifyFailure
DBReplicaciónFailure
DBReplicaciónTableOutofSync
DDRBlockPrevention
DDRDown
EMCCFailInLocalCluster
EMCCFailInRemoteCluster
InformesDeCalidadDeVozExcesivos
IMEDistributedCacheInactive

IMEOverQuota
IMEQualityAlert
InsuficientesIdentificadoresDeReserva
IMEServiceStatus
Credenciales no válidas
Velocidad de latidos de servidorLowTFTPServer
MaliciousCallTrace
Lista de medios agotada
MgcpDChannelOutOfService
NúmeroDeDispositivosRegistradosExcedido
NúmeroDeGatewaysRegistradasDisminuido
NúmeroDeGatewaysRegistradasAumento
NúmeroDeDispositivosDeMediosRegistradosDisminuido
NúmeroDeDispositivosDeMediosRegistradosAumento
NúmeroDeTeléfonosRegistradosDescartados
RouteListExhausto
SDLLinkOutOfService
TCPSetupToIMEFfailed
TLSConnectionToIMEFfailed
UserInputFailure

LowAvailableVirtualMemory y LowSwapPartitionAvailableDiskSpace

Los servidores Linux tienden a "no borrar" el uso de la memoria virtual durante un período de tiempo y se ha visto que se acumula y por lo tanto esas alertas.

Linux funciona un poco diferente como un sistema operativo.

Una vez que la memoria se asigna a un proceso, el procesador no la recuperará a menos que otros procesos soliciten más memoria que la memoria disponible.

Esto provoca una memoria virtual alta.

Una solicitud de aumento del umbral para la alarma en las versiones superiores del Call Manager se ha documentado en el defecto; https://bst.cloudapps.cisco.com/bugsearch/bug/CSCuq75767/?reffering_site=dumpcr

Para las particiones de intercambio, esta alerta indica que la partición de intercambio se queda con poco espacio disponible, y es muy utilizada por el sistema. La partición de intercambio se utiliza normalmente para ampliar la capacidad de RAM física cuando es necesario. En condiciones normales, si la RAM es suficiente, el intercambio no debe utilizarse demasiado.

Además, estas pueden ser alertas RTMT provocadas por una acumulación de archivos temporales, se recomienda reiniciar el servidor para borrar cualquier archivo temporal innecesario.

LogPartitionHighWaterMarkExceeded y LogPartitionLowWaterMarkExceeded

Al ejecutar show status en la CLI de un servidor CUCM, se muestra un valor que especifica el porcentaje ocupado y libre de registro de partición en el espacio de disco de CUCM. También conocidos como partición común, estos valores especifican el espacio ocupado por los registros/seguimientos y los archivos CDR en el servidor, que aunque son inofensivos, pueden causar problemas en el procedimiento de instalación/actualización debido a la falta de espacio a lo largo del tiempo. Estas alertas sirven como advertencia al administrador para que borre los registros que podrían haberse acumulado con el tiempo en el clúster/servidor.

LogPartitionLowWaterMarkExceeded: Esta alerta se genera cuando el espacio relleno alcanza los valores de umbral configurados para la alerta. Esta alerta sirve como indicador de verificación previa para el uso del disco.

LogPartitionHighWaterMarkExceeded: Esta alerta se genera cuando el espacio relleno alcanza los valores de umbral configurados para la alerta. Una vez que se genera la alerta, el servidor comienza a purgar automáticamente los registros más antiguos para reducir el espacio al valor menos que el umbral HighWaterMark.

La práctica recomendada sería purgar manualmente los registros tan pronto como se reciba la alerta LogPartitionLowWaterMarkExceeded.

Los pasos para hacerlo son:

Paso 1. Inicie RTMT.

Paso 2. Seleccione Alert Central y, a continuación, realice estas tareas:

Seleccione LogPartitionHighWaterMarkExceeded, anote su valor y cambie su valor de umbral al 60%.

Seleccione LogPartitionLowWaterMarkExceeded, anote su valor y cambie su valor de umbral al 50%.

El sondeo se realiza cada 5 minutos, por lo que espere entre 5 y 10 minutos y, a continuación, verifique que el espacio en disco requerido esté disponible. Si desea liberar más espacio en disco en la partición común, vuelva a cambiar los valores de subproceso LogPartitionHighWaterMarkExceeded y LogPartitionLowWaterMarkExceeded a valores más bajos (por ejemplo, 30% y 20%).

Dedique de 15 a 20 minutos a despejar el espacio en la partición común. Puede monitorear la disminución en el uso del disco con el comando show status desde CLI.

Eso reduciría la partición común.

CpuPegging

La alerta CpuPegging monitorea el uso de la CPU en función del umbral configurado.

Cuando se recibe la alerta de vinculación de CPU, el proceso que ocupa la CPU más alta se puede ocupar yendo a la Sección de Sistema de la izquierda, es decir, Proceso.

Desde la CLI del servidor correspondiente, estos resultados proporcionarán cierta información.

utils diagnose test
show process load cpu
show status
lista activa de utils core

Se recomienda observar si el pico de la CPU ocurre a una hora específica o aleatoriamente. Si ocurre aleatoriamente, entonces los seguimientos detallados de CUCM requeridos, así como los registros perfmon de RisDC para verificar qué está accionando el pico en la CPU. Si las alertas se producen a una hora específica del día, podría deberse a alguna actividad programada como la copia de seguridad del Sistema de recuperación ante desastres (DRS), la carga de CDR, etc.

Además, sobre la base de la información sobre qué proceso ocupa más CPU, se toman registros específicos para una investigación más detallada. Por ejemplo, si el culpable es Tomcat, se necesitan los registros relacionados con Tomcat.

Verificación

Utilize esta sección para confirmar que su configuración funcione correctamente.

Si las alertas no se descartan después de seguir las soluciones sugeridas aquí, o si las alertas parecen tener un impacto inmediato en el servicio, póngase en contacto con el TAC de Cisco con los detalles necesarios sobre la versión del administrador de llamadas, el número de nodos en el clúster, la hora y duración de la alerta y la restricción del proceso necesaria en caso de vinculación de la CPU.

Troubleshoot

Actualmente, no hay información específica de troubleshooting disponible para esta configuración.

Con la colaboración de ingenieros de Cisco

Animesh Lochan
Cisco TAC Engineer

Alertas de herramientas de supervisión en tiempo real

Opciones de descarga

Lenguaje no discriminatorio

Acerca de esta traducción

Contenido

Introducción

Prerequisites

Requirements

Componentes Utilizados

Antecedentes

Alertas RTMT

Configurar

Alertas del sistema

Alertas de CallManager

LowAvailableVirtualMemory y LowSwapPartitionAvailableDiskSpace

LogPartitionHighWaterMarkExceeded y LogPartitionLowWaterMarkExceeded

CpuPegging

Verificación

Troubleshoot

Con la colaboración de ingenieros de Cisco

¿Resultó útil este documento?

Contacte a Cisco

Este documento se aplica a estos productos