Este documento proporciona los pasos para ayudar en la supervisión y resolución de problemas relacionados con la alta utilización del procesador en Cisco Unified Communications Manager 6.0 con RTMT.
Cisco le recomienda que tenga conocimiento acerca de este tema:
Cisco Unified Communications Manager
La información que figura en este documento se basa en los siguientes temas del programa:
La información de este documento se basa en Cisco Unified Communications Manager 6.0.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
La utilización de RTMT para aislar los problemas potenciales con la CPU puede ser un paso muy útil para la resolución de problemas.
Estos términos representan el uso de los informes de la página CPU y Memoria RTMT:
%Sistema: el porcentaje de utilización de CPU que se produjo en la ejecución a nivel del sistema (kernel)
%Usuario: el porcentaje de utilización de CPU que se produjo en la ejecución a nivel de usuario (aplicación)
%IOWait: el porcentaje de tiempo que la CPU estuvo inactiva mientras esperaba una solicitud de E/S de disco pendiente
%SoftIRQ: el porcentaje de tiempo que el procesador ejecuta el procesamiento de IRQ diferido (por ejemplo, el procesamiento de paquetes de red)
%IRQ el porcentaje de tiempo que el procesador ejecuta la solicitud de interrupción, que se asigna a los dispositivos para la interrupción, o envía una señal al equipo cuando finaliza el procesamiento
Las alertas CPUPegging/CallProcessNodeCPUPegging supervisan el uso de la CPU en función de los umbrales configurados:
Nota: %CPU se calcula como %system + %user + %nice + %iowait + %softirq + %irq
Los mensajes de alerta incluyen lo siguiente:
%system, %user, %nice, %iowait, %softirq y %irq
El proceso que utiliza la mayor cantidad de CPU
Los procesos que esperan en suspensión ininterrumpida del disco
Las alertas de fijación de CPU pueden aparecer en RTMT debido a un uso de CPU mayor que el definido como el nivel de marca de agua. Dado que CDR es una aplicación que hace un uso intensivo de la CPU cuando se carga, verifique si recibe las alertas en el mismo período que cuando el CDR está configurado para ejecutar informes. En este caso, puede necesitar aumentar los valores de umbral en RTMT. Consulte Alertas para obtener más información sobre las alertas RTMT.
Si %system y/o %user son lo suficientemente altos como para generar una alerta de CpuPegging, verifique el mensaje de alerta para ver qué procesos utilizan más CPU.
Nota: Vaya a la página Proceso RTMT y ordene por %CPU para identificar los procesos de CPU altos.
Nota: Para el análisis postmortem, el registro de resolución de problemas de RIS PerfMon realiza un seguimiento del uso del proceso %CPU y realiza un seguimiento en el nivel del sistema.
High %IOWait indica actividades de E/S de disco altas. Tenga en cuenta lo siguiente:
IOWait se debe a un intercambio de memoria intenso.
Verifique el tiempo %CPU para la partición de intercambio para ver si hay un alto nivel de actividad de intercambio de memoria. Dado que Muster tiene al menos 2 G de RAM, es probable que el intercambio de memoria sea elevado debido a una pérdida de memoria.
IOWait se debe a la actividad de la base de datos.
La base de datos es principalmente la única que tiene acceso a la partición activa. Si el tiempo de %CPU para la partición activa es alto, es probable que haya mucha actividad de la base de datos.
Partición común (o Registro) es la ubicación en la que se almacenan los archivos de seguimiento y de registro.
Nota: Compruebe lo siguiente:
Trace & Log Central: ¿hay alguna actividad de recopilación de seguimiento? Si el procesamiento de llamadas se ve afectado (es decir, CodeYellow), ajuste la programación de recopilación de seguimiento. Además, si se utiliza la opción zip, apáguela.
Configuración de seguimiento: en el nivel Detallado, CallManager genera bastante seguimiento. Si el estado %IOWait y/o CCM alto está en el estado CodeYellow y el valor de seguimiento del servicio CallManager está en Detallado, intente cambiarlo a "Error".
No hay forma directa de averiguar el uso de %IOWait por proceso. Actualmente, la mejor manera es verificar los procesos en espera en el disco.
Si %IOWait es lo suficientemente alto como para provocar una alerta de CpuPegging, verifique el mensaje de alerta para determinar los procesos que esperan la E/S del disco.
Vaya a la página Proceso RTMT y ordene por Estado. Compruebe si hay procesos en el estado de suspensión del disco ininterrumpible. El proceso SFTP utilizado por el TLC para la recolección programada se encuentra en el estado inactivo del disco ininterrumpible.
Nota: Se puede descargar el archivo PerfMon Log de Troubleshooting de RIS para examinar el estado del proceso durante períodos de tiempo más largos.
En la Herramienta de supervisión en tiempo real, vaya a System > Tools > Trace > Trace & Log Central.
Haga doble clic en Recolectar archivos y elija Siguiente.
Elija Cisco RIS Data Collector PerfMonLog y elija Next.
En el campo Tiempo de recolección, configure el tiempo necesario para ver los archivos de registro del período en cuestión. En el campo Download File Options, busque su trayectoria de descarga (una ubicación desde la que puede iniciar Windows Performance Monitor para ver el archivo de registro), elija Zip Files y elija Finish.
Observe el progreso de Collect Files y la trayectoria de descarga. No se debe informar de errores aquí.
Vea los archivos de registro de rendimiento con la herramienta Monitor de rendimiento de Microsoft. Elija Inicio > Configuración > Panel de control > Herramientas administrativas > Rendimiento.
En la ventana de la aplicación, haga clic con el botón derecho y elija Propiedades.
Elija la ficha Origen en el cuadro de diálogo Propiedades del Monitor del sistema. Elija archivos Log: como origen de datos, y haga clic en el botón Agregar.
Vaya al directorio donde descargó el archivo PerfMon Log y elija el archivo perfmon csv. El archivo de registro incluye esta convención de nomenclatura:
PerfMon_<node>_<month>_<day>_<año>_<hora>_<minuto>.csv; por ejemplo, PerfMon_10.89.35.218_6_20_2005_11_27.csv.
Haga clic en Apply (Aplicar).
Haga clic en el botón Rango de tiempo. Para especificar el rango de tiempo en el archivo PerfMon Log que desea ver, arrastre la barra hasta las horas de inicio y fin apropiadas.
Para abrir el cuadro de diálogo Agregar contadores, haga clic en la ficha Datos y haga clic en Agregar. En el cuadro desplegable Objeto de rendimiento, agregue Proceso. Elija Estado del proceso y haga clic en Todas las instancias. Cuando termine las opciones de los contadores, haga clic en Cerrar.
Sugerencias para ver el registro:
Establezca la escala vertical del gráfico en Máximo 6.
Céntrese en cada proceso y observe el valor máximo de 2 o superior.
Elimine los procesos que no se encuentran en suspensión de disco ininterrumpible.
Utilice la opción de resaltado.
Nota: Estado del proceso 2 = La suspensión ininterrumpida del disco es sospechosa. Otras posibilidades de estado son 0 en ejecución, 1 en suspensión, 2 en disco ininterrumpible, 3 en zombi, 4 en traza o detenido, 5 en búsqueda, 6 en desconocido
La alerta de código amarillo se genera cuando el servicio CallManager pasa al estado Código amarillo. Para obtener más información sobre el estado de código amarillo, consulte Regulación de llamada y el estado de código amarillo. La alerta CodeYellow se puede configurar para descargar los archivos Trace con fines de resolución de problemas.
El contador PromedioRetrasoEsperado representa la demora media esperada actual para controlar cualquier mensaje entrante. Si el valor es superior al valor especificado en el parámetro de servicio "Latencia de entrada de código amarillo", se genera la alarma CodeYellow. Este contador puede ser un indicador clave del rendimiento del procesamiento de llamadas.
Es posible que CallManager entre en el estado CodeYellow debido a la falta de recursos del procesador cuando el uso total de la CPU es sólo de alrededor del 25-35 por ciento en una caja de 4 procesadores virtuales.
Nota: Con Hyper-Threading activada, un servidor con dos procesadores físicos tiene cuatro procesadores virtuales.
Nota: Asimismo, en un servidor de dos procesadores, CodeYellow es posible con un uso total de la CPU de alrededor del 50%.
Si RTMT envía el estado de servicio es DOWN. Interfaz de mensajería de Cisco. alerta, debe desactivar el servicio Cisco Messaging Interface si CUCM no está integrado con un sistema de mensajería de voz de terceros. Si inhabilita el servicio de interfaz de mensajería de Cisco, detiene alertas adicionales de RTMT.