本文档提供了一些步骤,用于帮助监控和排除与带RTMT的Cisco Unified Communications Manager 6.0上处理器使用率较高相关的问题。
Cisco 建议您了解以下主题:
Cisco Unified Communications Manager
本文档中的信息基于以下议程项目:
本文档中的信息基于Cisco Unified Communications Manager 6.0。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
利用RTMT来隔离CPU的潜在问题是非常有用的故障排除步骤。
以下术语表示RTMT CPU和内存页面报告的使用情况:
%System:在系统级别(内核)执行中发生的CPU利用率百分比
%用户:在用户级别(应用)执行中发生的CPU利用率百分比
%IOWait:CPU等待未处理的磁盘I/O请求时空闲的时间百分比
%SoftIRQ:处理器执行延迟IRQ处理(例如,处理网络数据包)的时间百分比
%IRQ处理器执行中断请求的时间百分比,该中断请求被分配给用于中断的设备,或在处理完成时向计算机发送信号
CPUPegging/CallProcessNodeCPUPegging警报根据配置的阈值监控CPU使用:
注意:%CPU的计算方式是%system + %user + %nice + %iowait + %softirq + %irq
警报消息包括:
%system、%user、%nice、%iowait、%softirq和%irq
使用最多CPU的进程
在不间断磁盘睡眠时等待的进程
由于CPU使用率高于定义为水印级别的CPU使用率,CPU追溯警报可能会在RTMT中出现。由于CDR在加载时是CPU密集型应用,请检查您是否在与CDR配置为运行报告时相同的时间段内收到警报。在这种情况下,您需要增加RTMT上的阈值。有关RTMT警报的详细信息,请参阅警报。
如果%system和/或%user的高度足以生成CpuPreging警报,请检查警报消息以查看哪些进程使用的CPU最多。
注:转到“RTMT进程”页,按%CPU排序,以识别高CPU进程。
注意:对于事后分析,RIS Troubleshooting PerfMon Log跟踪进程%CPU使用率,并在系统级别跟踪。
高%IOWait表示高磁盘I/O活动。请考虑以下几点:
IOWait由于内存交换过重。
检查交换分区的%CPU时间,以查看是否有高级别的内存交换活动。由于Muster至少有2G RAM,内存交换过高可能是由于内存泄漏。
IOWait是由于数据库活动。
数据库主要是唯一访问活动分区的数据库。如果活动分区的%CPU时间较长,则可能存在大量数据库活动。
Common(或Log)Partition是存储跟踪和日志文件的位置。
注意:请检查以下:
跟踪和日志中心 — 是否有跟踪收集活动?如果呼叫处理受到影响(即CodeYellow),请调整跟踪收集计划。此外,如果使用zip选项,请关闭该选项。
跟踪设置 — 在“详细”级别,CallManager会生成相当多的跟踪。如果高%IOWait和/或CCM处于CodeYellow状态,且CallManager服务跟踪设置为Detailed,请尝试将其更改为“Error”。
无法直接查找每个进程的%IOWait使用情况。目前,最佳方法是检查磁盘上等待的进程。
如果%IOWait的高度足以引起CpuPreging警报,请检查警报消息以确定等待磁盘I/O的进程。
转到RTMT Process页面,按状态排序。检查处于“不间断磁盘睡眠”状态的进程。TLC用于计划收集的SFTP进程处于不间断磁盘睡眠状态。
注意:可以下载RIS Troubleshooting PerfMon Log文件,以检查更长时间的进程状态。
在实时监控工具中,转到System > Tools > Trace > Trace & Log Central。
双击“收集文件”并选择“下一步”。
选择Cisco RIS Data Collector PerfMonLog并选择Next。
在收集时间字段中,配置查看有关期间的日志文件所需的时间。在“下载文件选项”字段中,浏览到下载路径(可从中启动Windows性能监视器以查看日志文件的位置),选择Zip文件,然后选择完成。
注意收集文件进度和下载路径。此处不应报告错误。
使用Microsoft性能监控工具查看性能日志文件。选择开始>设置>控制面板>管理工具>性能。
在应用程序窗口中,右键单击并选择“属性”。
在“系统监控器属性”对话框中选择“源”选项卡。选择日志文件:,然后单击“添加”按钮。
浏览到下载PerfMon日志文件的目录,然后选择perfmon csv文件。日志文件包括以下命名约定:
PerfMon_<node>_<month>_<day>_<year>_<hour>_<minute>.csv;例如,PerfMon_10.89.35.218_6_20_2005_11_27.csv。
单击 Apply。
单击“时间范围”按钮。要在要查看的PerfMon日志文件中指定时间范围,请将该栏拖到适当的开始和结束时间。
要打开“添加计数器”对话框,请单击“数据”选项卡,然后单击“添加”。从“性能对象”下拉框中,添加进程。选择“Process Status”,然后单击“All instances”。完成计数器选项后,单击Close。
查看日志时的提示:
将图形垂直比例设置为最大6。
关注每个流程,并查看最大值2或更大值。
删除不在不间断磁盘睡眠中的进程。
使用突出显示选项。
注意:进程状态2 =不间断磁盘睡眠是可疑的。其他状态可能包括0运行、1睡眠、2不间断磁盘睡眠、3僵尸、4跟踪或停止、5寻呼、6未知
当CallManager服务进入“代码黄色”状态时,将生成“代码黄色”警报。有关代码黄色状态的详细信息,请参阅呼叫限制和代码黄色状态。CodeYellow警报可配置为下载跟踪文件以进行故障排除。
AverageExpectedDelay计数器表示处理任何入站消息的当前平均预期延迟。如果该值高于“代码黄色条目延迟”服务参数中指定的值,则生成CodeYellow警报。此计数器可以是呼叫处理性能的一个关键指标。
当4个虚拟处理器盒中的CPU总使用率仅约为25-35%时,由于处理器资源不足,CallManager可能进入CodeYellow状态。
注意:启用超线程后,一台带有两个物理处理器的服务器有四个虚拟处理器。
注意:同样,在双处理器服务器上,CodeYellow的总CPU使用率大约为50%。
如果RTMT发送“Service status is DOWN(服务状态为关闭)”。Cisco Messaging 接口.警报,如果CUCM未与第三方语音消息传送系统集成,则必须取消激活思科消息传送接口服务。如果禁用思科消息接口服务,它将停止来自RTMT的进一步警报。
版本 | 发布日期 | 备注 |
---|---|---|
1.0 |
30-Jan-2009 |
初始版本 |