了解vEdge 5000/2000/1000/100B和vEdge云平台的vManage报告的高CPU利用率

下载选项

PDF (240.4 KB)
在各种设备上使用 Adobe Reader 查看
ePub (115.9 KB)
在 iPhone、iPad、Android、Sony Reader 或 Windows Phone 上使用各种应用查看
Mobi (Kindle) (103.4 KB)
在 Kindle 设备上查看或在多个设备上使用 Kindle 应用查看

已更新: 2018 年 8 月 8 日

文档 ID:213351

非歧视性语言

此产品的文档集力求使用非歧视性语言。在本文档集中，非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言，文档中可能无法确保完全使用非歧视性语言。深入了解思科如何使用包容性语言。

关于此翻译

思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言，希望全球的用户都能通过各自的语言得到支持性的内容。请注意：即使是最好的机器翻译，其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任，并建议您总是参考英文原始文档（已提供链接）。

简介

本文档介绍为什么在vEdge 5000/2000/1000/100B和vEdge云平台的vManage中报告了高CPU使用率，尽管平台性能正常，顶部没有报告高CPU使用率。

了解vEdge 5000/2000/1000/100B和vEdge云平台上报告的高CPU利用率

使用17.2.x及更高版本，可以观察到vEdge和vEdge云平台的CPU和内存消耗更高。在给定设备的vManage控制面板上会注意到这一点。在某些情况下，这也会导致vManage中警报和警告的数量增加。

解释

当设备正常执行正常、低负载或无负载时报告高CPU使用率的原因是由于用于计算使用率的公式发生更改。在17.2版本中，CPU使用率是根据vEdge上的show system status的Load Average计算的。

vManage显示设备的实时CPU利用率。它根据历史数据提取1分钟平均[min1_avg]和5分钟平均[min5_avg]。根据定义，平均负载包括各种因素，而不仅仅是CPU周期，这些因素会影响利用率计算。例如，当您为平台显示此值时，会考虑IO等待时间、进程挂起时间和其他值。在这种情况下，您会忽略vShell top命令中显示的CPU状态和CPU值的值。

以下是CPU利用率(实际为1分钟平均负载)的计算和显示在vManage控制面板中的示例：

从vEdge CLI检查负载时，可以看到：

vEdge# show system status | include Load
Load average:            1 minute: 3.10, 5 minutes: 3.06, 15 minutes: 3.05
Load average:            1 minute: 3.12, 5 minutes: 3.07, 15 minutes: 3.06
Load average:            1 minute: 3.13, 5 minutes: 3.08, 15 minutes: 3.07
Load average:            1 minute: 3.10, 5 minutes: 3.07, 15 minutes: 3.05

在这种情况下，CPU利用率是根据负载平均/内核数(vCPU)计算的。在本例中，节点有4个核心。然后，在除以内核数之前，将负载平均值换算为100倍。当将来自所有内核的负载平均值平均值乘以100时，您得到的值是~310。取此值除以4产率，即CPU读数为77.5%，与v中实时图中显示的值一致管理在收集CLI输出时捕获的数据，如图所示。

为了查看系统中的负载平均值和CPU内核数，可以从设备上的vShell查看顶部的输出。

在此示例中，vEdge包含4个vCPU。第一个核心(Cpu0)用于Control（通过较低的用户利用率看到），而其余的3个核心用于Data:

top - 01:14:57 up 1 day,  3:15,  1 user,  load average: 3.06, 3.06, 3.08
Tasks: 219 total,   5 running, 214 sleeping,   0 stopped,   0 zombie
Cpu0  :  1.7%us,  4.0%sy,  0.0%ni, 94.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  : 56.0%us, 44.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  : 54.2%us, 45.8%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 59.3%us, 40.7%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   7382664k total,  2835232k used,  4547432k free,   130520k buffers
Swap:        0k total,        0k used,        0k free,   587880k cached
 
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                                 
  978 root      20   0 3392m 664m 127m R  100  9.2   1635:21 fp-um-2                                                                                                                                                  
  692 root      20   0 3392m 664m 127m R  100  9.2   1635:18 fp-um-1                                                                                                                                                  
  979 root      20   0 3392m 664m 127m R  100  9.2   1634:51 fp-um-3                                                                                                                                                  
  694 root      20   0 1908m 204m 131m S    1  2.8  15:29.95 ftmd                                                                                                                                                   
  496 root      20   0  759m  72m 3764 S    0  1.0   1:31.50 confd

要从vEdge CLI获取CPU数量，可以使用以下命令：

vEdge# show system status | display xml | include total_cpu
    <total_cpu_count>4</total_cpu_count>

此处提供了vEdge 1000上vManage中显示的值计算的另一个示例。从vShell发出top后，l会感兴趣，以便显示所有内核的负载：

top - 18:19:49 up 19 days,  1:37,  1 user,  load average: 0.55, 0.71, 0.73

由于vEdge 1000只有一个可用的CPU核心，此处报告的负载为55%(0.55*100)。

fp-um进程的高CPU使用率

您有时也可以从顶部注意到fp-um进程运行高，并显示高达100%的CPU。在用于数据平面处理的CPU核心上应该有此要求。

从前面引用的顶部命令中，3个内核以100% CPU运行，1个内核显示正常利用率：

top - 01:14:57 up 1 day,  3:15,  1 user,  load average: 3.06, 3.06, 3.08
Tasks: 219 total,   5 running, 214 sleeping,   0 stopped,   0 zombie
Cpu0  :  1.7%us,  4.0%sy,  0.0%ni, 94.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  : 56.0%us, 44.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  : 54.2%us, 45.8%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 59.3%us, 40.7%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   7382664k total,  2835232k used,  4547432k free,   130520k buffers
Swap:        0k total,        0k used,        0k free,   587880k cached
 
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                                 
  978 root      20   0 3392m 664m 127m R  100  9.2   1635:21 fp-um-2                                                                                                                                                  
  692 root      20   0 3392m 664m 127m R  100  9.2   1635:18 fp-um-1                                                                                                                                                  
  979 root      20   0 3392m 664m 127m R  100  9.2   1634:51 fp-um-3       
...

第一个核心(Cpu0)用于控制，其余三个核心用于数据控制。正如您在进程列表中看到的，fp-um进程使用这些资源。

fp-um是使用轮询模式驱动程序的进程，这意味着它会持续放置并轮询底层端口以查找数据包，以便在收到帧后立即处理任何帧。此进程处理转发，相当于vEdge 1000、vEdge 2000和vEdge 100中的快速路径转发。此轮询模式英特尔使用架构，以基于数据平面开发套件(DPDK)框架进行高效的数据包处理。由于数据包转发是在紧循环中实施的，因此CPU始终保持在或接近100%。虽然这样做，但不会通过这些CPU引入延迟，因为这是预期行为。

他可以在这里找到有关DPDK调查的背景信息。

vEdge云和vEdge 5000平台使用相同的转发架构，在这方面表现出相同的行为。这是从顶部输出中提取的vEdge 5000的示例。它有28个内核，其中2个（Cpu0和Cpu1）用于控制（如vEdge 2000），26个用于数据。

top - 02:18:30 up 1 day,  7:33,  1 user,  load average: 26.24, 26.28, 26.31
Tasks: 382 total,  27 running, 355 sleeping,   0 stopped,   0 zombie
Cpu0  :  0.7%us,  1.3%sy,  0.0%ni, 98.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  0.7%us,  1.3%sy,  0.0%ni, 98.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  : 79.4%us, 20.6%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  : 73.4%us, 26.6%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu4  : 73.4%us, 26.6%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu5  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu6  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu7  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu8  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu9  :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu10 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu11 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu12 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu13 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu14 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu15 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu16 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu17 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu18 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu19 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu20 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu21 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu22 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu23 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu24 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu25 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu26 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu27 :100.0%us,  0.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:  32659508k total, 10877980k used, 21781528k free,   214788k buffers
Swap:        0k total,        0k used,        0k free,  1039104k cached
 
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                           
 2028 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-3                                                                                                                            
 2029 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-4        
 2030 root      20   0 12.1g 668m 124m R  100  2.1   1897:12 fp-um-5                                                                                                                            
 2031 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-6   
 2032 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-7                                                                                                                            
 2034 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-9  
 2035 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-10                                                                                                                           
 2038 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-13      
 2040 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-15                                                                                                                           
 2041 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-16          
 2043 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-18                                                                                                                           
 2045 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-20    
 2052 root      20   0 12.1g 668m 124m R  100  2.1   1897:18 fp-um-27       
 2033 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-8                                                                                                                            
 2036 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-11            
 2037 root      20   0 12.1g 668m 124m R  100  2.1   1897:21 fp-um-12                                                                                                                           
 2039 root      20   0 12.1g 668m 124m R  100  2.1   1897:09 fp-um-14          
 2042 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-17                                                                                                                           
 2044 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-19                      
 2046 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-21                                                                                                                           
 2047 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-22             
 2048 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-23                                                                                                                           
 2049 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-24       
 2050 root      20   0 12.1g 668m 124m R  100  2.1   1897:22 fp-um-25                                                                                                                           
 2051 root      20   0 12.1g 668m 124m R  100  2.1   1897:23 fp-um-26          
 1419 root      20   0  116m 5732 2280 S    0  0.0   0:02.00 chmgrd                                                                                                                             
 1323 root      20   0  753m  70m 3764 S    0  0.2   1:51.20 confd      
 1432 root      20   0 1683m 172m 134m S    0  0.5   0:58.91 fpmd

在此，负载平均值始终很高，因为28个处理器中有26个以100%的速率运行，这是因为fp-um过程。

结论

17.2.7之前版本的vManage中报告的CPU使用率不是实际CPU使用率，而是根据负载平均值计算。这可能导致混淆了解报告的值，并导致与高CPU相关的虚假警报，同时平台在正常、低或无实际流量/网络负载的情况下正常运行。

此行为在17.2.7和18.2版本中被更改/修改，以便CPU读数现在可以基于顶部的cpu_user读数而准确。

17.2版本说明中也提到了问题。

由思科工程师提供

Shankar Vemulapalli
Cisco Engineering
Brandon Lynch
Cisco Engineering
Danny De Ridder
Cisco TAC Engineer

此文档是否有帮助?

反馈

联系我们

提交支持案例
(需要思科服务合同)