简介
本文档介绍识别和排除由NAT瓶颈问题引起的企业路由平台性能问题的过程。
背景信息
当同一接口上同时存在NAT和非NAT流量时,可以在思科路由器上发现思科量子流处理器(QFP)的高利用率和性能问题。这还可能导致其他性能问题,例如接口错误或速度减慢。
注意:QFP位于嵌入式服务处理器(ESP)上,负责所有入站和出站流量的数据平面和数据包处理。
症状
从路由器验证并确认这些症状非常重要。要识别此行为:
1.高QFP负载警报。当负载超过80%的阈值时,会显示这些警报
注:您还可以运行show platform hardware qfp active utilization summary命令以显示QFP上的负载和流量速率。
2.接口错误。如果QFP的利用率很高,则数据包可能会由于背压而丢失。在这种情况下,通常会在接口上观察到超支和输出丢弃。要显示此信息,可以运行show interfaces命令
3.在某些情况下,用户可能会抱怨网络速度缓慢。
4.从具有功能调用阵列(FIA)跟踪选项的数据包跟踪捕获中,我们可以观察到NAT功能消耗的资源比预期多。在下面的示例中,我们可以看到IPV4_NAT_INPUT_FIA功能的失效时间明显大于其他功能的失效时间。此行为通常表示QFP需要更多时间处理此功能,因此,QFP中的更多资源用于NAT。
5. NATed接口上的大量非NATed流量。非NATed流量会消耗大量资源,并导致QFP使用率峰值。可以通过检查如下命令中所示的misses数来验证此行为。
非NAT流量导致高QFP的解决方法/修复
解决方案 1
通常,思科针对此类问题的建议是尝试将非NATed流量从NATed接口重定向到来自同一机箱或另一路由器的不同接口。如果没有可用接口,则可以尝试至少减少受影响接口上的此类流量。
解决方案 2
另一种解决方法是进行调整以增加NAT网守功能上的缓存,以便尝试减少从网守丢失数。此功能首先引入软件版本12.2(33)XND。此功能的目的是尝试减少非NATed流消耗的资源量,以防止CPU和量子流处理器(QFP)上的过度使用。
以下示例显示如何调整Cisco路由器上的网守。建议从64K开始。必须强调此值应以2的幂来表示。否则,该值将自动设置为下一个更小的大小。