简介
本文档介绍如何计算SD-WAN重叠部署上的控制流量开销。请注意,以下文章指导应用于低于20.10.x的视频代码和IOS-XE SD-WAN 17.10.x及更低版本(从20.10.x /17.10.x开始,思科已实施数据收集推送模型)。
问题
在设计阶段收到用户的一个常见问题是“SD-WAN解决方案会给我们的分支电路带来多少开销”?答案是,这取决于几个变量。
解决方案
此案例研究可帮助您找到答案。 在分支机构角色离开时,大多数用户都可以或不能配置互联网电路。如果客户拥有一个,则通常类似于图1。
图1.带有互联网和多协议标签交换(MPLS)电路的SD-WAN分支机构。
这并非总是如此,一些用户更愿意迁移到SD-WAN,只需最小的更改和新的电路引入,并可能为后续阶段添加电路,如图2所示。没有互联网电路。
图 2.仅带MPLS电路的SD-WAN分支。
为了设置阶段,如果您有100个具有2个头端的分支机构,以及分支机构与头端之间建议的全网状拓扑,并且用户具有严格的QOS标准,将20%分配给语音的低延迟队列(LLQ)。
迁移到SD-WAN后,这些分支机构需要考虑哪些开销(如果有)。我们再深入探究一下。
注意:这些计算应在正常运营需求(包括高峰需求)下考虑。 但是,不要考虑所有可能的方案。
这些数字来自使用1vManage、1vBond和1vSmart 255 BFD会话执行的实验室测试。
表 1.每个会话的带宽。
1个BFD会话/邻居 |
2 x 132 x 8 = 2.2 Kbps 2:在一秒内,您最多发送和接收两个BFD数据包 132:BFD数据包大小(以B为单位) |
DTLS至vSmart |
最高80 Kbps* |
vManage polling for data |
最高 1.2 Mbps** |
启用DPI |
200 Kbps |
Kbps =千位/秒
B =字节
Mbps =兆位/秒
*取决于策略和路由;此计算仅在初始交换时需要,并且稳定状态在200 B左右要低得多/最低得多。
**不考虑用户触发的活动,例如运行远程命令或管理技术;1.2 Mbps处于峰值峰值。
现在,如果考虑全部100个全网状站点,即200个BFD会话(每个分支机构2个路由器,每个路由器2个TLOC,颜色为restrict),则前面提到的表将变为.x。
表 2.200个BFD会话[100个站点]的Queue0带宽,包括vSmart和vManage轮询。
200 BFD会话 |
440 Kbps [2.2 x 200] |
DTLS至vSmart |
最高80 Kbps* |
vManage polls |
最高 1.2 Mbps** |
总数 |
1.72 Mbps |
*取决于策略和路由;此计算仅在初始交换时需要,并且稳定状态在200 B左右要低得多/最低得多。
**不考虑用户触发的活动,例如运行远程命令或管理技术;1.2 Mbps处于峰值峰值。
请记住,所有这些流量都会到达Queue0 LLQ,此控制流量始终被赋予第一类公民优先级,这意味着它们是最后在LLQ上被管制的。
通常,在QoS设计时,语音流量会置于Queue0(LLQ)中,对于100个分支的全网状SD-WAN的Tloc,需要1.72 Mbps,您可以看到低带宽电路分支的LLQ上的管制/丢弃。
现在,如果您考虑Tloc扩展开销,它不会影响Queue0,但构成整体容量需求。
表 3.在考虑如何控制Tloc扩展上的流量之后,需要满足总体带宽要求。
Queue0要求 |
1.72 Mbps |
用于Tloc扩展[Encrypted] Non Queue0的200 BFD会话 |
520 Kbps [440 + 80*] [BFD + DTLS] |
总数 |
2.24 Mbps |
*取决于策略和路由;此计算仅在初始交换时需要,并且稳定状态在200 B左右要低得多/最低得多。
根据带有颜色限制的TLOC扩展的100个分支全网状,在极端要求下考虑大约2.5 Mbps的容量规划,同样,您可以收集实时命令,管理技术未考虑在上述计算中,请在正常操作情况下考虑这一点。
场景 1.
如果您需要满足Queue0的控制流量要求,并且分支机构只有10 Mbps电路,则需要使用仅针对语音流量和控制流量的20% LLQ的QoS策略将其注册到SD-WAN重叠中。您可以从vManage查看峰值轮询时的降级体验。集中星型解决方案在这种情况下可能不起作用,因为它仍然消耗约1.28 Mbps。
表 4.集中星型队列0带宽要求。
与头端的4个BFD会话 |
8.8 Kbps [2.2 x 4] |
DTLS至vSmart |
最高80 Kbps* |
vManage polls |
最高1.2 Mbps** |
总数 |
1.28 Mbps |
*取决于策略和路由;此计算仅在初始交换时需要,并且稳定状态在200 B左右要低得多/最低得多。
**不考虑用户触发的活动,例如运行远程命令或管理技术;1.2 Mbps处于峰值峰值。
场景 2:
如果您决定重新设计QoS策略,以满足约2Mbps的额外带宽需求,您可以将QoS LLQ从20%增加到40%。但是,这会对较大的带宽电路产生负面影响。
图 3.QoS的典型20% Queue0分配。
对于10 Mbps电路,Queue0以20%的速率获得2 Mbps。 假设这是公司的典型QoS标准。采用SD-WAN需要全网状,因此,如果用户决定将QoS分配增加到40%(如图所示),则需要增加Queue0的分配以满足Queue0的2 Mbps开销。
请注意,电路的Queue0数量过多,会占用另一个队列的资源。但是,在带宽较大的电路上差别更大。
理想情况下,您必须有LLQ才能为控制流量分配固定值,为语音流量分配另一个队列,但是两者都需要优先级队列。Cisco路由器支持具有两个级别的优先级队列,称为分离LLQ,同样,一旦满足最低要求,这并不能解决最低带宽要求问题,分离LLQ将是首选QoS设计
拆分LLQ:
使用Split LLQ,您可以向队列添加所需的带宽,同时仍保留优先级队列。
拆分LLQ当前仅支持使用附加CLI,拆分LLQ可能具有两个级别的优先级队列,示例配置如下所示。可使用变量自定义配置,此代码段保留4 Mbps的控制流量和队列剩余部分作为已分配的带宽百分比。
分割队列的示例:
policy-map GBL_edges_qosmap_rev1
class Queue0
priority level 1
police cir 2000000 bc 250000
conform-action transmit
exceed-action drop
!
!
class Queue1
bandwidth remaining ratio 16
random-detect precedence-based
!
class class-default
bandwidth remaining ratio 8
random-detect precedence-based
!
class Queue3
bandwidth remaining ratio 16
random-detect precedence-based
!
class Queue4
bandwidth remaining ratio 32
random-detect precedence-based
!
class Queue5
bandwidth remaining ratio 8
random-detect precedence-based
!
class Queue6
priority level 2
police rate percent 20
!
!
!
注意:这些配置在运行17.3.x的ISR/ASR和运行20.3.x的控制器上进行了测试。
开销计算的通用准则
此表可帮助您为SD-WAN控制开销规划每个电路的容量。
表 5.通用指南计算(假设您有颜色限制)。
|
|
|
2.2 x [站点数量 从WAN Tloc] + 80 + 1200到站点的BFD的编号
BFD大小x [站点数量x从WAN Tloc到站点的BFD数量] + DTLS +vManage
|
|
2.2 x [站点数量x Tloc/每路由器] + 80
BFD大小x [站点x TLOC/每路由器] + DTLS
= Tloc_Allocation
|
|
|
开销计算示例
如果您需要计算类似于此处所示的100个站点的MPLS电路开销,可以假设每种颜色都启用了限制。
站点数量= 100
从WAN Tloc = 2到站点的BFD数量。
表 6.计算部署100个站点的MPLS开销。
|
|
|
2.2 x [100 x 2] + 80 + 1200
BFD大小x [站点数量x从WAN Tloc到站点的BFD数量] + DTLS +vManage
|
|
BFD大小x [站点x TLOC/每路由器] + DTLS
= 520 Kbps
|
|
1720 Kbps + 520 Kbps
= 2.24 Mbps
|
Queue0开销为1.72 Mbps,总开销为2.24 Mbps。