Introdução
Este documento descreve como calcular a sobrecarga de tráfego de controle em uma implantação de sobreposição de SD-WAN. Observe que as seguintes orientações do artigo devem ser usadas no código de viptela abaixo de 20.10.x e IOS-XE SD-WAN 17.10.x e abaixo (de 20.10.x /17.10.x a Cisco implementou o modelo push para coleta de dados).
Problema
Uma pergunta comum que é recebida no momento da fase de projeto de um usuário é 'Quanta sobrecarga a solução SD-WAN causaria em nosso circuito de filial'? A resposta é que depende de algumas variáveis.
Solução
Este estudo de caso ajuda você a encontrar essa resposta. A maioria dos usuários no momento de uma atribuição de filial pode ou não ter o circuito de Internet provisionado. Se eles tiverem um, ele normalmente se pareceria com a Figura 1.
Figura 1. Ramificação SD-WAN com Internet e circuito Multiprotocol Label Switching (MPLS).
Isso pode não ser sempre o caso, alguns usuários prefeririam, na maioria das vezes, migrar para SD-WAN com mínima alteração e nova introdução de circuito, a adição de circuito possivelmente planejado para uma fase posterior, que seria como a Figura 2. sem um circuito de Internet.
Figura 2. Filial SD-WAN com circuito MPLS apenas.
Para definir o estágio, se você tiver 100 ramificações com 2 Head-Ends e uma topologia de malha completa proposta entre ramificações e Head-Ends, e o usuário tiver um padrão de QOS rigoroso com 20% de alocação para LLQ (Low Latency Queue, fila de baixa latência) para voz.
Com a migração para SD-WAN, qual seria nossa sobrecarga a considerar para essas filiais, se houver. Vamos nos aprofundar.
Nota: Estes cálculos devem ser considerados para um requisito operacional normal, incluindo o requisito de pico. No entanto, não considere todos os cenários possíveis.
Esses números são derivados do teste de laboratório realizado com as sessões 1vManage, 1vBond e 1vSmart, 255 BFD.
Tabela 1. Largura de banda por sessão.
1 Sessão BFD/Vizinho |
2 x 132 x 8 = 2,2 Kbps 2: Em um segundo, você envia e recebe até 2 pacotes BFD 132: Tamanho do pacote BFD em B |
DTLS para vSmart |
até 80 Kbps* |
vManage polling para dados |
até 1,2 Mbps** |
Ativação do DPI |
200 Kbps |
Kbps = Kilobits por segundo
B = Bytes
Mbps = Megabits por segundo
* Depende da política e das rotas; esse cálculo é necessário somente no momento da troca inicial e o estado estável é muito mais baixo/mínimo em torno de 200 B.
** Não considera uma atividade acionada pelo usuário, como executar comandos remotos ou admin tech; 1,2 Mbps está em pico.
Agora, se você considerar todos os 100 sites de malha completa que são 200 sessões de BFD (2 roteadores por filial, 2 TLOCs por roteador com restrição de cor), a tabela mencionada anteriormente se tornaria .x.
Tabela 2. Largura de banda da fila 0 para 200 sessões de BFD [100 locais] que incluem interrogação vSmart e vManage.
Sessão de 200 BFD |
440 Kbps [2.2 x 200] |
DTLS para vSmart |
até 80 Kbps* |
vManage votações |
até 1,2 Mbps** |
Total |
1.72 Mbps |
* Depende da política e das rotas; esse cálculo é necessário somente no momento da troca inicial e o estado estável é muito mais baixo/mínimo em torno de 200 B.
** Não considera uma atividade acionada pelo usuário, como executar comandos remotos ou admin tech; 1,2 Mbps está em pico.
Lembre-se de que todo esse tráfego atinge o LLQ da Fila 0. Esse tráfego de controle sempre recebe prioridade de primeira classe do cidadão, o que significa que ele é o último a ser policiado em um LLQ.
Frequentemente, no momento do projeto de QoS, o tráfego de voz é colocado na Queue0 (LLQ), com um requisito de 1,72 Mbps para malha completa de 100 ramificações com Tloc para SD-WAN, você pode ver o policiamento/queda no LLQ com ramificações de circuito de baixa largura de banda.
Agora, se você considerar a sobrecarga de extensão Tloc que não contribuirá para a Fila 0, mas constitui o requisito geral de capacidade.
Tabela 3. Requisito de largura de banda geral depois de considerar como controlar o tráfego sobre a extensão Tloc.
Requisito Queue0 |
1.72 Mbps |
Sessão 200 BFD para Extensão Tloc [Criptografada] Fora da Fila0 |
520 Kbps [440 + 80*] [BFD + DTLS] |
Total |
2.24 Mbps |
* Depende da política e das rotas; esse cálculo é necessário somente no momento da troca inicial e o estado estável é muito mais baixo/mínimo em torno de 200 B.
Por 100 ramificações em malha cheia com extensões TLOC com restrição de cores considere um planejamento de capacidade de ~2,5 Mbps em um requisito extremo. Novamente, você pode coletar comandos em tempo real, a tecnologia administrativa não é considerada no cálculo mencionado anteriormente, considere isso em uma situação de operação normal.
Cenário 1.
Se você precisar acomodar os requisitos de tráfego de controle para Queue0 e se uma filial tiver apenas um circuito de 10 Mbps, ela precisará ser integrada na sobreposição de SD-WAN com uma política de QoS de apenas 20% LLQ para tráfego de voz e controle. Você pode observar uma experiência degradada no momento do pico da pesquisa no vManage. Uma solução de hub e spoke pode não ajudar nesse caso, já que ainda consome cerca de 1,28 Mbps.
Tabela 4. Requisito de Largura de Banda da Fila de Hub e Spoke0.
4 Sessão BFD para headends |
8.8 Kbps [2.2 x 4] |
DTLS para vSmart |
até 80 Kbps* |
vManage votações |
até 1,2 Mbps** |
Total |
1.28 Mbps |
* Depende da política e das rotas; esse cálculo é necessário somente no momento da troca inicial e o estado estável é muito mais baixo/mínimo em torno de 200 B.
** Não considera uma atividade acionada pelo usuário, como executar comandos remotos ou admin tech; 1,2 Mbps está em pico.
Cenário 2.
Se você decidir reprojetar a política de QoS, para acomodar o requisito extra de largura de banda de ~2 Mbps, poderá aumentar o LLQ de QoS de 20% para 40%. No entanto, isso teria um efeito negativo em circuitos de largura de banda maiores.
Figura 3. Alocação típica de 20% da fila 0 para QoS.
Para um circuito de 10 Mbps, a Fila0 obtém 2 Mbps a 20%. Suponha que este seja um padrão de QoS típico para uma empresa. A adoção de SD-WAN requer malha completa, portanto, você precisa aumentar a alocação de Queue0 para acomodar 2 Mbps de sobrecarga para Queue0 se o usuário decidir aumentar a alocação de QoS para 40%, como mostrado na imagem.
Veja que uma quantidade enorme de Queue0 para um circuito retira os recursos para a outra fila. No entanto, a diferença é maior em um circuito de largura de banda maior.
O ideal é ter o LLQ para ter uma alocação fixa para o tráfego de controle e outra fila para o tráfego de voz, mas ambos exigem uma fila de prioridade. Os roteadores Cisco suportam uma fila de prioridade com dois níveis conhecidos como LLQ dividido, mais uma vez isso não resolve um problema de requisito mínimo de largura de banda quando um requisito mínimo é atendido, um LLQ dividido seria um projeto de QoS preferido
LLQ dividido:
Com Split LLQ, você adiciona a largura de banda necessária à Fila e ainda mantém a fila de prioridade.
O LLQ dividido atualmente suporta apenas com o acréscimo de CLI, com o LLQ dividido poderia ter dois níveis da fila de prioridade, um exemplo de configuração seria como mostrado aqui. A configuração pode ser personalizada com variáveis, esse snippet reserva 4 Mbps para o tráfego de controle e o restante da fila como porcentagem de largura de banda atribuída.
Exemplo de uma fila dividida:
policy-map GBL_edges_qosmap_rev1
class Queue0
priority level 1
police cir 2000000 bc 250000
conform-action transmit
exceed-action drop
!
!
class Queue1
bandwidth remaining ratio 16
random-detect precedence-based
!
class class-default
bandwidth remaining ratio 8
random-detect precedence-based
!
class Queue3
bandwidth remaining ratio 16
random-detect precedence-based
!
class Queue4
bandwidth remaining ratio 32
random-detect precedence-based
!
class Queue5
bandwidth remaining ratio 8
random-detect precedence-based
!
class Queue6
priority level 2
police rate percent 20
!
!
!
Observação: essas configurações são testadas no ISR/ASR executando a versão 17.3.x e controladoras na versão 20.3.x.
Diretriz Genérica para Cálculo de Custo Indireto
Esta tabela pode ajudá-lo a planejar a capacidade por circuito para uma sobrecarga de controle de SD-WAN.
Tabela 5. Cálculo de diretriz genérica (presume que você tenha restrição de cores).
|
Largura de banda necessária
|
|
2,2 x [ nº de locais x nº de BFD para um local a partir do Toque da WAN] + 80 + 1200
Tamanho x do BFD [ nº de locais x nº de BFD para um local do ciclo de WAN] + DTLS + vManage
|
Controle de tráfego sobre TLOC
|
2,2 x [nº de locais x Tloc/por roteador] + 80
Tamanho do BFD x [locais x TLOC/por roteador] + DTLS
= Alocação_Tloc
|
|
Queue0_Allocation + Tloc_Allocation
|
Exemplo de Cálculo de Custo Indireto
Se você precisar calcular a sobrecarga do circuito MPLS para 100 locais semelhantes àquele mostrado aqui, você pode supor que cada cor tem a restrição ativada.
Nº de locais = 100
Nº de BFD para um local do Toque da WAN = 2.
Tabela 6. Calcule a sobrecarga de MPLS para a implantação de 100 locais.
|
Largura de banda necessária
|
|
2,2 x [100 x 2] + 80 + 1200
Tamanho x do BFD [ nº de locais x nº de BFD para um local do ciclo de WAN] + DTLS + vManage
|
Controle de tráfego sobre TLOC
|
Tamanho do BFD x [locais x TLOC/por roteador] + DTLS
= 520 Kbps
|
|
1.720 Kbps + 520 Kbps
= 2,24 Mbps
|
A sobrecarga da Fila0 de 1,72 Mbps e a sobrecarga total é de 2,24 Mbps.