Introdução
Este documento descreve o uso do TITAN, sua configuração e solução de problemas em implantações CURWB.
Conceitos básicos do TITAN
O TITAN é um recurso crítico que oferece alta disponibilidade com redundância de hardware em implantações CURWB. Pode ser configurado através de vários recursos da parte fixa da rede de fluidez. Os aplicativos mais comuns estão na ativação do TITAN nos Gateways Globais da Rede Central, Gateways Finais de Malha Local e rádios de Veículo Integrado. Ele funciona em redes de camada 2 e de camada 3.
Quando ativado, o TITAN fornece failover rápido de um dispositivo primário para um dispositivo secundário, em menos de 500 milissegundos. O dispositivo secundário retoma imediatamente as comunicações MPLS CURWB.
O exemplo visto aqui mostra o failover TITAN em todas as três condições.
- Gateways globais da rede central,
- Gateways finais de malha local e
- Rádios de veículos a bordo
Como funciona o TITAN?
Para compreender plenamente o conceito de Titan, é essencial familiarizar-se com Autotap. É um mecanismo de prevenção de loop de rede que permite que os dispositivos CUWRB detectem conexões e permitam apenas uma rota de entrada/saída dedicada de e para a extremidade da malha ou o núcleo da rede.
Rádios com a mesma senha, conectados ao mesmo switch de rede no mesmo domínio de broadcast, atuam como uma única unidade com várias antenas.
O CURWB Mesh Protocol detecta conexões com fio entre rádios, com rotas sendo criadas automaticamente. O resultado é como ter um único AP com várias interfaces sem fio.
A funcionalidade AutoTap evita loops de rede nessas configurações. Somente o rádio escolhido como Primário (ID da malha numérica mais baixa) em um grupo fisicamente conectado publica informações de endereço MAC. O tráfego é visto vindo apenas do rádio escolhido como o rádio principal do grupo conectado.
Infraestrutura fixa
O usuário define duas unidades de extremidade de malha com a mesma configuração e se conecta ao mesmo switch. Esses dispositivos compartilham informações para selecionar o Principal e a outra unidade está em espera. Quando ocorre uma falha, a unidade em standby assume o controle em 500 ms e conecta todos os pontos da malha de volta ao sistema. Para redes fixas, o TITAN só pode ser habilitado em unidades de extremidade de malha e os pontos estabelecem automaticamente uma conexão com a extremidade que assumiu o controle.
Veículos para mobilidade
O processo é o mesmo que em uma rede fixa, as unidades devem estar no mesmo switch com a mesma configuração. O algoritmo define um como a unidade Primária e o outro como a secundária. Em caso de falha do primário, a unidade secundária assume em 500 ms e estabelece uma ligação com a unidade de via fechada. A única diferença com a mobilidade é que o TITAN pode ser habilitado em unidades de Ponto de Malha. Nesse caso, o recurso Fluidez substitui o modo de operação do rádio.
Rádio de via
Quando o rádio não consegue se comunicar com a rede de backbone, o sistema força o(s) veículo(s) a se conectar ao solo mais próximo como uma resposta imediata à falha. É o mesmo processo que para as redes fixas, mas com a possibilidade de mais de uma via ativa em espera. No sistema de via, o backup não é um rádio no modo de espera, mas um totalmente operacional e ativo que possa cobrir a falha.
Gateway conectado à rede corporativa
Assim como a malha termina em uma rede fixa, os gateways (FM1000 e FM10000) trabalham juntos para eleger um primário, e o backup assume uma falha.
Eleição Primária
Todas as unidades CURWB conectadas ao mesmo domínio de broadcast com fio e configuradas com a mesma senha executam um processo de eleição primária distribuída a cada poucos segundos. A unidade Primária constitui um ponto de borda da rede MPLS CURWB, isto é, um dispositivo onde o tráfego do usuário pode entrar ou sair da malha. As unidades secundárias atuam como pontos de retransmissão MPLS. Para cada vizinho, o algoritmo calcula um valor de precedência baseado na função da unidade (mesh-end ou mesh-point) e seu mesh-ID. Às extremidades das malhas é atribuída uma prioridade mais alta do que aos pontos de malha e, entre a mesma prioridade, é preferível a unidade com a ID de malha mais baixa. O mecanismo de eleição depende de um protocolo de sinalização dedicado que é executado constantemente na rede e garante que todas as unidades elegam o mesmo Principal.
Failover de extremidade de malha
Durante a operação normal, a malha Primária e Secundária termina continuamente para se comunicar entre si sobre seu status e para trocar informações de acessibilidade da rede. Em particular, o Primário envia periodicamente atualizações ao Secundário com relação à sua tabela de encaminhamento interna e às rotas multicast.
Configuração
Na configuração básica do TITAN, uma implantação precisaria de dois gateways (Mesh End); um primário e outro secundário.
Tanto os componentes primários como secundários de hardware devem ter essas configurações TITAN.
configure mpls fastfail status enabled
configure mpls fastfail timeout 150
config mpls unicast-flood enabled
config mpls arp-unicast disabled
config spanning-tree link-guard 40
config arp gratuito habilitado
configure arp gratuitamente delay 150
Nas configurações de Camada 3, se o HA for necessário em cada extremidade de malha, precisaremos de duas extremidades de malha nas quais a configuração TITAN anterior precisa ser executada.
Ao configurar o TITAN no rádio do veículo, primeiro o veículo precisa ter dois rádios nele. No caso de uma falha no primário, o secundário assume a comunicação. Neste cenário, os rádios do veículo e a extremidade da malha da rede de fluidez precisam ter a configuração TITAN.
Cenário de teste
Nossa topologia de rede atual inclui sete rádios. Nessa configuração, os rádios da extremidade da malha têm suas interfaces sem fio desativadas. A sua função limita-se a servir como gateways, em vez de funcionar como parte do sistema de rádio de via. A unidade final de malha primária recebe o endereço IP 10.122.136.50 e a unidade secundária o endereço IP 10.122.136.47.
Temos 3 rádios de via (10.122.136.9, 10.122.136.16 e 10.122.136.15). O rádio de via com o endereço IP 10.122.136.9 está conectado à infraestrutura central da rede. Esse rádio fundamental também estende um link de backhaul para um par de rádios de trailer com IP 10.122.136.15 e 10.122.136.16. Esses links de backhaul de infraestrutura fixa estão operando na faixa de frequência de 5240 MHz. Coletivamente, os três rádios fornecem cobertura sem fio para o veículo móvel operando em uma frequência de 5180 MHz com o endereço IP (10.122.136.13).
O veículo móvel está equipado com dois rádios com endereço IP 10.122.136.13 como principal e 10.122.136.14 como secundário. Ambos os rádios estão interconectados através de um único switch. O rádio secundário não é mostrado aqui.
Failover de extremidade de malha
Etapa 1: as extremidades das malhas primária e secundária estão conectadas à rede e estão ativas. Podemos ver o rádio com a ID de malha mais baixa agindo como extremidade de malha.
Etapa 2: quando o primário vai, o final de malha secundário assume e atua como o final de malha para toda a rede. Observe que a extremidade de malha primária com falha agora está ausente da lista de rádios de infraestrutura.
Etapa 3: O rádio principal com falha agora está operacional e de volta. No entanto, ele espera o atraso de preempção para aprender a topologia de rede
Etapa 4: Depois que o temporizador de preempção é alcançado, o ID de malha 5.246.226.200 assume a função de primário e rádio com o ID de malha 5.246.227.8 novamente se torna secundário.
Testando failover no rádio do veículo
Nesta rede de laboratório, temos uma rede de fluidez com um veículo conectado à via. O veículo tem dois rádios com IP 10.122.136.13 - ID da malha 5.66.194.36 (P) e 10.122.136.14 - ID da malha 5.246.2.120 (S).
Etapa 1: Os rádios do veículo primário e secundário estão online. Podemos ver o rádio com um ID de malha inferior atuando como o rádio primário e o outro como secundário. Com base na qualidade sem fio, o rádio primário e secundário podem se comunicar com o rádio de via. Mas toda a comunicação downstream para a rede integrada sempre passa pelo rádio principal. Com o rádio do veículo secundário TITAN torna-se primário durante a falha dentro de 500ms.
Nesta captura de tela, o túnel MPLS pode ser visto da extremidade da malha até os rádios do veículo.
Etapa 2: quando desligamos o rádio principal 10.122.136.13, ele faz failover para o secundário e agora 10.122.136.14 se torna o principal.
Passo 3: Falha do rádio primário de bordo no veículo está ligado e operacional. No entanto, embora esse rádio se conecte à rede, ele espera pelo atraso de preempção e não participa ativamente da rede de fluidez.
Como visto nesta captura de tela, 5.66.194.36 voltou on-line, mas ainda está agindo como secundário durante o atraso de preempção e 5.246.2.120 ainda está gerenciando a comunicação. O túnel MPLS também mostra que 5.246.2.120 está se comunicando com o rádio de via.
Troubleshooting de TITAN
- Durante a configuração TITAN, todas as configurações precisam ser idênticas em todos os rádios necessários.
- Com base no tamanho da implantação, o atraso de antecipação pode precisar ser aumentado. Isso serve para garantir que quando a unidade com falha se tornar operacional, ela não assuma a função muito cedo antes de aprender a topologia.
- A configuração do intervalo de falha rápido muito pequeno pode criar uma rede instável. Um valor de 150 ms poderia ser usado na maioria das implantações.