Este documento descreve as causas da utilização elevada da CPU nos Cisco Catalyst 3750 Series Switches. Similar aos roteadores Cisco, os switches usam o comando show processes cpu para exibir a utilização da CPU para identificar as causas de sua utilização elevada. Contudo, devido às diferenças na arquitetura e nos mecanismos de encaminhamento entre roteadores e switches Cisco, as saídas típicas do comando show processes cpu diferem significativamente. Este documento também lista alguns dos sintomas comunas que causam a utilização elevada da CPU no Catalyst 3750 Series Switch.
Não existem requisitos específicos para este documento.
As informações neste documento são baseadas nos Switches Catalyst 3750.
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a sua rede estiver ativa, certifique-se de que entende o impacto potencial de qualquer comando.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
Antes de examinar a arquitetura de tratamento de pacotes da CPU e solucionar problemas de alta utilização da CPU, você deve entender as diferentes maneiras pelas quais os switches de encaminhamento baseados em hardware e os roteadores baseados em Cisco IOS® usam a CPU. É comum pensar equivocadamente que alta utilização da CPU indica o esgotamento dos recursos em um dispositivo e a ameaça de uma falha. O problema de capacidade é um dos sintomas de alta utilização da CPU nos roteadores Cisco IOS. No entanto, o problema de capacidade quase nunca é um sintoma de alta utilização da CPU com switches de encaminhamento baseados em hardware.
O primeiro passo para solucionar o problema de alta utilização da CPU é verificar as notas da versão do Cisco IOS do seu Catalyst 3750 switch quanto aos possíveis erros conhecidos do IOS. Dessa forma, é possível eliminar o erro de IOS das etapas de solução de problemas. Consulte Release Notes dos Cisco Catalyst 3750 Series Switches para obter a lista de release notes dos Catalyst 3750 Switches.
Esta seção aborda alguns dos problemas comuns de alta utilização da CPU no Switch Catalyst 3750.
Uma das razões comuns para a alta utilização da CPU é que a CPU do Catalyst 3750 está ocupada com a tempestade de processamento de mensagens de saída do Internet Group Management Protocol (IGMP). Se uma pilha de Switches Catalyst 3750 que executam o Cisco IOS Software Release 12.1(14)EA1a estiver conectada a outro switch, como um Cat6500 que executa o CatOS, que gera consultas IGMP baseadas em MAC com opções IP, o 3750 experimentará uma alta utilização da CPU no processo IGMPSN (snooping). Este é um resultado dos pacotes de consulta baseados em MAC que estão em loop na pilha. Você também pode ver uma CPU alta com o processo de solicitação hl2mm HRPC. Se você tiver o EtherChannel configurado na pilha do Catalyst 3750 com o Cisco IOS Software Release 12.1(14)EA1a, uma tempestade de mensagens de IGMP leave poderá ser criada.
O Catalyst 3750 recebe muitas consultas IGMP. Isso faz com que o contador de consultas IGMP comece a ser incrementado em centenas por segundo. Isso leva a uma alta utilização da CPU no Switch Catalyst 3750. Consulte o bug da Cisco ID CSCeg55298 (somente clientes registrados) . O bug foi identificado no Cisco IOS Software Release 12.1(14)EA1a e é corrigido no Cisco IOS Software Releases 12.2(25)SEA e posteriores. A solução permanente é atualizar para a versão mais recente do Cisco IOS. A solução temporária é desativar o snooping IGMP na pilha do Catalyst 3750 ou desativar a consulta baseada em MAC no switch conectado à pilha do 3750.
Este é um exemplo de saída do comando show ip traffic que mostra pacotes IP com opções inválidas e alertas que são incrementados rapidamente:
Switch#show ip traffic Rcvd: 48195018 total, 25628739 local destination 0 format errors, 0 checksum errors, 10231692 bad hop count 0 unknown protocol, 9310320 not a gateway 0 security failures, 10231 bad options, 2640539 with options Opts: 2640493 end, 206 nop, 0 basic security, 2640523 loose source route 0 timestamp, 0 extended security, 16 record route 0 stream ID, 0 strict source route, 10231 alert, 0 cipso, 0 ump 0 other Frags: 16 reassembled, 0 timeouts, 0 couldn't reassemble 32 fragmented, 0 couldn't fragment Bcast: 308 received, 0 sent Mcast: 4221007 received, 4048770 sent Sent: 25342014 generated, 20710669 forwarded Drop: 617267 encapsulation failed, 0 unresolved, 0 no adjacency 0 no route, 0 unicast RPF, 0 forced drop 0 options denied, 0 source IP address zero !--- Output suppressed.
O comando show processes cpu exibe informações sobre os processos ativos no switch e suas estatísticas de utilização de CPU correspondentes. Este é um exemplo de saída do comando show processes cpu quando a utilização da CPU é normal:
switch#show processes cpu CPU utilization for five seconds: 8%/4%; one minute: 6%; five minutes: 5% PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process 1 384 32789 11 0.00% 0.00% 0.00% 0 Load Meter 2 2752 1179 2334 0.73% 1.06% 0.29% 0 Exec 3 318592 5273 60419 0.00% 0.15% 0.17% 0 Check heaps 4 4 1 4000 0.00% 0.00% 0.00% 0 Pool Manager 5 6472 6568 985 0.00% 0.00% 0.00% 0 ARP Input 6 10892 9461 1151 0.00% 0.00% 0.00% 0 IGMPSN !--- CPU utilization at normal condition. 7 67388 53244 1265 0.16% 0.04% 0.02% 0 CDP Protocol 8 145520 166455 874 0.40% 0.29% 0.29% 0 IP Background 9 3356 1568 2140 0.08% 0.00% 0.00% 0 BOOTP Server 10 32 5469 5 0.00% 0.00% 0.00% 0 Net Background 11 42256 163623 258 0.16% 0.02% 0.00% 0 Per-Second Jobs 12 189936 163623 1160 0.00% 0.04% 0.05% 0 Net Periodic 13 3248 6351 511 0.00% 0.00% 0.00% 0 Net Input 14 168 32790 5 0.00% 0.00% 0.00% 0 Compute load avgs 15 152408 2731 55806 0.98% 0.12% 0.07% 0 Per-minute Jobs 16 0 1 0 0.00% 0.00% 0.00% 0 HRPC hI2mm reque !--- Output suppressed.
Este é um exemplo de saída do comando show processes cpu quando a utilização da CPU é alta devido ao processo de rastreamento IGMP:
switch#show processes cpu CPU utilization for five seconds: 8%/4%; one minute: 6%; five minutes: 5% PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process 1 384 32789 11 0.00% 0.00% 0.00% 0 Load Meter 2 2752 1179 2334 0.73% 1.06% 0.29% 0 Exec 3 318592 5273 60419 0.00% 0.15% 0.17% 0 Check heaps 4 4 1 4000 0.00% 0.00% 0.00% 0 Pool Manager 5 6472 6568 985 0.00% 0.00% 0.00% 0 ARP Input 6 10892 9461 1151 100 100 100 0 IGMPSN !--- Due to high CPU utilization. 7 67388 53244 1265 0.16% 0.04% 0.02% 0 CDP Protocol 8 145520 166455 874 0.40% 0.29% 0.29% 0 IP Background 9 3356 1568 2140 0.08% 0.00% 0.00% 0 BOOTP Server 10 32 5469 5 0.00% 0.00% 0.00% 0 Net Background 11 42256 163623 258 0.16% 0.02% 0.00% 0 Per-Second Jobs 12 189936 163623 1160 0.00% 0.04% 0.05% 0 Net Periodic 13 3248 6351 511 0.00% 0.00% 0.00% 0 Net Input 14 168 32790 5 0.00% 0.00% 0.00% 0 Compute load avgs 15 152408 2731 55806 0.98% 0.12% 0.07% 0 Per-minute Jobs 16 0 2874 0 100 100 100 0 HRPC hI2mm reque !--- Output suppressed.
O túnel GRE (General Routing Encapsulation) não é suportado pelos switches Cisco Catalyst 3750 Series. Mesmo que esse recurso possa ser configurado com CLI, os pacotes não podem ser comutados por hardware nem por software, o que aumenta a utilização da CPU.
Observação: somente as interfaces de túnel Distance Vetor Multicast Routing Protocol (DVMRP) são suportadas para o roteamento multicast no Catalyst 3750. Mesmo para isso, os pacotes não podem ser comutados com hardware. Os pacotes roteados por esse túnel devem ser comutados por software. O maior número de pacotes encaminhados através desse túnel aumenta a utilização da CPU.
Não há solução alternativa para esse problema. Essa é uma limitação de hardware nos Catalyst 3750 Series Switches.
Se os Switches Catalyst 3750 estiverem conectados em uma pilha e se houver alguma alteração de configuração feita em um switch, o processo de configuração de execução hulc será ativado e gerará uma nova cópia da configuração de execução. Em seguida, ele envia para todos os switches na pilha. A nova configuração em execução exige muito da CPU. Portanto, o uso da CPU é alto ao criar um novo processo de configuração em execução e ao encaminhar as novas configurações para outros switches. No entanto, esse alto uso da CPU deve existir somente pelo mesmo tempo necessário para executar a etapa de configuração de construção do comando show running-configuration.
Não há necessidade de uma solução alternativa para esse problema. O uso da CPU normalmente é alto nessas situações.
Este é um exemplo de saída do comando show processes cpu quando a utilização da CPU é alta devido ao processo hulc running:
switch#show processes cpu CPU utilization for five seconds: 63%/0%; one minute: 27%; five minutes: 23% PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process 1 384 32789 11 0.00% 0.00% 0.00% 0 Load Meter 2 2752 1179 2334 0.73% 1.06% 0.29% 0 Exec 3 318592 5273 60419 0.00% 0.15% 0.17% 0 Check heaps 4 4 1 4000 0.00% 0.00% 0.00% 0 Pool Manager 5 6472 6568 985 0.00% 0.00% 0.00% 0 ARP Input 6 10892 9461 1151 0.00% 0.00% 0.00% 0 IGMPSN 7 67388 53244 1265 0.16% 0.04% 0.02% 0 CDP Protocol 8 145520 166455 874 0.40% 0.29% 0.29% 0 IP Background 9 3356 1568 2140 0.08% 0.00% 0.00% 0 BOOTP Server 10 32 5469 5 0.00% 0.00% 0.00% 0 Net Background 11 42256 163623 258 0.16% 0.02% 0.00% 0 Per-Second Jobs 12 189936 163623 1160 0.00% 0.04% 0.05% 0 Net Periodic 13 3248 6351 511 0.00% 0.00% 0.00% 0 Net Input 14 168 32790 5 0.00% 0.00% 0.00% 0 Compute load avgs 15 152408 2731 55806 0.98% 0.12% 0.07% 0 Per-minute Jobs 16 0 1 0 0.00% 0.00% 0.00% 0 HRPC h12mm reque 17 85964 426 201793 55.72% 12.05% 5.36% 0 hulc running !--- Output suppressed.
A alta utilização da CPU do processo de entrada Address Resolution Protocol (ARP) ocorre se o roteador tiver que originar um número excessivo de solicitações ARP. As solicitações ARP para o mesmo endereço IP são limitadas por taxa a uma solicitação a cada dois segundos. Portanto, um número excessivo de solicitações ARP tem que se originar para endereços IP diferentes. Isso pode ocorrer se uma rota IP tiver sido configurada e apontar para uma interface de broadcast. Um exemplo óbvio é uma rota padrão, como:
ip route 0.0.0.0 0.0.0.0 Fastethernet0/0
Nesse caso, o roteador gera uma solicitação ARP para cada endereço IP que não pode ser acessado por meio de rotas mais específicas, o que significa que o roteador gera uma solicitação ARP para quase todos os endereços na Internet. Consulte Especificando um endereço IP do próximo salto para rotas estáticas para obter mais informações sobre como configurar o endereço IP do próximo salto para roteamento estático.
Como alternativa, uma quantidade excessiva de solicitações ARP pode ser causada por um fluxo de tráfego mal-intencionado que verifica através de sub-redes localmente conectadas. Uma indicação de tal fluxo é a presença de um número muito alto de entradas ARP incompletas na tabela ARP. Como os pacotes IP de entrada que disparam solicitações ARP precisam ser processados, a solução desse problema é essencialmente a mesma solução de problemas de alta utilização da CPU no processo de entrada de IP.
Nas versões mais recentes do Cisco IOS para o Catalyst 3750, as solicitações do Protocolo de Gerenciamento de Rede Simples (SNMP - Simple Network Management Protocol) são tratadas pelo MECANISMO SNMP. É normal que a CPU fique alta devido a esse processo do MECANISMO SNMP. O processo SNMP tem uma prioridade baixa e não deve afetar nenhuma funcionalidade no switch.
Consulte Protocolo de Gerenciamento de Rede Simples (SNMP - Simple Network Management Protocol) IP Causa Alta Utilização da CPU para obter mais informações sobre a alta utilização da CPU causada pelo processo do MECANISMO SNMP.
O SDM (Switch Database Management, gerenciamento de banco de dados de switch) nos switches Catalyst 3750 Series gerencia as informações de switching de Camada 2 e Camada 3 que são mantidas na TCAM (Ternary Content Addressable Memory, memória de conteúdo endereçável ternário). Os modelos de SDM são usados para configurar recursos do sistema no switch para otimizar o suporte para recursos específicos, o que depende de como o switch é usado na rede. Os modelos de SDM podem ser selecionados para fornecer o uso máximo do sistema para algumas funções ou para usar o modelo padrão para equilibrar recursos. Os modelos priorizam os recursos do sistema para otimizar o suporte para estes tipos de recursos:
Roteamento—O modelo de roteamento maximiza os recursos do sistema para o roteamento unicast, normalmente exigido para um roteador ou agregador no centro de uma rede.
VLANs—O modelo de VLAN desativa o roteamento e suporta o número máximo de endereços MAC unicast. Isso é normalmente selecionado para um switch de Camada 2.
Acesso—O modelo de acesso maximiza os recursos do sistema para listas de controle de acesso (ACLs) para acomodar um grande número de ACLs.
Padrão — O modelo padrão fornece equilíbrio para todas as funções.
Há duas versões de cada modelo: um modelo de desktop e um modelo de agregador.
Observação: o modelo padrão para switches de desktop é o modelo de desktop padrão. O modelo padrão para o Catalyst 3750-12S é o modelo de agregador padrão.
Selecione um modelo de SDM apropriado que forneça o uso máximo do sistema para o recurso usado. Um modelo de SDM inadequado pode sobrecarregar a CPU e degradar gravemente o desempenho do switch.
Emita o comando show platform tcam usage para ver quanto TCAM foi utilizado e quanto está disponível.
Switch#show platform tcam utilization CAM Utilization for ASIC# 0 Max Used Masks/Values Masks/values Unicast mac addresses: 784/6272 12/26 IPv4 IGMP groups + multicast routes: 144/1152 6/26 IPv4 unicast directly-connected routes: 784/6272 12/26 IPv4 unicast indirectly-connected routes: 272/2176 8/44 IPv4 policy based routing aces: 0/0 0/0 IPv4 qos aces: 528/528 18/18 IPv4 security aces: 1024/1024 27/27 Note: Allocation of TCAM entries per feature uses a complex algorithm. The above information is meant to provide an abstract view of the current TCAM utilization
Se a utilização de TCAM estiver próxima do máximo para qualquer um dos parâmetros, verifique se qualquer um dos outros recursos do modelo pode ser otimizado para esse parâmetro.
show sdm prefer access | default | dual-ipv4-and-ipv6 | routing | vlan
Switch# show sdm prefer routing "desktop routing" template: The selected template optimizes the resources in the switch to support this level of features for 8 routed interfaces and 1024 VLANs. number of unicast mac addresses: 3K number of igmp groups + multicast routes: 1K number of unicast routes: 11K number of directly connected hosts: 3K number of indirect routes: 8K number of policy based routing aces: 512 number of qos aces: 512 number of security aces: 1K
Para especificar o modelo de SDM a ser usado no switch, execute o comando de configuração global sdm prefer.
Observação: a recarga do switch é necessária para usar o novo modelo de SDM.
A implementação do Roteamento Baseado em Políticas (PBR - Policy Based Routing) nos switches Cisco Catalyst 3750 tem algumas limitações. Se essas restrições não forem seguidas, poderá causar alta utilização da CPU.
Você pode ativar o PBR em uma porta roteada ou em uma SVI.
O switch não suporta instruções de negação de mapa de rota para PBR.
O tráfego multicast não é roteado por políticas. O PBR se aplica somente ao tráfego unicast.
Não associe as ACLs que permitem pacotes destinados a um endereço local. O PBR encaminha esses pacotes, o que pode causar falha de ping ou Telnet ou não-sincronização de protocolo de rota.
Não associe ACLs com ACEs deny. Os pacotes que correspondem a uma ACE deny são enviados à CPU, o que pode causar alta utilização da CPU.
Para usar o PBR, você deve primeiro habilitar o modelo de roteamento com o comando de configuração global sdm prefer routing. O PBR não é suportado com a VLAN ou o modelo padrão.
Para obter uma lista completa, consulte as Diretrizes de configuração de PBR.
Você pode fazer com que o ICMP descarte redirecionamentos quando uma VLAN (ou qualquer porta de Camada 3) receber um pacote em que o IP de origem esteja em uma sub-rede, o IP de destino esteja em outra sub-rede e o próximo salto esteja na mesma VLAN ou no mesmo segmento de Camada 3.
Aqui está um exemplo:
Você pode ver esta mensagem em show log:
51w2d: ICMP-Q:Dropped redirect disabled on L3 IF: Local Port Fwding L3If:Vlan7 L2If:GigabitEthernet2/0/13 DI:0xB4, LT:7, Vlan:7 SrcGPN:65, SrcGID:65, ACLLogIdx:0x0, MacDA:001a.a279.61c1, MacSA: 0002.5547.3bf0 IP_SA:64.253.128.3 IP_DA:208.118.132.9 IP_Proto:47 TPFFD:EDC10041_02C602C6_00B0056A-000000B4_EBF6001B_0D8A3746
Isso ocorre onde o pacote é recebido na VLAN 7 com o IP de origem 64.253.128.3 e tenta alcançar 208.118.132.9, o IP de destino. Você pode ver que o próximo salto configurado no switch (64.253.128.41, nesse caso) também está na mesma VLAN 7.
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
20-Dec-2005 |
Versão inicial |