Introdução
Este documento descreve um problema encontrado nas portas do Cisco Multilayer Data Switch (MDS) 9000 Series Fibre Channel (FC) e fornece uma solução para o problema.
Problema
Este registro de eventos de link exibe:
*************** Port Config Link Events Log ***************
---- ------ ----- ----- ------
Time PortNo Speed Event Reason
---- ------ ----- ----- ------
...
Jul 28 00:46:39 2012 00670297 fc11/25 --- DOWN LR Rcvd B2B
A mensagem LR Rcvd B2B (ou Link failure Link Reset failed nonempty recv queue) indica que o dispositivo conectado à porta transmite um Link Reset (LR) ao MDS, mas o MDS não responde com um Link Reset Response (LRR) devido ao congestionamento interno na porta. A porta tem pacotes enfileirados que são recebidos do dispositivo conectado, mas o MDS não pode entregá-los à porta de saída apropriada. Como eles ainda estão enfileirados na porta de entrada, o MDS não pode enviar de volta um LRR e o link falha.
Essas mensagens de erro acompanham o log de eventos anterior:
%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$
Interface fc11/25 is down (Link failure)
%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue)
Observação: este cenário é fornecido sob a suposição de que o número de créditos de buffer que o MDS concede ao dispositivo FC é três e que os pacotes do dispositivo FC são comutados para a porta FC de saída.
MDS
FC Port FC Port
(Egress) Arbiter (Ingress) FC device
-------- ------- --------- ---------
1) <------- FC packet 1
2) <--- Grant Request
3) Grant------------>
4) <---------------FC packet 1
5) R_Rdy--------> Tx B2B=3
6) <------- FC packet 2 Tx B2B=2
7) <---- Grant Request
8) <------- FC packet 3 Tx B2B=1
9) <---- Grant Request
10) <------- FC packet 4 Tx B2B=0
11) <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13) <--------Link Reset(LR)
14) Start 90ms "LR Rcvd B2B" timer
15) "LR Rcvd B2B" timer expires
16) <--------NOS-------->
Explicação
Esta seção explica a saída anterior:
- O dispositivo FC transmite em um pacote FC para a porta de entrada, destinada à porta de saída.
- A porta da placa de linha de ingresso (LC) do MDS determina o índice de destino (DI) e transmite a solicitação de concessão ao intermediário (Bellagio2) no Supervisor ativo.
- O intermediário envia de volta uma concessão à porta de entrada, que lhe dá permissão para transmitir o pacote FC 1 à porta de saída através do XBAR.
- O LC de entrada transmite o pacote FC 1 através do XBAR para a porta de saída. Isso torna o buffer de entrada disponível.
- A porta de entrada transmite um R_RDY de volta ao dispositivo FC, que reabastece o crédito.
Observação: as cinco primeiras etapas são típicas quando não há congestionamento. Neste ponto, suponha que as filas da porta de saída estejam cheias e não possam receber mais pacotes.
- O dispositivo FC transmite o pacote FC 2 à porta de entrada, destinada à porta de saída.
- A porta LC de ingresso do MDS determina o DI e transmite a Solicitação de Concessão ao intermediário (Bellagio2) no Supervisor Ativo.
- O dispositivo FC transmite o pacote FC 3 à porta de entrada, destinada à porta de saída.
- A porta LC de ingresso do MDS determina o DI e transmite a Solicitação de Concessão ao intermediário (Bellagio2) no Supervisor Ativo.
- O dispositivo FC transmite o pacote FC 4 à porta de entrada, destinada à porta de saída.
- A porta LC de ingresso do MDS determina o DI e transmite a Solicitação de Concessão ao intermediário (Bellagio2) no Supervisor Ativo.
- Intervalos de tempo, que variam de acordo com o tipo de HBA conectado.
- Depois de algum tempo em Tx B2B=0, o dispositivo FC inicia a recuperação de perda de crédito e transmite uma redefinição de link (LR).
- Quando a porta de entrada recebe o LR, ela verifica seus buffers de entrada e determina que há pelo menos um pacote enfileirado. Em seguida, ele inicia um temporizador LR Rcvd B2B de 90 ms.
- Se as concessões forem recebidas e os três pacotes FC forem transmitidos para a porta de saída, o temporizador LR Rcvd B2B será cancelado e um Link Reset Response (LRR) será enviado de volta ao dispositivo FC. Nesse caso, no entanto, a porta de saída permanece congestionada e os três pacotes FC permanecem enfileirados na porta de entrada. O temporizador LR Rcvd B2B expira e um LRR não é transmitido de volta para o dispositivo FC.
- A porta de entrada e o dispositivo FC iniciam uma falha de link através da transmissão de uma sequência não operacional.
Solução
Se o link falhou com uma mensagem LR Rcvd B2B ou uma mensagem Link failure Link Reset failed nonempty recv queue, a porta que falhou não é a causa do esvaziamento lento e foi afetada somente pela porta lenta/presa. Para identificar a porta lenta/travada que causou a falha do link, siga estes passos:
- Determine se há mais de um link que falha devido ao problema mencionado anteriormente. Se mais de um link falhar aproximadamente ao mesmo tempo, o problema pode surgir porque todas as portas tentam transmitir pacotes para uma porta de saída comum.
- Verifique o banco de dados de zoneamento VSAN para ver com quais dispositivos o dispositivo FC adjacente está zoneado. Mapeie-os para as portas E de saída ou F local. Para mapear para a saída E, as portas usam o comando show fspf internal route vsan <vsan> domain <dom>. Para mapear para as portas F locais, use o comando show flogi database vsan <vsan>. Se houver mais de um link que falhe com a mensagem LR Rcvd B2B, combine as portas E de saída ou F local encontradas e verifique se há sobreposições. As sobreposições são causas prováveis de portas lentas/travadas.
- Verifique se há indicações de drenagem lenta nas portas encontradas na etapa 2. Exemplos são:
- Perda de Crédito (AK_FCP_CNTR_CREDIT_LOSS / FCP_SW_CNTR_CREDIT_LOSS)
- Tx B2B Zero de 100 ms (AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO / FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
- Descartes de tempo limite (AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES / THB_TMM_TOLB_TIMEOUT_DROP_CNT / F16_TMM_TOLB_TIMEOUT_DROP_CNT)
- Se você determinar que a porta lenta é uma porta E de saída, continue a solução de problemas de drenagem lenta no switch adjacente indicado pela interface de próximo salto do FSPF.
- Se você determinar que a porta lenta/travada é um link FCIP ou canal de porta, verifique os links FCIP em busca de sinais de retransmissões de IP ou outros problemas, como falhas de link. Insira o comando show ips stats all para verificar se há problemas.
Opções de configuração
Aqui estão duas opções possíveis de configuração do sistema:
Informações Relacionadas