Inleiding
Dit document beschrijft een probleem dat zich heeft voorgedaan op Cisco MultiLayer Data Switch (MDS) 9000 Series Fibre Channel (FC) poorten en biedt een oplossing voor het probleem.
Probleem
Het logbestand Gebeurtenissen van deze koppeling wordt weergegeven:
*************** Port Config Link Events Log ***************
---- ------ ----- ----- ------
Time PortNo Speed Event Reason
---- ------ ----- ----- ------
...
Jul 28 00:46:39 2012 00670297 fc11/25 --- DOWN LR Rcvd B2B
Het LR Rcvd B2B (of Link-uitval Link Reset is mislukt zonder lege recv-wachtrij) bericht geeft aan dat het apparaat dat aan de poort is gekoppeld een Link Reset (LR) naar de MDS verzendt, maar de MDS reageert niet met een Link Reset Response (LRR) vanwege interne congestie op de poort. De poort heeft pakketen in de wachtrij die worden ontvangen van het aangesloten apparaat, maar de MDS kan ze niet leveren aan de juiste uitgang poort. Aangezien zij nog bij de ingangshaven een rij vormen, kan MDS geen LRR terugsturen, en de verbinding ontbreekt.
Deze foutmeldingen worden bij het vorige gebeurtenissenlogboek gevoegd:
%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$
Interface fc11/25 is down (Link failure)
%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue)
Opmerking: Dit scenario is gebaseerd op de aannames dat het aantal bufferkredieten dat de MDS het FC-apparaat toekent, drie is en dat de pakketten van het FC-apparaat naar de uitgaande FC-poort worden overgeschakeld.
MDS
FC Port FC Port
(Egress) Arbiter (Ingress) FC device
-------- ------- --------- ---------
1) <------- FC packet 1
2) <--- Grant Request
3) Grant------------>
4) <---------------FC packet 1
5) R_Rdy--------> Tx B2B=3
6) <------- FC packet 2 Tx B2B=2
7) <---- Grant Request
8) <------- FC packet 3 Tx B2B=1
9) <---- Grant Request
10) <------- FC packet 4 Tx B2B=0
11) <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13) <--------Link Reset(LR)
14) Start 90ms "LR Rcvd B2B" timer
15) "LR Rcvd B2B" timer expires
16) <--------NOS-------->
Toelichting
In dit hoofdstuk wordt de vorige output toegelicht:
- Het FC-apparaat verzendt in een FC-pakket naar de toegangspoort, die is bestemd voor de uitgangspoort.
- De MDS-poort voor toegangslijnkaart (LC) bepaalt de bestemming-index (DI) en stuurt het verzoek om subsidie door naar de arbiter (Bellagio2) op de actieve supervisor.
- De scheidsrechter stuurt een Grant terug naar de ingangshaven, die hem toestemming geeft om FC-pakket 1 via de XBAR naar de uitgangshaven te verzenden.
- De ingress LC stuurt FC-pakket 1 via XBAR naar de uitgangspoort. Dit maakt de toegangsbuffer beschikbaar.
- De ingangspoort stuurt een R_RDY terug naar het FC-apparaat, wat de kredietwaardigheid weer versterkt.
Opmerking: de eerste vijf stappen zijn standaard als er geen stremming is. Ga er op dit punt van uit dat de uitgangen van de poorten vol zijn en geen pakketten meer kunnen ontvangen.
- Het FC-apparaat verzendt FC-pakket 2 naar de toegangspoort, bestemd voor de uitgangspoort.
- De MDS ingress LC poort bepaalt de DI, en stuurt het Grant request naar de arbiter (Bellagio2) op de Active Supervisor.
- Het FC-apparaat verzendt FC-pakket 3 naar de toegangspoort, bestemd voor de uitgangspoort.
- De MDS ingress LC poort bepaalt de DI, en stuurt het Grant request naar de arbiter (Bellagio2) op de Active Supervisor.
- Het FC-apparaat verzendt FC-pakket 4 naar de toegangspoort, bestemd voor de uitgangspoort.
- De MDS ingress LC poort bepaalt de DI, en stuurt het Grant request naar de arbiter (Bellagio2) op de Active Supervisor.
- De tijd verstrijkt, welke varieert afhankelijk van het aangesloten HBA type.
- Na enige tijd bij Tx B2B=0, initieert het FC-apparaat Credit Loss Recovery en stuurt een Link Reset (LR).
- Wanneer de ingangshaven de LR ontvangt, controleert het zijn ingangsbuffers en bepaalt dat er ten minste één pakketwachtrij is. Het start dan een 90 ms LR Rcvd B2B timer.
- Als de Grants worden ontvangen, en de drie FC-pakketten worden verzonden naar de uitgangshaven, dan wordt de LR Rcvd B2B-timer geannuleerd en wordt een Link Reset Response (LRR) teruggestuurd naar het FC-apparaat. In dit geval blijft de uitgang echter verstopt en blijven de drie FC-pakketten in de wachtrij staan bij de ingangshaven. De LR Rcvd B2B-timer verloopt en een LRR wordt niet teruggestuurd naar het FC-apparaat.
- Zowel de ingangshaven als het FC-apparaat starten een koppelingsfout via transmissie van een niet-operationele sequentie.
Oplossing
Als de link mislukt is met een LR Rcvd B2B of een Link-fout Link Reset-bericht mislukt, dan is de poort die is mislukt niet de oorzaak van de langzame afvoer en werd alleen beïnvloed door de langzame/vaste poort. Voltooi de volgende stappen om de trage/vaste poort te identificeren die de koppelingsfout heeft veroorzaakt:
- Bepaal of er meer dan één link is die mislukt vanwege het eerder genoemde probleem. Als meer dan één link ongeveer tegelijkertijd mislukt, kan het probleem ontstaan omdat alle poorten pakketten proberen te verzenden naar een gemeenschappelijke uitgangspoort.
- Controleer de VSAN-zoningdatabase om te zien met welke apparaten het aangrenzende FC-apparaat is gezoned. Breng deze in kaart aan de uitgang E of lokale F poorten. Om E te openen, gebruiken poorten de opdracht show fspf interne route vsan <vsan> domain <dom>. Gebruik de opdracht show flogi database vsan <vsan> om lokale F-poorten in kaart te brengen. Als er meer dan één link is die niet werkt met het LR Rcvd B2B-bericht, combineer dan de uitgaande E of lokale F-poorten die u hebt gevonden en controleer op overlappingen. Overlappingen zijn waarschijnlijk oorzaken van langzame/vastgelopen poorten.
- Controleer de poorten in stap 2 op aanwijzingen voor langzame afvoer. Voorbeelden hiervan zijn:
- Kredietverlies (AK_FCP_CNTR_CREDIT_LOSS / FCP_SW_CNTR_CREDIT_LOSS)
- 100 ms Tx B2B Zero (AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO / FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
- Time-out Discards (AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES / THB_TMM_TOLB_TIME-OUT_DROP_CNT / F16_TMM_TOLB_TIME_DROP_CNT)
- Als u bepaalt dat de slow port een uitgaande E-poort is, zet dan de slow-drain troubleshoot voort op de aangrenzende switch die wordt aangegeven door de FSPF next-hop interface.
- Als u bepaalt dat de langzame/vaste poort een FCIP-link of poortkanaal is, controleert u vervolgens of de FCIP-koppelingen signalen van IP-heruitzendingen of andere problemen, zoals koppelingsfouten. Voer de show ips stats all opdracht in om te controleren op problemen.
Configuratieopties
Hier zijn twee mogelijke opties voor systeemconfiguratie:
Gerelateerde informatie