Ce document décrit comment identifier une barre transversale (Xbar) défectueuse lorsqu'un module est en panne en raison d'une défaillance de synchronisation Xbar sur un commutateur Cisco Nexus 7000. La procédure de dépannage de ce problème implique la collecte de données, l'analyse des données et un processus d'élimination afin d'isoler le composant problématique.
Cisco vous recommande de connaître l'interface de ligne de commande du système d'exploitation Cisco Nexus (NX-OS).
Les informations de ce document sont basées sur le commutateur de la gamme Cisco Nexus 7000 qui exécute NX-OS Version 6.1(2), mais il peut également fonctionner avec n'importe quelle version de NX-OS.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Le module N7K-F248XP-25E est arrêté en raison d'une défaillance de synchronisation Xbar lors du démarrage du module. Lorsque le module a été inséré dans le logement 1 sur le châssis, il est hors tension. Cela peut se produire pour l'une des raisons suivantes :
En cas de défaillance matérielle suspectée sur le module N7K-F248XP-25E, vous devez consulter les journaux afin de déterminer si la cause de la défaillance est due à un module défectueux ou à une défaillance de synchronisation Xbar.
Afin d'isoler davantage le problème dans cet exemple, le module a été inséré dans un autre emplacement et est devenu actif comme prévu. Cela indique que le module n'est pas défectueux, donc le problème est soit avec le fabric Xbar, soit avec le châssis.
Ce journal des exceptions s'est affiché lorsque le module a été mis hors tension dans le logement 1 :
show module internal exceptionlog module 1
********* Exception info for module 1 ********
exception information --- exception instance 1 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)
System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:55:19 2014
(Ticks: 532B0F67 jiffies)
exception information --- exception instance 2 ----
Module Slot Number: 1
Device Id : 88
Device Name : XbarComplex
Device Errorcode : 0x00000008
Device ID : 00 (0x00)
Device Instance : 00 (0x00)
Dev Type (HW/SW) : 00 (0x00)
ErrNum (devInfo) : 08 (0x08)
System Errorcode : 0x40240012 xbar sync failed during module bringup
(DevErr is LinkNum)
Error Type : Informational
PhyPortLayer : Unknown
Port(s) Affected : none
DSAP : 0 (0x0)
UUID : 0 (0x0)
Time : Thu Mar 20 15:53:12 2014
(Ticks: 532B0EE8 jiffies)
Selon ces journaux d'exception, le problème est clairement lié à la Xbar ou au châssis du logement 1.
Afin d'isoler le problème plus loin, vous devez retirer chaque Xbar individuellement pendant que vous surveillez le module dans le logement 1 jusqu'à ce qu'il soit capable de s'allumer sans problème. Ceci confirme qu'il y a un problème avec un module de structure Xbar particulier, auquel cas vous continueriez avec une autorisation de retour de matériel (RMA) pour le matériel défectueux.
Cependant, il s'agit d'une procédure longue qui nécessite une longue période de maintenance. Afin de trouver l'emplacement de fabric Xbar exact qui cause le problème de synchronisation avec le module, vous pouvez procéder comme indiqué ici :
show system internal xbar event-history errors
-----------------------------------------------------
7) Event:E_DEBUG, length:67, at 384460 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_perform_error_action(1413): MTS_OPC_LC_INSERTED error 0x1
8) Event:E_DEBUG, length:104, at 384347 usecs after Thu Mar 20 15:55:19 2014
[102] send_exception_log_msg_to_lcm(1101): module 1 DevId 88 dev_err 0x8 sys
_err 0x40240012 err_type 0x4
9) Event:E_DEBUG, length:59, at 384343 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(221): Sync fail for module 1 link 8
10) Event:E_DEBUG, length:66, at 384341 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_mod_ac_error(210): Error for Slot 0 error_code 0x877660c
11) Event:E_DEBUG, length:62, at 384298 usecs after Thu Mar 20 15:55:19 2014
[102] xbm_sync_seq_failed(1169): Sync fail for module 1 link 8
Dans ces journaux, vous pouvez voir le message Échec de synchronisation pour le module 1 link 8. Vous devez ensuite identifier le logement de fabric auquel la liaison 8 est associée. Pour déterminer cela, vous devez vérifier la sortie de la commande show system internal xbar sw :
show system internal xbar sw
Module in slot 1 (present = 0)
Dedicated X-link 255
rid 0x2000000 type 0 state 0 sub_type 0 node_id 0x0
sw_card_id 0x0 lc_node_addr 0x0 feature_bits 0x0
timer: hdl 0x86fcc20 rid 0x2000000 ev_id 0xffff timer_id 0x41a tim_type 0x2
Link_Info:: Num Links 10 max Edp 10
Link_num 0
is_synced 0 is_edp 0 num_sync_try 0
Link_num 1
is_synced 0 is_edp 0 num_sync_try 0
Link_num 2
is_synced 0 is_edp 0 num_sync_try 0
Link_num 3
is_synced 0 is_edp 0 num_sync_try 0
Link_num 4
is_synced 0 is_edp 0 num_sync_try 0
Link_num 5
is_synced 0 is_edp 0 num_sync_try 0
Link_num 6
is_synced 0 is_edp 0 num_sync_try 0
Link_num 7
is_synced 0 is_edp 0 num_sync_try 0
Link_num 8
is_synced 0 is_edp 0 num_sync_try 3
Link_num 9
is_synced 0 is_edp 0 num_sync_try 0
Link_Map:: Num Links 10 max Edp 10
Link_num 0
connected to fab [10.0] active_lnk 1
fi_to_mon 0 fi_to_use 0
Link_num 1
connected to fab [10.0] active_lnk 1
fi_to_mon 0 fi_to_use 0
Link_num 2
connected to fab [11.0] active_lnk 1
fi_to_mon 1 fi_to_use 1
Link_num 3
connected to fab [11.0] active_lnk 1
fi_to_mon 1 fi_to_use 1
Link_num 4
connected to fab [12.0] active_lnk 1
fi_to_mon 2 fi_to_use 2
Link_num 5
connected to fab [12.0] active_lnk 1
fi_to_mon 2 fi_to_use 2
Link_num 6
connected to fab [13.0] active_lnk 1
fi_to_mon 3 fi_to_use 3
Link_num 7
connected to fab [13.0] active_lnk 1
fi_to_mon 3 fi_to_use 3
Link_num 8
connected to fab [14.0] active_lnk 1
fi_to_mon 4 fi_to_use 4
Link_num 9
connected to fab [14.0] active_lnk 1
fi_to_mon 4 fi_to_use 4
Dans le résultat, vous pouvez voir que Link_num 8 (Link 8) est connecté à fab [14.0] (Fabric Slot 14), qui est Xbar 5.
Afin d'identifier fab [14.0] (la structure du logement 5), entrez la commande show module :
show module
Xbar Ports Module-Type Model Status
--- ----- -------------------------------- ----------------- ------
4 0 Fabric Module 2 N7K-C7010-FAB-2 ok
Xbar MAC-Address(es) Serial-Num
--- -------------------------------------- ----------
1 NA JAF1739AQTP
2 NA JAF1739AJAA
3 NA JAF1739AQDG
4 NA JAF1739ATHG
5 NA JAF1739AQEF
Dans le résultat de la commande show module, vous pouvez afficher le module de matrice Xbar dans le logement 5.
Vous devez maintenant disposer de l'identification correcte du fabric qui a causé l'échec de synchronisation du module dans le logement 1. Dans cet exemple, le fabric a été supprimé du logement 5 et le module du logement 1 a démarré sans erreur. Le Xbar défectueux peut maintenant être remplacé.
Révision | Date de publication | Commentaires |
---|---|---|
1.0 |
17-Jun-2015 |
Première publication |