Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document ddécrit comment dépanner le problème d'instabilité de liaison de couche 1 sur les commutateurs Nexus 9000.
Cisco vous recommande de bien connaître le système d'exploitation Cisco Nexus (NX-OS) et l'architecture de base de Nexus avant de poursuivre avec les informations décrites dans ce document.
Les informations contenues dans ce document sont basées sur les versions de matériel et de logiciel suivantes :
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Un « Link Flap » est un problème de réseau où une interface physique sur un commutateur, tel que le Nexus 9000, alterne continuellement entre l'état actif et inactif. Ce comportement perturbateur peut dégrader les performances du réseau, le déstabiliser et interrompre la communication, ce qui entraîne des désagréments importants. Les défaillances de liaison proviennent généralement de couches physiques défectueuses ou de problèmes de synchronisation de protocole.
Les défaillances de liaison déclenchées par le protocole se produisent en cas de problème de synchronisation du protocole. Cela peut impliquer des protocoles tels que le protocole LACP (Link Aggregation Control Protocol), Virtual Port-Channel et d'autres. Le problème peut provenir d'une mauvaise configuration du protocole ou de la perte de paquets, entraînant une instabilité de la liaison. Une surveillance régulière et des mises à jour logicielles opportunes peuvent aider à empêcher ce type de liaison.
Les volets de liaison peuvent également provenir de la couche 1, la couche physique du réseau. Cela implique souvent des composants physiques tels que des câbles et des interfaces. Des câbles endommagés, desserrés ou vieillissants et des interfaces défaillantes peuvent provoquer un battement de la liaison. Des inspections physiques et des opérations de maintenance régulières, y compris des contrôles des câbles et des tests d’interface, peuvent aider à identifier et à corriger ces problèmes avant qu’ils ne conduisent à des volets de liaison.
Cet article porte sur le dépannage des problèmes physiques de couche 1.
Les failles de liaison peuvent être facilement identifiées à partir des journaux. L'exemple affiche un événement de battement de liaison sur le port E1/5, où le port tombe en panne, puis revient plus tard.
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface Ethernet1/5, operational speed changed to 10 Gbps
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_DUPLEX: Interface Ethernet1/5, operational duplex mode changed to Full
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_RX_FLOW_CONTROL: Interface Ethernet1/5, operational Receive Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_TX_FLOW_CONTROL: Interface Ethernet1/5, operational Transmit Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface port-channel100, operational speed changed to 10 Gbps
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_DUPLEX: Interface port-channel100, operational duplex mode changed to Full
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_RX_FLOW_CONTROL: Interface port-channel100, operational Receive Flow Control state changed to off
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-IF_TX_FLOW_CONTROL: Interface port-channel100, operational Transmit Flow Control state changed to off
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_UP: port-channel100: Ethernet1/5 is up
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from none to Ethernet1/5
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 10000000 Kbit
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface Ethernet1/5 is up in mode access
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface port-channel100 is up in mode access
Le gestionnaire de ports Ethernet (EthernetPM) est un processus qui gère les interfaces Ethernet. L'historique des événements Ethpm peut être utilisé pour identifier la cause d'un affaissement de liaison.
E1/5 connaît une défaillance de liaison à 05:28:35, avec la transition ethpm déclenchée par ETH_PORT_FSM_EV_LINK_DOWN. Cela indique un rabat de couche 1.
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
N9K-C93180YC-FX# show system internal ethpm event-history interface e1/5
[143] 2024-01-21T05:26:02.100255000+00:00 [-] FSM:<Ethernet1/5> Transition:
Previous state: [ETH_PORT_FSM_ST_WAIT_BUNDLE_MEMBER_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_FIRST_BRINGUP_BUNDLE_MEMBER_DONE]
Next state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
[144] 2024-01-21T05:27:35.783495000+00:00 [-] FSM:<Ethernet1/5> Transition:
Previous state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
Triggered event: [ETH_PORT_FSM_EV_LINK_DOWN]
Next state: [FSM_ST_NO_CHANGE]
E1/8 passe à l'état d'initialisation down à 07:40:07, avec la transition ethpm déclenchée par ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ. Cela indique un battement de liaison déclenché par le protocole LACP (Link Aggregation Control Protocol).
2024 Jan 21 07:37:20 N9K-C93180YC-FX %ETHPORT-5-IF_UP: Interface port-channel200 is up in Layer3
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel200 is down (No operational members)
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel200: first operational port changed from Ethernet1/8 to none
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel200: Ethernet1/8 is down
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel200,bandwidth changed to 100000 Kbit
2024 Jan 21 07:40:07 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_INITIALIZING: Interface Ethernet1/8 is down (Initializing)
N9K-C93180YC-FX# show system internal ethpm event-history interface e1/8
[218] 2024-01-21T07:37:20.551880000+00:00 [-] FSM:<Ethernet1/8> Transition:
Previous state: [ETH_PORT_FSM_ST_WAIT_BUNDLE_MEMBER_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_FIRST_BRINGUP_BUNDLE_MEMBER_DONE]
Next state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
[219] 2024-01-21T07:40:07.104339000+00:00 [-] FSM:<Ethernet1/8> Transition:
Previous state: [ETH_PORT_FSM_ST_BUNDLE_MEMBER_UP]
Triggered event: [ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ]
Next state: [FSM_ST_NO_CHANGE]
Cisco propose une vaste gamme de modules optiques pour prendre en charge un large éventail de vitesses, de supports et de distances. Avant de connecter une liaison au Nexus 9000, vérifiez que le module SFP et le câble sont compatibles avec votre matériel et vos logiciels actuels. Vous pouvez le vérifier en procédant comme suit :
Matrice de compatibilité optique-périphérique Cisco
Matrice d'interopérabilité Cisco Optics-to-Optics
À partir de NX-OS 10.2.1, le moteur Platform Insights Engine (PIE) est pris en charge sur toutes les plates-formes ToR et EoR Cloudscale. PIE est une application d'analyse de la cause première en temps réel sur commutateur.
Trois interfaces PIE peuvent vous aider à résoudre le problème d’affollement de liaison de couche 1.
Le PIE de battement de lien analyse les événements de battement de lien publiés par les pilotes d'espace utilisateur (USD) et détermine la cause première d'un battement de lien. Le PIE publie les informations d'analyse de la cause première au courtier. Les événements de battement de lien sont publiés par les USD (client PIE) lorsqu'un lien est battement. Les USD collectent toutes les données pertinentes de l'ASIC et de l'USD nécessaires à l'analyse de la cause première et publient les données au courtier. Le PIE du volet de liaison analyse les données et parvient à la cause racine la plus probable du volet.
Le PIE de liaison inactive trouve la cause première d'un lien qui ne s'établit pas. L’USD collecte des données sur une interface lorsque celle-ci est configurée pour être active, mais que l’état de fonctionnement de l’interface n’est pas actif. Ces données sont publiées dans l'application PIE. Le PIE de liaison désactivée s'abonne à ces événements, reçoit les données du courtier et les analyse pour trouver la cause première.
Le PIE optique est un moteur de surveillance continue qui effectue une analyse chronologique des données DOM collectées à intervalles réguliers. En suivant divers paramètres dans le DOM sur une période, le PIE arrive à une métrique pour décrire l'état de l'optique pour chaque port optique. La métrique est une indication de l'état tendanciel d'un émetteur-récepteur optique.
Pour plus d'informations, référez-vous à ce document PIE :
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:27:35 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:27:58 N9K-C93180YC-FX %ETHPORT-5-SPEED: Interface Ethernet1/5, operational speed changed to 10 Gbps
<snip>
2024 Jan 21 05:28:02 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_UP: port-channel100: Ethernet1/5 is up
N9K-C93180YC-FX# show pie interface ethernet 1/5 link-flap-rca
2024-01-21 05:27:35 Event Id: 00000068 Ethernet1/5 Source Id: 436209664 RCA Code: 41 >>>PIE event time
Reason: Link flapped/down due to Local Fault, check peer >>>PIE link flap reason
N9K-C93180YC-FX# show pie interface ethernet 1/5 transceiver-insights
2024-01-21 05:30:12 Event Id: 00000080 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
2024-01-21 05:28:12 Event Id: 00000072 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-FOP_CHANGED: port-channel100: first operational port changed from Ethernet1/5 to none
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETH_PORT_CHANNEL-5-PORT_DOWN: port-channel100: Ethernet1/5 is down
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_BANDWIDTH_CHANGE: Interface port-channel100,bandwidth changed to 100000 Kbit
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_LINK_FAILURE: Interface Ethernet1/5 is down (Link failure)
2024 Jan 21 05:48:38 N9K-C93180YC-FX %ETHPORT-5-IF_DOWN_PORT_CHANNEL_MEMBERS_DOWN: Interface port-channel100 is down (No operational members)
N9K-C93180YC-FX# show pie interface ethernet 1/5 link-down-rca
2024-01-21 05:48:48 Event Id: 00000197 Ethernet1/5 Source Id: 436209664 RCA Code: 16 >>>PIE event time
Reason: No PCS alignment detected. Please check Fec, speed, Autoneg configurations with peer >>>Physical layer failed
N9K-C93180YC-FX# show pie interface ethernet 1/5 transceiver-insights
2024-01-21 05:50:12 Event Id: 00000199 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: ********BAD******** Mod: 01
2024-01-21 05:48:12 Event Id: 00000187 Event Class: xcvr DOM DB Event Interface: Ethernet1/5 Health Metric: --------GOOD------- Mod: 01
Sur la base des résultats du PIE, il est recommandé de remplacer le composant potentiellement défectueux et de poursuivre la surveillance. Si le rabat de liaison persiste, un test de permutation est nécessaire pour réduire la partie défectueuse. Un test d'échange peut être effectué en changeant un composant à la fois tout en gardant le reste inchangé. En fin de compte, la liaison se stabilise après le remplacement du composant défectueux spécifique.
Pour les versions du logiciel NX-OS antérieures à 10.2(1), la prise en charge PIE n'est pas disponible. Plusieurs étapes manuelles sont nécessaires pour vérifier le rabat de liaison de couche 1.
Cette liste répertorie tous les événements de liaison sur le module attaché. Le délai de renvoi fait référence à la durée pendant laquelle une interface attend avant d’avertir le superviseur de la panne d’une liaison. Pendant cette période, l'interface attend de voir si la liaison est rétablie. Cette commande permet de déterminer si la liaison a été interrompue ou si elle est en train de subir un léger défaut.
N9K-C93180YC-FX# attach module 1
module-1# show system internal port-client link-event
*************** Port Client Link Events Log ***************
---- ------ ----- ----- ------
Time PortNo Speed Event Stsinfo
---- ------ ----- ----- ------
Jan 21 05:48:38 2024 00122142 Ethernet1/5 ---- DOWN Link down debounce timer stopped and link is down
Jan 21 05:48:37 2024 00993003 Ethernet1/5 ---- DOWN Link down debounce timer started(0x40e50006)
Jan 21 05:45:14 2024 00432606 Ethernet1/5 10G UP SUCCESS(0x0)
Ces événements fournissent des informations détaillées sur chaque événement de liaison.
N9K-C93180YC-FX# attach module 1
module-1# show hardware internal tah link-events fp-port 5
324) Jan 21 05:48:37 2024 uSec 992843: Fp 5 : tahusd_isr.c #8469
Port Down with an ASIC interrupt
------------- ASIC MAC/PCS/Serdes REGS (Mac Channel 0) -------------
Link flapped due to Local Fault, check peer >>>Local Fault means the local device detected the issue on the receive path.
>>>Remote Fault means a Local Fault is detected across the link.
Intr Regs 00:0x0000, 01:0x0000, 02:0x0000, 03:0x0010, 07:0x0000, 11:0x0000, 15:0x0000
sts2.bercount : 0x0f00 sts2.erroredblocks : 0x0000
bercounthi : 0x0000 erroredblockhi : 0x0000
counters0.syncloss : 0x0001 counters0.blocklockloss: 0x0001
counters1.highber : 0x0000 counters1.vlderr : 0x0000
counters2.unkerr : 0x0012 counters2.invlderr : 0x0000
« Error Code |
Explication |
|
sts2.erroredblocks |
Compte les blocs en erreur (bits d'ordre supérieur). |
|
sts2.bercount |
Compte les en-têtes de synchronisation erronés (bits d'ordre inférieur). |
|
bercounthi |
Compte les en-têtes de synchronisation erronés (bits d'ordre supérieur). |
|
blochi erreur |
Compte les blocs en erreur (bits d'ordre supérieur). |
|
counters0.synclose |
Perte de synchronisation |
|
counters0.blocklockloss |
Blocage de la perte de verrouillage |
|
counters1.highber |
BER élevé |
|
counters1.vlderr |
Erreur valide |
|
counters2.unkerr |
Erreur inconnue |
|
counters2.invlder |
Erreur non valide |
Cette sortie contient plusieurs éléments d'informations SFP (Small Form-factor Pluggable). Si une valeur se situe en dehors de la plage acceptable dans le diagnostic SFP, le SFP est considéré comme un composant potentiellement endommagé et doit être remplacé. Dans cet exemple, tout est en bon ordre.
N9K-C93180YC-FX# show interface e1/5 transceiver details
Ethernet1/5
transceiver is present
type is 10Gbase-SR >>>SFP type
name is CISCO-OPLINK >>>SFP vendor
part number is TPP4XGDS0CCISE2G
revision is 02
serial number is OPMXXXXXXXX >>>SFP SN
nominal bitrate is 10300 MBit/sec >>>SFP bitrate
Link length supported for 50/125um OM2 fiber is 82 m
Link length supported for 62.5/125um fiber is 26 m
Link length supported for 50/125um OM3 fiber is 300 m
cisco id is 3
cisco extended id number is 4
cisco part number is 10-2415-03
cisco product id is SFP-10G-SR >>>SFP PID
cisco version id is V03
SFP Detail Diagnostics Information (internal calibration)
----------------------------------------------------------------------------
Current Alarms Warnings
Measurement High Low High Low
----------------------------------------------------------------------------
Temperature 36.52 C 75.00 C -5.00 C 70.00 C 0.00 C
Voltage 3.28 V 3.63 V 2.97 V 3.46 V 3.13 V
Current 6.61 mA 12.00 mA 0.50 mA 11.50 mA 1.00 mA
Tx Power -2.70 dBm 1.99 dBm -11.30 dBm -1.00 dBm -7.30 dBm
Rx Power -2.40 dBm 1.99 dBm -13.97 dBm -1.00 dBm -9.91 dBm
Transmit Fault Count = 0
----------------------------------------------------------------------------
Note: ++ high-alarm; + high-warning; -- low-alarm; - low-warning
peer side information is snipped.
Si tout semble correct avec les vérifications précédentes, un test d'échange est nécessaire pour affiner la pièce défectueuse. Un test d'échange peut être effectué en changeant un composant à la fois tout en gardant le reste inchangé. Finalement, la liaison se stabilise après le remplacement du composant défectueux spécifique.
Guide de configuration des interfaces Nexus 9000
Guide du moteur Platform Insights de la gamme NX-OS Nexus 9000
Révision | Date de publication | Commentaires |
---|---|---|
1.0 |
31-Jan-2024 |
Première publication |