De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.
Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.
Dit document biedt een korte uitleg en oplossingen voor gebruikelijke hardware- en architectuurproblemen voor Cisco Nexus 7000 Series-switches die Cisco NX-OS-systeemsoftware gebruiken.
Opmerking: De exacte indeling van de syslogan en de foutmeldingen die in dit document worden beschreven, kunnen enigszins verschillen. De variatie is afhankelijk van de softwarerelease die op de Supervisor Engine draait.
De ruggengraattest heeft geen resultaat voor de Nexus 7000 supervisor:
Nexus7000# show module internal exceptionlog module 5
...
System Errorcode : 0x418b0022 Spine control test failed
Error Type : Warning
PhyPortLayer : 0x0
Port(s) Affected : none
Error Description : Module 10 Spine Control Bus test Failed
...
11) SpineControlBus E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 1597800
Last test execution time ----> Mon May 27 21:57:17 2013
First test failure time -----> Sun Nov 20 00:30:55 2011
Last test failure time ------> Mon May 27 21:57:17 2013
Last test pass time ---------> Mon May 27 21:56:47 2013
Total failure count ---------> 33
Consecutive failure count ---> 1
Last failure reason ---------> Spine control test failed
Dit probleem heeft te maken met Cisco bug-ID CSCuc72466. Raadpleeg Nexus 7000 FAQ: Wat is de aanbevolen actie die moet worden ondernomen wanneer de SpineControlBus-test mislukt?.
NVRAM fouten verschijnen in diagnostische gebeurtenissen:
Nexus7000#show diagnostic events
1) Event:E_DEBUG, length:97, at 9664 usecs after Wed Dec 5 01:03:42 2012
[103] Event_ERROR: TestName->NVRAM TestingType->health monitoring module->5
Result->fail Reason->
#show diagnostic result module 5 test NVRAM detail
4) NVRAM-------------------------> E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 52596
Last test execution time ----> Wed Dec 5 01:03:41 2012
First test failure time -----> Tue Dec 4 23:28:45 2012
Last test failure time ------> Wed Dec 5 01:03:42 2012
Last test pass time ---------> Tue Dec 4 23:23:41 2012
Total failure count ---------> 20
Consecutive failure count ---> 20
Last failure reason ---------> Bad blocks found on nvram
Dit is een hardwareprobleem, een storing van Supervisor Engine, of een probleem van voorbijgaande aard.
Voer de opdracht voor het diagnostische resultaat voor show Module 5 test NVRAM detail in om de resultaten van de test opdracht te zien.
Een of al deze zijn gezien op Supervisor 2/Supervisor 2E:
DEVICE_TEST-2-COMPACT_FLASH_FAIL: Module 5 has failed test CompactFlash
20 times on device Compact Flash due to error The compact flash power test failed.
Test results: (. = Pass, F = Fail, I = Incomplete,
U = Untested, A = Abort, E = Error disabled)
7) CompactFlash E
Error code ------------------> DIAG TEST ERR DISABLE
Total run count -------------> 23302
Last test execution time ----> Sun Apr 13 10:07:30 2014
First test failure time -----> Sun Apr 13 00:37:41 2014
Last test failure time ------> Sun Apr 13 10:07:40 2014
Last test pass time ---------> Sun Apr 13 00:07:41 2014
Total failure count ---------> 20
Consecutive failure count ---> 20
Last failure reason ---------> The compact flash power test
failed
Next Execution time ---------> Sun Apr 13 10:37:30 2014
Root-oorzaak
De tweede generatie Nexus 7000 Supervisors worden meegeleverd met twee identieke e-USB-knipperingen voor redundantie. De flitsen bieden een opslagplaats voor flitser, configuraties en andere relevante informatie. Deze twee flitsen worden hergeconfigureerd als een Redundant Array of Independent Disks (RAID) 1-array die interne mirroring implementeert. Met de redundantie kan een supervisor met het verlies van één van de flitsen maar niet allebei functioneren.
Er zijn een paar voorbeelden in het veld waar één of beide knipperingen door de inval-software gedurende een periode van enkele maanden of jaren in gebruik als slecht worden gemarkeerd. Een reset/herstart van het toetsenbord herontdekt deze mislukte flitsen zijn gezond bij de volgende opstarten.
Voltooi deze stappen om te controleren of dit een hardwarekwestie is of niet:
De linecard meldt een diagnostische storing door een Port Loopback-test-storing 10 keer na elkaar:
DIAG_PORT_LB-2-PORTLOOPBACK_TEST_FAIL Module:16 Test:PortLoopback
failed 10 consecutive times. Faulty module:Module 16 affected ports:5,7
Error:Loopback test failed. Packets lost on the LC at the Queueing engine ASIC
MODULE-4-MOD_WARNING Module 16 (serial: XXXX) reported warning on
ports 16/5-16/5 (Ethernet) due to Loopback test failed.
Packets lost on the LC at the Queueing engine ASIC in device 78
(device error 0x41830059)
Root-oorzaak
Dit is een waarschuwingsbericht en geeft in de meeste gevallen een hardwareprobleem aan met de poort.
Eerst controleren op Cisco bug-ID CSCtn8109 en Cisco bug-ID CSCti95293, omdat dit een softwareprobleem kan zijn.
Herstelt eerst de module om de kaart te herinitialiseren en start opnieuw het opstarten van hardware-gezondheidstests. Als de diagnostische tests nog steeds een storing voor dezelfde kaart laten zien, vervangt u de kaart.
Pas de kaart op een handig moment opnieuw op en verzamel de uitgangen van deze opdrachten:
U kunt ook alleen deze specifieke test opnieuw uitvoeren en de kaart niet opnieuw laden. Dit voorbeeld toont module 16:
show diagnostic result module 16
diagnostic clear result module all
(config)# no diagnostic monitor module 16 test 5
(config)# diagnostic monitor module 16 test 5
diagnostic start module 16 test 5
show diagnostic result module 16 test 5
Deze fouten verschijnen en er is een mogelijke herlading van de module:
2013 Mar 27 00:40:23 DC3-7000-PRODD2-A23 MODULE-4-MOD_WARNING
Module 9 (serial: XXX) reported warning on ports 9/1-9/3 (Unknown)
due to BE2 Arbiter experienced an error in device 65 (device error 0xc410f613)
Root-oorzaak
Dit is een hardwarestoring veroorzaakt door pariteitsfouten of hardwareproblemen op de dochterkaart.
Aanvullende bekende softwaredefect
Cisco bug-id CSCtb9876
Deze fouten verschijnen in de module:
%MODULE-4-MOD_WARNING: Module # (Serial number: XXXX) reported warning
Ethernet#/# due to chico serdes sync loss in device DEV_SKYTRAIN
(device error 0xc9003600)
Root-oorzaak
Deze fouten duiden erop dat er een sync-verlieskwestie is tussen module # en de Xbar/ASIC. In de meeste gevallen is de oorzaak een hardwarestoring van de module.
Als uw versie van Cisco NS-OX eerder is dan 6.1(4) en het bericht niet ononderbroken wordt weergegeven, kan dit worden beïnvloed door Cisco bug ID CSCud91672. De oorzaak van het defect is dat de NX-OS instellingen voor de reeks anders zijn dan diagnostische instellingen op de twee kanalen tussen SKT <—>SAC.
Verzamel de uitvoer van deze opdrachten:
upgrade van de switch naar NS-OX versie 6.1(4) of hoger om de oorzaak van het defect te isoleren.
Voer deze test uit om te bevestigen of de kaart defect is in plaats van de bar of de chassissleuf:
Module N7K-F248XP-25 faalt zowel in de tests PrimairBootROM als in de tests SecondaryBootROM:
show module internal exceptionlog module 1 | i Error|xception
********* Exception info for module 1 ********
exception information --- exception instance 1 ----
Error Description : Secondary BootROM test failed
exception information --- exception instance 2 ----
Error Description : Primary BootROM test failed
Root-oorzaak
Dit wordt meestal waargenomen door geprogrammeerde bestandsinfectie of door het falen van de linecard hardware.
Cisco bug-ID CSCuf82089 voegt code toe om beschrijvere informatie over dergelijke fouten voor een betere diagnostiek te tonen. Bijvoorbeeld, het toont een mislukt component in plaats van een momenteel nul waarde.
In sommige gevallen wordt het probleem veroorzaakt door geprogrammeerde corruptie in de module. Typ de installatiemodule X bios gedwongen opdracht om dit op te lossen. Merk op dat deze opdracht de service kan beïnvloeden. De aanbeveling bestaat erin deze slechts gedurende een onderhoudsperiode uit te voeren.
Voltooi deze stappen om het probleem op te lossen:
Nexus7000# install module 1 bios forced
Warning: Installing Bios forcefully...!
Warning: Please do not remove or power off the module at this time
Upgrading primary bios
Started bios programming .... please wait
[# 0% ]
BIOS install failed for module 1, Error=0x40710027(BIOS flash-type verify failed)
BIOS is OK ...
Please try the command again...
Deze fout is te zien op het platform:
%PLATFORM-4-MOD_TEMPFAIL: Module-2 temperature sensor 7 failed
Root-oorzaak
Dit is een periodiek probleem met het temperatuur/spanningsblok in de ASIC onder bepaalde omstandigheden als gevolg van interne ASIC-timing. Cisco bug-ID CSCtw79052 beschrijft de bekende oorzaak voor deze kwestie.
Dit is een tijdprobleem tussen de ASIC die de temperatuur intern aansluit en de software die het geldige bit bemonstert. Het probleem is dat het op een van de 12 Clipperinstanties kan klikken. Dit probleem wordt niet in het bijzonder veroorzaakt en het duurt steeds voort. Dit probleem heeft geen invloed op de service en het is een probleem omdat de logica van het lezen van de temperatuur een probleem heeft dat meer pogingen in het stuurprogramma vereist.
Verzamel de uitvoer van deze opdrachten en controleer deze tegen Cisco bug-ID CSCtw79052:
De C7010-FAB-1 staat in een stroomuitval en deze fouten verschijnen:
%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed,
Left Ejector is OPEN, Right Ejector is CLOSE
%PLATFORM-3-EJECTOR_STAT_CHANGED: Ejectors' status in slot 13 has changed,
Left Ejector is OPEN, Right Ejector is OPEN
%PLATFORM-2-XBAR_REMOVE: Xbar 3 removed (Serial number XXX)
Xbar Ports Module-Type Model Status
--- ----- ----------------------------------- ------------------ ----------
3 0 Fabric Module N/A powered-dn
?
Xbar Power-Status Reason
--- ------------ ---------------------------
3 powered-dn failure(powered-down) since maximum number of bringups were exceeded
U kunt ook ASIC-fouten in de balk weergeven:
%MODULE-4-MOD_WARNING: Module 15 (serial: XXX) reported warning due to
X-bar Interface ASIC Error in device 70 (device error 0xc4600248)
%OC_USD-SLOT15-2-RF_CRC: OC2 received packets with CRC error from MOD 15
through XBAR slot 3/inst 2
Root-oorzaak
Dit probleem is het gevolg van een defecte of een slecht gemonteerde xbar-module of een slechte chassissleuf.
Een of meer van deze verschijnselen van leverfalen worden waargenomen:
%PLATFORM-5-FAN_STATUS: Fan module 3 (Serial number XXX)
Fan3(fab_fan1) current-status is FAN_FAIL
Nexus 7000#show environment fan
Fan3(fab_fan1) N7K-C7010-FAN-F 1.1 Failure (Failed Fanlets: 2 6 7 8 9 10 14 15 )
Fan4(fab_fan2) N7K-C7010-FAN-F 1.1 Ok
...
#show hardware
----------------------------------
Chassis has 4 Fan slots
----------------------------------
Fan3(fab_fan1) failed
Model number is N7K-C7010-FAN-F
...
Root-oorzaak
In de meeste gevallen is dit een storing van de ventilator of de chassissleuf.
Zorgen voor capaciteitswijzigingen, soms zeer vaak.
%PLATFORM-2-PS_CAPACITY_CHANGE: Power supply PS2 changed its capacity.
possibly due to On/Off or power cable removal/
2013 Oct 17 17:06:40 ... last message repeated 14 times
Root-oorzaak
Dit probleem is het gevolg van een defect of een defect aan de stroomkabel of een storing in de stroomtoevoer.
Controleer de uitvoer van de opdracht voor env-voedingsdetails en onderzoek de voedingsstatus. In dit voorbeeld wordt de uitvoer van beide akkoorden aangesloten, maar de tweede toont slechts een capaciteit van 1200 W in plaats van 3000 W en het moet zijn voor de 220V AC op N7K-AC-6,0KW. De stroombron testte OK. Vervang de voedingseenheid.
PS_2 total capacity: 4200 W Voltage:50Vchord 1 capacity: 3000 W chord 1
connected to 110v AC chord 2 capacity: 1200 W chord 2 connected to 220v AC
Deze waarschuwing verschijnt op het platform:
%PLATFORM-5-PS_STATUS: PowerSupply 3 current-status is PS_FAIL
%PLATFORM-2-PS_FAIL: Power supply 3 failed or shut down (Serial number xxxxx)
Root-oorzaak
Deze waarschuwing is het gevolg van een defect of een defect aan de stroomkabel of een storing in de stroomtoevoer.
Referenties
Cisco Nexus 7000 Series Voedingsredundantie
Deze alarmen worden weergegeven voor de FEX-voeding:
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Module 1: Runtime diag detected major event:
Voltage failure on power supply: 1
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 System minor alarm on power
supply 1: failed
%SATCTRL-FEX104-2-SOHMS_DIAG_ERROR: FEX-104 Recovered: System minor alarm
on power supply 1: failed
Controleer op hardware- en stroomproblemen. Als u een softwareprobleem hebt, gaan de foutmeldingen door, zelfs nadat u hardware hebt vervangen.
Methoden om deze problemen op te lossen zijn:
Bekijk deze vragen om te helpen de omstandigheden van de fout te definiëren:
Verzamel uitvoer van deze opdrachten om de fouten te onderzoeken:
Onbekend softwaredefect
Cisco bug-id CSCtr7620
Emerson-voedingen N7K-AC-6,0KW worden gemeld als Fail/Zak, maar de schakelaar werkt prima en de niet-0 werkelijke output wordt gezien voor de probleemvoeding.
Root-oorzaak
Bij een voorziening met beide actieve ingangen, wanneer een ingang binnen 1,5 seconden wordt losgekoppeld, opnieuw wordt aangesloten en wordt losgekoppeld, kan de toevoer een onderspanningsfout vergrendelen en kan NX-OS de stroomtoevoer aangeven als dit mislukt is. Bij een andere variatie, op een toevoer met twee ingangen, verwijdert u één ingang en wacht 20 tot 30 seconden. De voeding kan met tussenpozen het alarm voor de interne fout instellen en NX-OS meldt dat de stroomtoevoer defect is.
Cisco bug-ID CSC78612 brengt wijzigingen in de firmware op de voedingseenheden om het probleem op te lossen.
Cisco bug-ID CSCuc86262 voegt een softwareverbetering toe om te herstellen van deze valse fouten. NX-OS controleert nu autonoom de status van de voedingseenheid (PSU) en wijzigt deze in de juiste status indien de gerapporteerde staat afwijkt van de werkelijke toestand.
Typ de opdracht Geef env-vermogensdetails op en controleer de eigenlijke uitvoer om de valse fout te controleren:
Nexus7000# show env power
Power Supply:
Voltage: 50 Volts
Power Actual Total
Supply Model Output Capacity Status
(Watts ) (Watts )
------- ------------------- ----------- ----------- --------------
1 N7K-AC-6.0KW 0 W 0 W Shutdown
2 N7K-AC-6.0KW 3888 W 6000 W Fail/Shut
De verkeerde Fail/Dip-status wordt gewist wanneer u de PSU uitzet of uitzet.
Cisco bug-ID CSC78612 brengt wijzigingen in de firmware op de PSU aan. De software is verbeterd door Cisco bug ID CSCuc86262 die herstelt van valse/afgesloten meldingen met de correctie van de valse bits als de stroomtoevoer in uitvoering normaal werkt. NX-OS-versies 5.2(9), 6.1(3), 6.2(2) en hebben later de versterking die een RMA vermijdt.
Een deel van de grote pakketten wordt gedropt wanneer er een hoog aantal IP-pakketten is met een lengte die langer is dan de geconfigureerde MTU op de noodopinterface van het pakket.
Root-oorzaak
Dit wordt verwacht. Wanneer het systeem een IP-pakket met een lengte langer dan de geconfigureerde MTU op de noodopdracht van het pakket ontvangt, stuurt het systeem dit pakket naar het besturingsplane, dat voor de fragmentatie zorgt. In NX-OS 4.1.3 en later wordt een snelheidsbeperking op dergelijke gepunte pakketten toegepast. Dit beperkt het standaard tot maximaal 500 pps.
Dit is een bekend softwaredefect in Cisco bug-id CSCsu01048.
De "USER-2-SYSTEM_MSG FIPS zelftest mislukking in DCOS_rand - netstack" foutmeldingen.
Root-oorzaak
Wanneer een willekeurig nummer wordt gegenereerd, wordt de conditiontional Random Number Generator (CRNG)-zelftest uitgevoerd. Als de test faalt, wordt een syslogbericht geregistreerd. Dit gebeurt overeenkomstig de aanbevelingen van de Federal Information Processing Standards (FIPS). De gevolgen hiervan zijn echter onschadelijk, aangezien het willekeurige aantal weer wordt gegenereerd.
In NX-OS zijn er twee typen willekeurige nummergeneratoren (RNG's):
Volgens FIPS moeten alle RNG’s de voorwaardelijke Random Number Generator Test (CRNGT) uitvoeren. De test vergelijkt het huidige gegenereerde willekeurig nummer met het vorige. Als de getallen hetzelfde zijn, wordt er een syslogbericht gegenereerd en wordt er een extra willekeurig nummer gegenereerd.
De test wordt uitgevoerd om ervoor te zorgen dat het willekeurige nummer uniek is. Er is geen functionele impact aangezien het aantal wordt geregenereerd.
Dit bericht is onschadelijk voor de werking van het systeem. Vanaf Cisco NX-OS versie 5.2x en hoger wordt de ernst van het bericht minder dan 2 zodat het niet langer gezien wordt bij de standaardlogconfiguratie. Dit loggen vindt plaats als deel van interne zelftesten van NX-OS voor verschillende functies in de schakelaar.
Dit is een bekend softwarefout in Cisco bug-ID CSCtn70083.