Dit document bevat informatie om een VIP-crash (veelzijdige interfaceprocessor) te probleemoplossing.
Cisco raadt u aan kennis te hebben van de meldingen uit het veld 7500 Series.
De informatie in dit document is gebaseerd op de volgende software- en hardware-versies:
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-080
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u de potentiële impact van elke opdracht begrijpen.
Om een VIP-crash te interpreteren, is het belangrijk om eerst de basisarchitectuur van de VIP te begrijpen. Het getal in dit deel geeft het functionele blokschema van VIP2 weer, dat deze onderdelen bevat:
Orion Reduction set computing (RISC) CPU en gekoppelde circuits, die Dynamic RAM (DRAM), L2 cache, RENO-toepassingsspecifieke geïntegreerde schakeling (ASIC) en Boot ROM bevatten.
CyBus ASIC—Het onderdeel dat pakketten controleert en overdraagt tussen de VIP2 Static RAM (SRAM) en het systeempakketgeheugen (MEMD) over de CyBus of CxBus.
Packet-geheugen ASIC—is verantwoordelijk voor het verplaatsen van pakketten tussen poortadapters en SRAM.
Perifere Component Interconnect (PCI) bussen — Data paden tussen de poortadapters en VIP2 SRAM.
Bridges-verantwoordelijk voor het isoleren van de individuele PCI bussen van de poortadapters.
De VIP2-microcode (firmware) is een afbeelding die kaart-specifieke software-instructies bevat. Een programmeerbaar alleen-lezen geheugen (PROM) apparaat op VIP2 bevat een standaard microcode boogbeeld dat het systeem helpt bij het vinden en laden van de microcodeafbeelding uit de Cisco IOS® softwarebundel of uit het Flash geheugen. De afbeelding met de microcode-opstart in de PROM initialiseert VIP2 en assisteert vervolgens het downloaden van de VIP2-microcodeafbeelding. Alle interfaces van hetzelfde type laden hetzelfde microcodebeeld, ofwel van de Cisco IOS-softwarebundel of van het Flash-geheugen. Hoewel het Flash geheugen meerdere microcodeversies kan opslaan voor een specifiek interfacetype, kan slechts één beeld bij opstarten laden.
De opdracht show controllers geeft de momenteel geladen en draaiende microcodeversie voor elke interfaceprocessor en VIP2 weer. De show startup-fig opdracht toont de huidige systeeminstructies voor het laden van microcode bij opstarten.
Wanneer u een probleemoplossing hebt ingesteld, kunt u het cijfer in deze sectie gebruiken als richtlijn om informatie te lezen uit een VIP-crashinformatie of het syscolus. Als voorbeeld, kijk naar deze syslog uitvoer die slechte pariteit toont wordt gevonden wanneer gelezen van VIP SRAM:
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Zoals u aan de aanbevelingen in het volgende gedeelte ziet, moet de VIP in deze uitvoer worden gevolgd en moet SRAM of VIP worden vervangen als er opnieuw een gelijkaardige crashes optreden.
U kunt de inhoud van adres 0x21 in EEPROM in de opdrachtoutput van de show controleren om het model van een VIP te controleren. De waarden die overeenkomen met elk VIP-type worden in deze tabel weergegeven:
Waarde | VIP | Type controller |
---|---|---|
0x14 | VIP1 | VIP-controller |
0x15 | VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) | VIP2-controller |
0x1E | VIP2-50 | VIP2 R5K-controller |
0x20 | FEIP2 | FEIP2-controller |
0x21 | GEIP | GEIP-controller |
0x40 | GEIP +* | GEIP+ controller |
0x22 | VIP4-80 | VIP4-80 RM700-controller |
0x31 | VIP4-50 | VIP4-50 RM5271 controller |
0x4E | VIP6-080 | VIP6-080 RM700B controller |
Opmerking: De GEIP+ is gebaseerd op de VIP4-80. Alle verdere informatie in dit document over de VIP4-80 is ook van toepassing op de GEIP+.
Hierna volgt een voorbeeld:
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
Vanuit deze uitvoer kunt u zien dat deze VIP een VIP2-50 is.
Het verschil tussen een VIP2-10, VIP2-15, VIP2-20 en een VIP2-40 is de hoeveelheid DRAM en SRAM op elk gebied. De verschillende VIP2s (als ze niet zijn bijgewerkt) kunnen worden onderscheiden in de opdrachtoutput van de show diag door de geheugenconfiguraties die in deze tabel worden weergegeven:
Geheugen | VIP |
---|---|
8 MB DRAM/512 KB SRAM | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
16 MB DRAM/1 MB SRAM | VIP2-20 |
32 MB DRAM/2 MB SRAM | VIP2-40 |
De informatie in het crashinformatie-bestand kan van onschatbare waarde blijken bij het oplossen van softwareproblemen of bij het diagnosticeren van de onderliggende oorzaak van systeemcrashes. Niet alleen bevat het crashinformatie-bestand loginformatie en een stackspoor voor de VIP, het bevat ook uitgebreide geheugen- en contextinformatie. Telkens wanneer een VIP crasht, probeert de VIP een crashinformatie-bestand te schrijven naar de Start van het RSP. Crashinfo-bestanden zijn in deze indeling opgeslagen:
crashinfo_vip_<slot#>_<data>_<time>
U kunt de opdracht dir uitgeven om VIP crashinfo files zoals hieronder weergegeven te vinden:
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
Deze flitser van de router bevat twee VIP crashinformatie bestanden. Geef het showbestand of meer opdrachten uit om de inhoud van deze bestanden in overeenstemming met deze procedure te bekijken en op te nemen:
Start loggen met het eindprogramma.
Geef de term length 0 opdracht uit.
Geef de extra flitser op:<crashinfo bestandsnaam> opdracht.
De uitvoer naar een bestand opslaan.
Raadpleeg Informatie uit het bestand crashinformatie ophalen voor meer informatie over hoe u kunt werken met crashinformatie bestanden.
Als u de uitvoer hebt van een opdracht tonen technische ondersteuning (vanuit Enable Mode) van uw Cisco-apparaat, kunt u om mogelijke problemen en oplossingen weer te geven. U moet een geregistreerde klant zijn, inloggen, en JavaScript is ingeschakeld om deze te gebruiken .
VIP-crashes worden op basis van de oorzaak van de crash in verschillende categorieën ingedeeld. Als er een fout is gevonden die niet kan worden hersteld, dan crasht de VIP. Deze fouten kunnen het gevolg zijn van pariteitsfouten, software of hardware die een negatief ontvangstbericht (NACK) op CyBus of softwareproblemen veroorzaken. Deze sectie verschaft informatie over elk van deze fouttypen.
Als u de uitvoer hebt van een opdracht tonen technische ondersteuning (vanuit Enable Mode) van uw Cisco-apparaat, kunt u mogelijke problemen en oplossingen weer te geven . U moet een geregistreerde klant zijn, inloggen, en JavaScript is ingeschakeld om deze te gebruiken .
Pariteitsfouten doen zich voor op een VIP wanneer de hardware de geldigheid van gegevens probeert te controleren door berekende pariteitswaarden te vergelijken met eerdere pariteitswaarden voor dezelfde gegevens. Een enkele bit flip in de gegevens kan een pariteitsfout opleveren. Wanneer u pariteitsfouten op een VIP diagnosticeert, is het belangrijk om elke locatie te begrijpen waar pariteit wordt gecontroleerd en waar pariteitsfouten mogelijk kunnen optreden. In dit schema wordt deze informatie beschreven. Raadpleeg ook Cisco 7500 VIP-foutenanalyse voor meer informatie over pariteitsfouten.
Zoals in dit diagram wordt getoond, zijn er zeven verschillende types van pariteitsfouten die op een VIP kunnen voorkomen. Merk op dat fouten van een andere bron kunnen worden ontvangen en mogelijk niet binnen de VIP zelf zijn ontstaan. De bron van de pariteitsfout kan zijn bij de Route/Switch Processor (RSP), een andere VIP of bij slecht ingestelde of defecte poortadapters. Om een VIP-crash te begrijpen, is het belangrijk om de bron van het ongeluk te diagnosticeren.
Het is ook belangrijk om te begrijpen dat gegevens met slechte pariteit door verscheidene van de parity controle apparaten op de VIP en Cisco 7500 Series router voor om het even welke lees- of schrijfverrichting kunnen worden gemeld. Als bijvoorbeeld VIP een pakje op een verzendwachtrij in een RSP leest in het RSP en er een pariteitsfout in het RAM van de RSP is, dan ziet u foutmeldingen van de MD ASIC op de RSP, CYA ASIC op de VIP en ook de PCI/pakketgeheugen ASIC op de VIP.
In dit schema is een analyse van de breuklijnen voor VIP-crashes te zien:
Gebruik VIP4-50, VIP4-80 en VIP6-80 voor het corrigeren van een enkele bit-fout en het corrigeren van een dubbele bit-bits foutcode (ECC) voor CPU-geheugen en pakketgeheugen. Beide zijn Synchronous Dynamic RAM (SDRAM). Er wordt één foutje in SDRAM gecorrigeerd en het systeem blijft normaal functioneren.
Meerbits pariteitsfouten bij getallen 2 of 3 in deze tabel zijn een fatale gebeurtenis die ECC multibit fouten veroorzaakt. Het interne geheugen van de CPU en de bussen in het systeem gebruiken de detectie van een enkele bit parity. Zoals hier wordt getoond, verschilt de architectuur van VIP4 en VIP6 van VIP2. Daarom worden sommige foutmeldingen niet gezien en worden andere foutmeldingen anders gerapporteerd dan in VIP2. In dit parity error sectie worden verschillen tussen VIP2, VIP4 en VIP6 aangegeven en uitgelegd.
Uitzonderingen in de pariteit van het cachegeheugen gebeuren wanneer slechte pariteit in de CPU of in het primaire gegevenscache wordt ontdekt. De pariteitsfout kan zijn opgetreden in de VIP DRAM, de DRAM-controller, de primaire cache of in de CPU zelf. Pariteitsfouten die op deze locatie worden ontdekt, worden ook aangeduid als processorgeheugenpariteitsfouten (PMPE’s). Deze fouten resulteren in een onmiddellijke krach van de VIP en de uitvoer lijkt op zowel VIP’s als RSP’s. Een waarde van twintig (sig=20) geeft aan dat er een uitzondering voor een cacheparity is opgetreden. De waarde van de tekening wordt weergegeven in de meldingen van het systeemlogboek voor het ongeluk.
Recente code biedt ook een betekenisvolle breedband zoals hier wordt getoond:
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
Informatie in het VIP crashinfo-bestand wijst ook op dezelfde parity error locatie in het primaire gegevenscache:
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Een primaire cache of PMPE kan een voorbijgaande fout zijn. Als dit het eerste geval van een PMPE is, kan je het meestal veilig negeren. Als echter dezelfde VIP een tweede of volgende PMPE’s ervaart, moet u de VIP vervangen. Soms kan de vervanging van de DRAM zelf ook het probleem oplossen.
Opmerking—VIP4 en VIP6—Parity fouten die voorkomen in het CPU interne cache en in het CyAsic worden gedetecteerd als cache parity foutmeldingen. Er worden enkele bit parity fouten in het CPU-geheugen gecorrigeerd en er hoeft geen actie te worden ondernomen. Meerbits pariteitsfouten in het CPU-geheugen worden gedetecteerd als een multi-bits pariteitsfout in procmem. Het CPU-geheugen in de VIP moet worden vervangen wanneer er een fout in de pariteit van een procedé wordt gerapporteerd.
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
Wanneer een VIP in het RSP van de MEMD downloads is en deze fouten worden gezien, duidt dit er gewoonlijk op dat een andere VIP een slechte pariteit aan de MEMD heeft, of dat de MEMD is beschadigd. Als de bron afkomstig is van de MEMD en hij verdergaat, moet u de RSP vervangen. Omgekeerd, als de bron van de slechte pariteit een andere VIP is, zou u moeten reseten en, indien nodig, de VIP vervangen die de slechte pariteit schrijft.
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
Opmerking: VIP4 en VIP6 geven dezelfde foutmeldingen weer over de pariteitsfout van CyBus, maar de pakketbus schrijft parity error bericht wordt niet weergegeven.
Zowel pariteitsfouten van de DRAM-controller als I/O-controller worden door de RENO ASIC gedetecteerd. Een pariteitsfout die afkomstig is van de DRAM-controller of de DRAM-controller wordt gerapporteerd als een uitzondering op cacheparity. Een pariteitsfout die is gedetecteerd door de I/O-controller wordt gerapporteerd, zoals in deze uitvoer wordt weergegeven. Vaak zijn door de I/O-controller gemelde pariteitsfouten elders ontstaan en worden ze, naast berichten van andere locaties, door de I/O-controller gerapporteerd.
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
Opmerking: De VIP4 en VIP6 geven deze foutmelding niet weer.
PMA ASIC rapporteert een pakketgeheugengelezen pariteitsfout wanneer een pariteitsfout uit het pakketgeheugen (SRAM) op de VIP wordt gelezen. Deze fout wordt in het systeemlogboek gemeld zoals hieronder wordt weergegeven:
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
U kunt ook aanwijzingen zien van een fout in de parity-leesmodus in het VIP-crashinformatie-bestand:
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
SRAM parity fouten kunnen ook van voorbijgaande aard zijn, dus behandelen het eerste voorkomen op dezelfde manier als DRAM parity fouten. Als de fouten aanhouden, vervangt u de RAM of de VIP.
VIP4 en VIP6 Opmerking-Single bit parity fouten in het pakketgeheugen worden gecorrigeerd. Multi-bit parity fouten in het pakketgeheugen worden gedetecteerd als een pakmem ecc multi-bit parity fout. Het VIP-pakketgeheugen moet worden vervangen wanneer er een fout in een pakketparity wordt gemeld die door een computer wordt gemaakt.
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
PMA ASIC rapporteert een pakketbus het schrijven van parity fout wanneer een parity fout wordt geschreven in het pakketgeheugen. In dit voorbeeld is de VIP alleen de boodschapper en het probleem bestaat niet met het geheugen van deze VIP.
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
Opmerking: De VIP4 en VIP6 geven deze foutmelding niet weer.
Pariteitsfouten kunnen worden gedetecteerd in PCI-bussen 1 en 2, die beide rechtstreeks interface met de poortadapters. Deze bussen worden samengesmolten met een derde PCI-bus, bus 0, waarop ook gelijkheidsfouten kunnen worden gedetecteerd. Pariteitsfouten die voortkomen uit een van de PCI-bussen worden meestal veroorzaakt door slecht zittende of defecte poortadapters. Elke keer dat u deze berichten in de syslog-uitvoer van een VIP-crash ziet, moet u de poortadapter opnieuw instellen om het probleem op te lossen.
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
Als het opnieuw opslaan van de poortadapter het probleem niet oplost, ligt het probleem bij de poortadapter of de VIP. Verplaats de poortadapter naar een andere baai en plaats een tweede poortadapter in de oorspronkelijke baai om problemen op te lossen. Dit wijst meestal op de betreffende hardware. Hier wordt een voorbeeld getoond:
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Opmerking: dezelfde fouten treden op bij VIP4 en VIP6, maar de foutmelding is anders. Het wordt gedetecteerd als een PCI master parity fout en een PCI slave parity fout. Voer de volgende stappen uit als beschreven voor VIP PCI-bus: pariteitsfouten om dit probleem op te lossen.
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
Pariteitsfouten kunnen ook door de VIP worden gedetecteerd in de gegevens of het adres van een lees- of schrijfbewerking op de CyBus. Als dit voorkomt, ziet u de syslogoutput gelijkend op dit:
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
Gebruik deze informatie in combinatie met de informatie in het systeem logt om de ware bron van de fout te bepalen.
Opmerking: VIP4 en VIP6 geven dezelfde foutmeldingen weer als bij CyBus parity fouten.
Wanneer de VIP probeert te schrijven naar een ongeldig adres in de MEMD, plaatst RSP een NACK op de CyBus voor die sleuf. Dit is meestal een softwareprobleem, maar kan ook een hardwareprobleem zijn. In deze uitvoer schrijft VIP bijvoorbeeld 4 bytes naar een ongeldig adres, zodat RSP een NACK op CyBus plaatst voor die sleuf.
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
Zoals in deze uitvoer wordt getoond, plaatst het RSP echter ook een NACK op een VIP omdat het een slechte pariteit aan de MEMD probeerde te schrijven.
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
Wanneer een NACK op alle slots verschijnt, zoals in deze uitvoer wordt getoond, is het een hardwarefout. De scheidsrechter is defect en de kaartkooi moet worden vervangen.
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
VIP-crashes, die niet zijn veroorzaakt door een van de redenen in dit document, worden het meest veroorzaakt door andere softwareproblemen. Deze crashes kunnen op verschillende manieren zichtbaar worden. Dit zijn algemene suggesties om het risico op VIP-crashes als gevolg van softwareproblemen te verminderen en om deze aan te pakken als ze zich voordoen:
Zorg er altijd voor dat het Cisco IOS-softwarebeeld de VIP ondersteunt.
Bewaar altijd de RSP-BOOT-afbeelding en het belangrijkste Cisco IOS-softwarebeeld in dezelfde versie.
Zorg ervoor dat de VIP-configuratie en de poortadapter worden ondersteund door de huidige versie van Cisco IOS-software.
Controleer de release opmerkingen voor het juiste Cisco IOS-softwarerelease en de geheugenvereisten.
Dit is een voorbeeld van een systeemloguitvoer van een VIP-crash als gevolg van een softwareprobleem:
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
Mogelijk het belangrijkste informatie die u kunt verkrijgen in het geval van een softwareprobleem, is het crashinformatie-bestand voor de VIP. Zie het gedeelte FineReader-bestand maken van een VIP-crashinformatie voor instructies om deze informatie op te nemen.
VIP crasht vaak en wanneer u het crashinformatie-bestand bekijkt, ziet u dit bericht:
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
De foutmelding CPU-signaal 10 betekent een foutmelding voor de bus. Busfouten kunnen software- of hardwareproblemen zijn. De tijdelijke oplossing voor dit probleem is om de module te herhalen en de router te controleren. Als de module blijft crashen nadat u de module hebt hervat, neemt u contact op met het TAC-Case Open Tool (alleen geregistreerde klanten) met het bestand van crashinformatie.
Het is een goed idee om met deze informatie een VIP-archiefbestand te maken voordat u een case opent. Voeg deze informatie toe in het veld Description van het TAC Case Open Tool (alleen geregistreerde klanten).
Probleembeschrijving
Uitvoer van de opdracht show versie
Uitvoer van de opdracht Slaat-AG [x]
Uitleg bestand crashinformatie
Syslog-fragment
Verzamel vervolgens de informatie die u wilt verzamelen als U een TAC-case opent.
Dit is een voorbeeld van een crashsamenvatting bestand:
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Als u nog steeds hulp nodig hebt nadat u de stappen voor het oplossen van problemen in dit document hebt uitgevoerd en u een case wilt openen met Cisco Technical Support, zorg er dan voor dat u deze informatie bevat: |
---|
Opmerking: Als het mogelijk is, moet u de router niet handmatig opnieuw laden of starten met een stroomprogramma voordat u deze informatie verzamelt, aangezien dit belangrijke informatie kan veroorzaken om verloren te gaan die nodig is om de oorzaak van het probleem te bepalen. |
Revisie | Publicatiedatum | Opmerkingen |
---|---|---|
1.0 |
02-Oct-2006 |
Eerste vrijgave |