本文提供解決多功能介面處理器(VIP)崩潰問題的資訊。
思科建議您瞭解7500系列路由器現場通知。
本文中的資訊係根據以下軟體和硬體版本:
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路正在作用,請確保您已瞭解任何指令可能造成的影響。
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
要解釋VIP崩潰,首先瞭解VIP的基本架構非常重要。本節中的圖顯示了VIP2的功能框圖,其中包括以下元件:
Orion精簡指令集計算(RISC)CPU和相關電路,包括動態RAM(DRAM)、二級快取記憶體、RENO應用專用積體電路(ASIC)和引導ROM。
CyBus ASIC — 控制資料包並在VIP2靜態RAM(SRAM)和系統資料包記憶體(MEMD)之間通過CyBus或CxBus傳輸資料包的元件。
資料包記憶體ASIC — 負責在埠介面卡和SRAM之間移動資料包。
外圍元件互連(PCI)匯流排 — 埠介面卡和VIP2 SRAM之間的資料路徑。
網橋 — 負責隔離埠介面卡的單個PCI匯流排。
VIP2微碼(韌體)是一個提供卡特定軟體說明的映像。VIP2上的可程式設計只讀儲存器(PROM)裝置包含預設微碼引導映像,可幫助系統從Cisco IOS®軟體捆綁包或快閃記憶體查詢並載入微碼映像。PROM中的微碼引導映像初始化VIP2,然後協助下載VIP2微碼映像。所有相同型別的介面從Cisco IOS軟體捆綁包或快閃記憶體載入相同的微碼映像。雖然快閃記憶體可以儲存特定介面型別的多個微碼版本,但在啟動時只能載入一個映像。
show controllers cbus命令顯示每個介面處理器和VIP2的當前載入和運行微碼版本。 show startup-config命令顯示啟動時載入微碼的當前系統說明。
進行故障排除時,您可以使用此部分中的圖作為指南,從VIP crashinfo檔案或系統日誌中讀取資訊。例如,檢視以下系統日誌輸出,其中顯示從VIP SRAM讀取時發現錯誤的奇偶校驗:
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
從下一節的建議中您可以看到,此輸出中的VIP應該受到監控,如果再次發生類似的崩潰,則應該更換SRAM或VIP。
您可以在show diag命令輸出中檢查EEPROM中的地址0x21的內容,以便驗證VIP的型號。與每個VIP型別對應的值如下表所示:
價值 | VIP | 控制器型別 |
---|---|---|
0x14 | VIP1 | VIP控制器 |
0x15 | VIP2(VIP2-10、VIP2-15、VIP2-20、VIP2-40) | VIP2控制器 |
0x1E | VIP2-50 | VIP2 R5K控制器 |
0x20 | FEIP2 | FEIP2控制器 |
0x21 | GEIP | GEIP控制器 |
0x40 | GEIP +* | GEIP+控制器 |
0x22 | VIP4-80 | VIP4-80 RM7000控制器 |
0x31 | VIP4-50 | VIP4-50 RM5271控制器 |
0x4E | VIP6-80 | VIP6-80 RM7000B控制器 |
註:GEIP+基於VIP4-80。本文檔中有關VIP4-80的所有進一步資訊也適用於GEIP+。
以下是範例:
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
從該輸出中,您可以看到此VIP是VIP2-50。
VIP2-10、VIP2-15、VIP2-20和VIP2-40之間的區別是每個埠上的DRAM和SRAM大小。在show diag命令輸出中,可以通過下表所示的記憶體配置來區分各種VIP2(如果尚未升級):
記憶體 | VIP |
---|---|
8 MB DRAM/512 KB SRAM | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
16 MB DRAM/1 MB SRAM | VIP2-20 |
32 MB DRAM/2 MB SRAM | VIP2-40 |
當您嘗試解決軟體問題或嘗試診斷系統崩潰的根本原因時,crashinfo檔案中包含的資訊將被證明是非常寶貴的。crashinfo檔案不僅包含VIP的日誌記錄資訊和堆疊跟蹤,還包含大量記憶體和上下文資訊。每次VIP崩潰時,VIP都會嘗試將crashinfo檔案寫入RSP的bootflash。Crashinfo檔案以以下格式儲存:
crashinfo_vip_<slot#>_<data>_<time>
您可以發出dir命令以查詢VIP crashinfo檔案,如下所示:
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
路由器的此bootflash包含兩個VIP crashinfo檔案。發出show file或more命令,以便按照以下步驟檢視和捕獲這些檔案的內容:
開始使用終端程式登入。
發出term length 0命令。
發出more bootflash:<crashinfo filename>命令。
將輸出儲存到檔案。
有關如何使用crashinfo檔案的詳細資訊,請參閱從Crashinfo檔案檢索資訊。
如果您有思科裝置的show technical-support(從啟用模式)指令輸出,可以使用 以便顯示潛在的問題和修複方法。您必須是註冊客戶,必須登入並啟用JavaScript才能使用 .
VIP故障根據故障原因分為多個類別。只要發現不可恢復的錯誤,VIP就會崩潰。這些錯誤可能是奇偶校驗錯誤、導致CyBus上出現負確認消息(NACK)的軟體或硬體或軟體問題的結果。本節提供了有關上述每種錯誤型別的資訊。
如果您有思科裝置的show technical-support(從啟用模式)指令輸出,可以使用 顯示潛在問題和修複方法。您必須是註冊客戶,必須登入並啟用JavaScript才能使用 .
當硬體嘗試通過將計算出的奇偶校驗值與相同資料之前的奇偶校驗值進行比較來檢查資料有效性時,VIP上會發生奇偶校驗錯誤。資料中的單位元翻轉可能會導致奇偶校驗錯誤。當您診斷VIP上的奇偶校驗錯誤時,必須瞭解檢查了奇偶校驗的每個位置,以及可能發生的奇偶校驗錯誤。此圖概述了此資訊。此外,請參閱Cisco 7500 VIP故障樹分析,瞭解有關奇偶校驗錯誤的詳細資訊。
如圖所示,VIP上可能發生七種不同型別的奇偶校驗錯誤。請注意,錯誤可能來自另一個來源,也可能不是源自VIP本身。奇偶校驗錯誤的來源可能來自路由/交換機處理器(RSP)、另一個VIP,或者來自安裝不佳或發生故障的埠介面卡。為了正確理解VIP崩潰,必須診斷崩潰的來源。
此外,瞭解以下情況也很重要:對於任何單個讀取或寫入操作,VIP和Cisco 7500系列路由器上的多個奇偶校驗裝置都可以報告存在錯誤奇偶校驗的資料。例如,如果VIP將RSP上的傳輸隊列上的資料包讀入其自己的SRAM,並且RSP的SRAM中存在奇偶校驗錯誤,則您會看到來自RSP上的MD ASIC、VIP上的CYA ASIC以及VIP上的PCI/資料包記憶體ASIC的錯誤消息。
此圖顯示VIP崩潰的故障樹分析:
VIP4-50、VIP4-80和VIP6-80對CPU記憶體和資料包記憶體使用單位元糾錯和雙位元檢錯錯誤代碼校正(ECC)。兩者都是同步動態RAM(SDRAM)。SDRAM中的單位元錯誤被糾正,系統繼續正常運行。
本表中數字2或3的多位元奇偶校驗錯誤是導致ECC多位元錯誤的致命事件。系統中的CPU內部快取和匯流排使用單位元奇偶校驗檢測。如圖所示,VIP4和VIP6的體系結構與VIP2不同。因此,某些錯誤消息不會顯示,而報告其他錯誤消息的方式與VIP2不同。在此奇偶校驗錯誤部分中,表示並解釋了VIP2、VIP4和VIP6之間的差異。
在CPU或主資料快取中發現錯誤奇偶校驗時,會發生快取奇偶校驗錯誤異常。奇偶校驗錯誤可能發生在VIP DRAM、DRAM控制器、主快取或CPU本身。在此位置發現的奇偶校驗錯誤也稱為處理器記憶體奇偶校驗錯誤(PMPE)。 這些錯誤導致VIP立即崩潰,VIP和RSP上的輸出看起來相似。訊號值20(sig=20)表示發生了快取奇偶校驗錯誤異常。訊號值顯示在崩潰的系統日誌消息中。
Recent代碼還提供了有意義的詳細行,如下所示:
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
VIP crashinfo檔案中包含的資訊還指向主資料快取中的相同奇偶校驗錯誤位置:
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
主快取或PMPE可能是暫時性錯誤。如果這是PMPE的第一個例項,通常可以放心地忽略它。但是,如果同一個VIP遇到第二個或後續的PMPE,您應該更換VIP。有時更換DRAM本身也可以解決問題。
VIP4和VIP6注意 — 在CPU內部快取和CyAsic中發生的奇偶校驗錯誤被檢測為快取奇偶校驗錯誤異常。糾正了CPU記憶體中的單位元奇偶校驗錯誤,無需執行任何操作。在CPU儲存器中檢測多位元奇偶校驗錯誤作為處理ecc多位元奇偶校驗錯誤。如果報告了procmem ecc多位奇偶校驗錯誤,則應更換VIP中的CPU記憶體。
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
當VIP從RSP中的MEMD下載並出現這些錯誤時,這通常表示另一個VIP向MEMD寫入了錯誤的奇偶校驗,或者該MEMD已損壞。如果源來自MEMD並且源繼續,則需要更換RSP。反之,如果錯誤奇偶校驗的來源是另一個VIP,您應該重新拔插並更換寫入錯誤奇偶校驗的VIP(如有必要)。
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
注意:VIP4和VIP6顯示關於CyBus奇偶校驗錯誤的相同錯誤消息,但不顯示資料包匯流排寫入奇偶校驗錯誤消息。
RENO ASIC檢測到DRAM控制器奇偶校驗錯誤和輸入/輸出(I/O)控制器奇偶校驗錯誤。源自DRAM或DRAM控制器的奇偶校驗錯誤被報告為快取奇偶校驗異常。報告I/O控制器檢測到的奇偶校驗錯誤,如以下輸出所示。通常,I/O控制器報告的奇偶校驗錯誤源自其他位置,除來自其他位置的消息外,還由I/O控制器報告。
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
注意:VIP4和VIP6未顯示此錯誤消息。
每當從VIP上的資料包記憶體(SRAM)中讀取奇偶校驗錯誤時,PMA ASIC都會報告資料包記憶體讀取奇偶校驗錯誤。系統日誌中報告此錯誤,如下所示:
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
您還可以在VIP crashinfo檔案中看到資料包記憶體讀取奇偶校驗錯誤的證據:
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
SRAM奇偶校驗錯誤也可以是暫時的,因此第一次出現與DRAM奇偶校驗錯誤一樣處理。如果錯誤仍然存在,請更換SRAM或VIP。
VIP4和VIP6注意 — 更正資料包記憶體中的單位元奇偶校驗錯誤。在分組儲存器中檢測多位元奇偶校驗錯誤作為分組ecc多位元奇偶校驗錯誤。如果報告包ecc多位元奇偶校驗錯誤,應更換VIP包記憶體。
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
每當將奇偶校驗錯誤寫入資料包記憶體時,PMA ASIC都會報告資料包匯流排寫入奇偶校驗錯誤。在此示例中,VIP只是信使,此VIP的記憶體不存在問題。
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
注意:VIP4和VIP6未顯示此錯誤消息。
在PCI匯流排1和2中可檢測到奇偶校驗錯誤,這兩個匯流排都直接與埠介面卡連線。這些匯流排通過第三個PCI匯流排(匯流排0)橋接在一起,在該匯流排上也可以檢測到奇偶校驗錯誤。由任何PCI匯流排產生的奇偶校驗錯誤最常見的原因是埠介面卡安裝不當或故障。當您在VIP崩潰的系統日誌輸出中看到這些消息時,您需要重新拔插埠介面卡以解決問題。
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
如果重新拔插埠介面卡不能解決問題,則問題出在埠介面卡或VIP上。將埠介面卡移至另一個托架並將第二個埠介面卡插入原始托架以進行故障排除。這通常指向有問題的硬體。以下提供範例:
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
注意:VIP4和VIP6會出現相同的錯誤,但錯誤消息有所不同。它被檢測為PCI主奇偶校驗錯誤和PCI從奇偶校驗錯誤。執行與VIP PCI匯流排奇偶校驗錯誤相同的步驟,以解決此問題。
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
奇偶校驗錯誤也可以由VIP在CyBus上的讀寫操作的資料或地址中檢測到。如果發生這種情況,您會看到類似於以下內容的syslog輸出:
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
將此資訊與系統日誌中的資訊結合使用,可確定錯誤的真正來源。
注意:VIP4和VIP6顯示與CyBus奇偶校驗錯誤相同的錯誤消息。
當VIP嘗試寫入MEMD中的無效地址時,RSP會在該插槽的CyBus上放置一個NACK。這通常是軟體問題,但也可能是硬體問題。例如,在此輸出中,VIP向無效地址寫入4個位元組,因此RSP在該插槽的CyBus上放置了NACK。
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
但是,如以下輸出所示,RSP還將NACK放在VIP上,以嘗試向MEMD寫入錯誤的奇偶校驗。
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
如以下輸出所示,當所有插槽都出現NACK時,這是一個硬體錯誤。仲裁器發生故障,必須更換卡固定架。
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
VIP崩潰並非由本文檔中的任何原因引起,而最常見的原因是其它軟體問題。這些崩潰可能以各種不同方式表現出來。以下是降低VIP因軟體問題崩潰的風險以及在發生崩潰時對其進行處理的一般建議:
請始終確保Cisco IOS軟體映像支援VIP。
請始終保持RSP-BOOT映像和主Cisco IOS軟體映像的版本相同。
確保當前版本的Cisco IOS軟體支援VIP配置和埠介面卡。
檢視發行說明,瞭解正確的Cisco IOS軟體級別和記憶體要求。
以下是因軟體問題導致VIP崩潰的系統日誌輸出示例:
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
出現軟體問題時,要獲取的最重要資訊可能是VIP的crashinfo檔案。有關捕獲此資訊的說明,請參閱獲取VIP Crashinfo檔案部分。
VIP多次崩潰,當您檢視崩潰資訊檔案時,可能會看到以下消息:
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
CPU訊號10錯誤消息表示匯流排異常錯誤。匯流排錯誤可能是軟體或硬體問題。此問題的解決方法是重新拔插模組並監控路由器。如果在重新拔插模組後模組持續崩潰,請通過崩潰資訊檔案聯絡TAC Case Open工具(僅限註冊客戶)。
在開啟案例之前,最好先使用此資訊建立VIP故障摘要檔案。在TAC案例開啟工具的「問題說明」欄位中包括此資訊(僅限註冊客戶)。
問題描述
show version 命令的輸出
show diag slot [x] 命令的輸出
Crashinfo檔案摘錄
系統日誌摘錄
然後,收集您在建立TAC案例時要收集的資訊。
以下是一個崩潰摘要檔案的示例:
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
執行本檔案中的疑難排解步驟後,如果您仍需要協助,且想要開啟思科技術支援的案例,請確保包含以下資訊: |
---|
註:如果可能,不要在收集此資訊之前手動重新載入或重新啟動路由器,因為這樣可能會導致重要資訊丟失,而確定問題的根本原因需要這些資訊丟失。 |
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
02-Oct-2006 |
初始版本 |