このドキュメントでは、Versatile Interface Processor(VIP)のクラッシュをトラブルシューティングするための情報を提供しています。
7500 シリーズ ルータの Field Notice に関する知識があることが推奨されます。
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づいています。
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。対象のネットワークが実稼働中である場合には、どのようなコマンドについても、その潜在的な影響について確実に理解しておく必要があります。
ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。
VIP のクラッシュを解明するためには、まず VIP の基本アーキテクチャを理解しておくことが重要です。このセクションの図は、下記のコンポーネントを含む VIP2 の機能ブロック ダイアグラムを示しています。
Orion Reduced Instruction Set Computing(RISC; 縮小命令セット コンピュータ)CPU と関連回路(これには Dynamic RAM(DRAM)、L2 cache、RENO Application-Specific Integrated Circuit(ASIC; 特定用途向け集積回路)、およびブート ROM が含まれます)。
CyBus ASIC:VIP2スタティックRAM(SRAM)とシステムパケットメモリ(MEMD)の間で、CyBusまたはCxBusを介してパケットを制御および転送するコンポーネント。
パケットメモリASIC:ポートアダプタとSRAMの間でパケットを移動します。
Peripheral Component Interconnect(PCI)バス:ポートアダプタとVIP2 SRAM間のデータパス。
ブリッジ:ポートアダプタの個々のPCIバスを分離します。
VIP2 マイクロコード(ファームウェア)は、カード固有のソフトウェア命令を提供するイメージです。VIP2 上の programmable read-only memory(PROM; プログラム可能読み取り専用メモリ)デバイスには、システムが Cisco IOS(R) バンドルまたはフラッシュ メモリからマイクロコード イメージを検出したりロードしたりするのを助けるデフォルト マイクロコード ブート イメージが格納されています。PROM 内のマイクロコード ブート イメージは VIP2 を初期化して、さらに VIP2 のマイクロコード イメージのダウンロードを行います。同一タイプのすべてのインターフェイスでは、Cisco IOS ソフトウェア バンドルあるいはフラッシュ メモリのいずれかから同一のマイクロコード イメージがロードされます。フラッシュ メモリには特定のインターフェイス向けの複数のマイクロコード バージョンを格納できますが、始動時にロードできるイメージは 1 つだけです。
show controllers cbusコマンドは、各インターフェイスプロセッサおよびVIP2の現在ロードおよび実行中のマイクロコードバージョンを表示します。show startup-configコマンドは、起動時にマイクロコードをロードするための現在のシステム手順を表示します。
トラブルシューティング時には、VIP crashinfo ファイルや syslog から情報を読むための指針として、このセクションの図を使用できます。例として、VIP SRAM から読み込んだ際に不良パリティが見つかったことを示す syslog 出力を見てみましょう。
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
次のセクションの推奨事項にあるように、この出力にある VIP を監視して、同様のクラッシュが再発した場合には SRAM か VIP を交換する必要があります。
show diag コマンドの出力にある EEPROM のアドレス 0x21 の内容を調べると、VIP のモデルを確認できます。各 VIP タイプに対応する値を次の表に示します。
値 | VIP | コントローラのタイプ |
---|---|---|
0x14 | VIP1 | VIP コントローラ |
0x15 | VIP2(VIP2-10、VIP2-15、VIP2-20、VIP2-40) | VIP2 コントローラ |
0x1E | VIP2-50 | VIP2 R5K コントローラ |
0x20 | FEIP2 | FEIP2 コントローラ |
0x21 | GEIP | GEIP コントローラ |
0x40 | GEIP +* | GEIP+ コントローラ |
0x22 | VIP4-80 | VIP4-80 RM7000 コントローラ |
0x31 | VIP4-50 | VIP4-50 RM5271 コントローラ |
0x4E | VIP6-80 | VIP6-80 RM7000B コントローラ |
注:GEIP+はVIP4-80に基づいています。このドキュメントのVIP4-80に関する詳細情報は、GEIP+にも適用されます。
以下が一例です。
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
この出力から、この VIP は VIP2-50 であることがわかります。
VIP2-10、VIP2-15、VIP2-20、および VIP2-40 の違いは、それぞれの DRAM および SRAM の量です。さまざまな VIP2 も(アップグレードされていなければ)、次の表に示すように show diag コマンドの出力のメモリ構成で識別できます。
メモリ | VIP |
---|---|
8 MB DRAM/512 KB SRAM | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
16 MB DRAM/1 MB SRAM | VIP2-20 |
32 MB DRAM/2 MB SRAM | VIP2-40 |
ソフトウェアの問題の解決、およびシステム クラッシュが内包する原因の診断の際には、Crashinfo ファイルにある情報がきわめて重要な働きをします。crashinfo ファイルには、ロギング情報および VIP のスタック トレースが含まれるだけでなく、拡張メモリおよびコンテキストの情報も含まれています。VIP がクラッシュするたびに、VIP は crashinfo ファイルを RSP のブートフラッシュに書き込もうとします。Crashinfo ファイルは次の形式で保存されます。
crashinfo_vip_<slot#>_<data>_<time>
VIP の Crashinfo ファイルを見つけるには、次のように dir コマンドを使用できます。
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
このルータのブートフラッシュには、2 つの VIP crashinfo ファイルが入っています。次の手順に従って、show file あるいは more コマンドを発行し、これらのファイルの内容の表示とキャプチャを行います。
ターミナル プログラムでロギングを開始します。
term length 0 コマンドを発行します。
more bootflash:<crashinfo filename>コマンドを発行します。
出力をファイルに保存します。
crashinfo ファイルの取り扱い方法についての詳細は、『Crashinfo ファイルからの情報の取得』を参照してください。
ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、 を使用して今後予想される障害や修正を表示できます。を使用するためには、登録ユーザであり、ログインしていて、さらに JavaScript をイネーブルにしている必要があります。 .
クラッシュの原因に基づいて、VIP クラッシュをさまざまなカテゴリに分類できます。回復不能なエラーが見つかると、VIP は必ずクラッシュします。これらのエラーの原因には、パリティ エラー、CyBus 上に現れる Negative Acknowledgement(NACK; 否定応答)メッセージを引き起こすソフトウェアやハードウェア、あるいはソフトウェアの問題があります。このセクションでは、これらの各エラーの種類について説明しています。
ご使用の Cisco デバイスの、show technical-support コマンドの(イネーブル モードでの)出力データがあれば、 表示します。を使用するためには、登録ユーザであり、ログインしていて、さらに JavaScript をイネーブルにしている必要があります。 .
パリティ エラーは、ハードウェアが同一データについて計算されたパリティ値と以前のパリティ値を比較して、データの妥当性をチェックしようとしたときに、VIP 上で発生します。データ内でビット フリップが 1 つ発生しても、パリティ エラーになる可能性があります。VIP でパリティ エラーの診断をするには、パリティがチェックされるそれぞれの場所を理解していることが重要です。これらの場所がパリティ エラー発生の可能性がある場所になります。次の図に、情報の概略を示します。また、パリティ エラーについての詳細は、『Cisco 7500 VIP のフォールト ツリー解析』を参照してください。
この図で示すように、VIP で発生する可能性があるパリティ エラーには 7 つのタイプがあります。エラーは別のソースから受け取る場合があること、および VIP 内が発生源ではない場合があること注意してください。パリティ エラーの発生源には、Route/Switch Processor(RSP)、別の VIP、またはきちんと取り付けられていないポート アダプタや不良ポート アダプタがあります。VIP クラッシュを適切に理解するためには、クラッシュの発生源を診断することが重要です。
不良パリティを伴なうデータがあると、VIP と Cisco 7500 シリーズ ルータ上の複数のパリティ チェック デバイスでの個々のあらゆる読み書き操作で、それが報告される可能性があることを理解しておくことが重要です。たとえば、VIP が RSP 上の送信キューにあるパケットを自分の SRAM に読み込んでいて、RSP の SRAM でパリティ エラーがある場合、RSP 上の MD ASIC、VIP 上の CYA ASIC、さらに VIP 上の PCI/パケット メモリ ASIC からもエラー メッセージが表示されます。
次のダイアグラムは VIP クラッシュのフォールトツリー解析を表しています。
VIP4-50、VIP4-80、VIP6-80 では、CPU メモリとパケット メモリでシングル ビット エラー訂正とダブル ビット エラー検出用の Error Code Correction(ECC)が使用されています。いずれも Synchronous Dynamic RAM(SDRAM)です。SDRAM でのシングル ビット エラーは訂正され、システムは平常に運用を続行します。
次のテーブルの 2 または 3 のマルチビット パリティ エラーは致命的イベントで、ECC マルチビット エラーが発生します。CPU 内部キャッシュとシステム内のバスでは、シングル ビット パリティ訂正が使用されます。ここに示すように、VIP4とVIP6のアーキテクチャはVIP2とは異なります。そのため、一部のエラーメッセージは表示されず、他のエラーメッセージはVIP2と異なって報告されます。このパリティエラーセクションでは、VIP2、VIP4、VIP6の違いについて説明します。
キャッシュ パリティ エラー例外は、CPU またはプライマリ データ キャッシュ内で不良パリティが検出されたときに発生します。このパリティ エラーは、VIP DRAM、DRAM コントローラ、プライマリ キャッシュ、または CPU 自体の中で発生した可能性があります。この場所で検出されたパリティ エラーは、プロセッサ メモリ パリティ エラー(PMPE)とも呼ばれます。 このエラーの結果、VIP が即時クラッシュし、VIP と RSP の両方で同じような出力が行なわれます。sig 値 20 は(sig=20)、キャッシュ パリティ エラー例外が発生したことを示します。sig 値は、キャッシュのシステム ログ メッセージ中に表示されます。
最近のコードでは、次に示すような詳細な説明の行が表示されます。
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
VIP crashinfo ファイルの情報には、プライマリ データ キャッシュ内のパリティ エラーの場所も示されています。
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
プライマリ キャッシュまたは PMPE は一時的なエラーである可能性があります。それが最初の PMPE の発生であれば、通常は無視しても差し支えありません。しかし、同じ VIP で二度以上の PMPE が発生するような場合、VIP を交換する必要があります。DRAM 自体を交換して問題が解決する場合もあります。
VIP4およびVIP6に関する注:CPU内部キャッシュおよびCyAsicで発生したパリティエラーは、キャッシュパリティエラー例外として検出されます。CPU メモリ内でのシングル パリティ エラーは訂正されるので、特に対応は不要です。CPU メモリでのマルチビット パリティ エラーは、procmem ecc multi-bit パリティ エラーとして検出されます。procmem ecc multi-bit パリティ エラーが報告された場合は、VIP の CPU メモリを交換する必要があります。
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
VIP が RSP の MEMD からダウンロードした際に次のエラーが発生する場合、通常、別の VIP が不良パリティを MEMD に書き込んだか、MEMD が破損していることを示しています。原因が MEMD にあり、エラーが続く場合、RSP を交換する必要があります。逆に、不良パリティの原因が別の VIP である場合、VIP を挿入しなおし、必要であれば不良パリティを書き込んでいる VIP を交換します。
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
注:VIP4とVIP6では、CyBusパリティエラーに関して同じエラーメッセージが表示されますが、パケットバス書き込みパリティエラーメッセージは表示されません。
DRAM コントローラ パリティ エラーと Input/Output(I/O)コントローラ パリティ エラーは RENO ASIC で検出されます。DRAM あるいは DRAM コントローラに起因するパリティ エラーはキャッシュ パリティ例外として報告されます。I/O コントローラにより検出されたパリティ エラーは、次の出力例のように報告されます。I/O コントローラにより報告されるパリティ エラーは別の場所で生じていることが多く、I/O コントローラにより他の場所からのメッセージと一緒に報告されます。
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
注:VIP4とVIP6では、このエラーメッセージは表示されません。
PMA ASIC は、VIP のパケット メモリ(SRAM)からパリティ エラーが読み出されたときに必ず、パケット メモリ読み取りパリティ エラーを報告します。このエラーは、次に示すようにシステム ログ中に報告されます。
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
パケット メモリ読み取りパリティ エラーの例は、VIP crashinfo ファイルでも確認できます。
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
SRAM パリティ エラーも一時的なものである可能性があるので、初めて発生した場合には DRAM パリティ エラーと同様に取り扱ってください。エラーが続く場合には、SRAM または VIP を交換します。
VIP4およびVIP6に関する注:パケットメモリのシングルビットパリティエラーは修正されています。パケット メモリでのマルチビット パリティ エラーは pakmem ecc multi-bit parity error として検出されます。pakmem ecc マルチビット パリティ エラーが報告された場合は、VIP のパケット メモリを交換する必要があります。
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
PMA ASIC では、パケット メモリにパリティ エラーが書き込まれる場合に、必ずパケット バス書き込みパリティ エラーが報告されます。この例では、VIP は単なるメッセンジャであり、この VIP のメモリには問題はありません。
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
注:VIP4とVIP6では、このエラーメッセージは表示されません。
パリティ エラーが検出されるのは PCI バス 1 と 2 ですが、この両方ともポート アダプタとの直接インターフェイスとして機能しています。この両方のバスは、第 3 の PCI バスであるバス 0 により相互にブリッジングされており、このバス 0 でもパリティ エラーは検出されます。PCI バスに起因するどのパリティ エラーも、通常は、ポート アダプタが確実に装着されていないか、あるいはポート アダプタそのものの欠陥が原因となっています。VIP クラッシュの syslog 出力に次のメッセージが見られた場合には、ポート アダプタを取り付け直すことで通常は問題が解決します。
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
ポート アダプタを装着し直しても問題が解決しない場合は、ポート アダプタそのものか VIP に問題があります。トラブルシューティングを行うには、そのポート アダプタを別のベイに移動し、別のポート アダプタを元のベイに挿入します。通常は、これによって問題のあるハードウェアが判断できます。次に例を示します。
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
注:VIP4とVIP6では同じエラーが発生しますが、エラーメッセージは異なります。このエラーは、PCI マスター パリティ エラーおよび PCI スレーブ パリティ エラーとして検出されます。この問題のトラブルシューティングを行うには、VIP PCI バス パリティ エラーのために概略したものと同じ手順を実行してください。
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
CyBus でのデータやアドレスの読み書き操作中に、VIP でパリティ エラーが検出される場合もあります。これが発生した場合、次のような syslog 出力が見られます。
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
この情報をシステム ログにある情報と一緒に使用して、エラーの本当の原因を判別します。
注:VIP4とVIP6では、CyBusパリティエラーに関しても同じエラーメッセージが表示されます。
VIP が MEMD の無効アドレスに書き込みを行おうとすると、RSP はそのスロットの CyBus 上に NACK を発行します。これは通常はソフトウェアの問題ですが、ハードウェアの問題である可能性もあります。たとえば次の出力では、VIP が無効アドレスに 4 バイトを書き出しているので、RSP はそのスロットに対して CyBus で NACK を返しています。
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
しかし、次に示すように、RSP は MEMD に不良パリティを書き込もうとしている VIP にも NACK を発行します。
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
この出力に示すように、すべてのスロットに NACK が現れた場合、これはハードウェア エラーです。このアービターには欠陥があり、カード ケージを交換する必要があります。
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
このドキュメントで説明したいずれの理由も当てはまらない VIP クラッシュは、他のソフトウェア問題が原因というのが最も一般的です。このようなクラッシュはさまざまな方法で明らかにすることができます。ソフトウェアの問題による VIP クラッシュのリスクを軽減し、発生した場合にそれを対処するための一般的な提言をいくつか次に示します。
Cisco IOS ソフトウェア イメージが VIP をサポートしていることを常に確認します。
必ず RSP-BOOT イメージとメイン IOS イメージを同じバージョンに維持します。
VIP 構成とポート アダプタが現在のバージョンの Cisco IOS ソフトウェアでサポートされていることを確認します。
リリース ノートで、適切な Cisco IOS ソフトウェア レベルとメモリ要件をチェックします。
ソフトウェアの問題で発生した VIP クラッシュのシステム ログ出力の例を次に示します。
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
ソフトウェア問題の場合に取得すべき最も重要な情報は、おそらく VIP の crashinfo ファイルです。この情報をキャプチャする手順については、「VIP Crashinfo ファイルの取得」セクションを参照してください。
VIP クラッシュが何度も発生する場合、Crashinfo ファイルを確認すると、次のメッセージが見られる場合があります。
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
CPU signal 10 というエラー メッセージは、バス エラー例外を意味しています。バス エラーは、ハードウェアの問題である可能性もあれば、ソフトウェアの問題である可能性もあります。この問題を回避するには、モジュールを取り付け直し、ルータを監視します。モジュールを取り付けなおした後でもクラッシュが生じる場合は、Crashinfo ファイルを添えて、TAC Service Request Tool(登録ユーザのみ)でご連絡ください。
サービス リクエストをオープンする前に、この情報を使用して VIP クラッシュ サマリー ファイルを作成することを推奨いたします。この情報を TAC Service Request Tool(登録ユーザ専用)の Problem Description フィールドに取り込んでください。
問題の説明
show version コマンドの出力
show diag slot [x] コマンドの出力
crashinfo ファイルの抜粋
syslog の抜粋
次に TAC のサービス リクエストをオープンする場合に収集する情報を収集します。
クラッシュ サマリー ファイルの例を次に示します。
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
このドキュメントで説明したトラブルシューティング手順を実行した後も、依然としてサポートが必要で、Cisco テクニカルサポートでサービス リクエストをオープンする場合は、次の情報を必ず添付してください。 |
---|
注:可能な場合は、この情報を収集する前に、ルータを手動でリロードまたは電源のオフ/オンを行わないでください。これは、問題の根本原因を特定するために必要な重要な情報が失われる可能性があるためです。 |
改定 | 発行日 | コメント |
---|---|---|
1.0 |
02-Oct-2006 |
初版 |