이 문서에서는 VIP(Versatile Interface Processor) 충돌 문제를 해결하기 위한 정보를 제공합니다.
Cisco에서는 7500 Series 라우터 필드 알림에 대해 알고 있는 것을 권장합니다.
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
VIP1
VIP2-10
VIP2-15
VIP2-20
VIP2-40
VIP2-50
FIP2
GEIP
GEIP+
VIP4-50
VIP4-80
VIP6-80
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참고하십시오.
VIP 충돌을 해석하려면 먼저 VIP의 기본 아키텍처를 이해하는 것이 중요합니다. 이 섹션의 그림은 VIP2의 기능 블록 다이어그램으로, 다음 구성 요소를 포함합니다.
Orion RISC(Reduced Instruction Set Computing) CPU 및 관련 회로 - DRAM(Dynamic RAM), L2 캐시, RENO ASIC(Application-Specific Integrated Circuit) 및 Boot ROM을 포함합니다.
CyBus ASIC - CyBus 또는 CxBus에서 VIP2 SRAM(Static RAM)과 시스템 MEMD(packet memory) 간에 패킷을 제어하고 전송하는 구성 요소입니다.
패킷 메모리 ASIC - 포트 어댑터와 SRAM 간에 패킷을 이동하는 역할을 합니다.
PCI(Peripheral Component Interconnect) 버스 - 포트 어댑터와 VIP2 SRAM 간의 데이터 경로입니다.
브리지 - 포트 어댑터의 개별 PCI 버스를 격리하는 역할을 합니다.
VIP2 마이크로코드(펌웨어)는 카드별 소프트웨어 지침을 제공하는 이미지입니다. VIP2의 프로그래밍 가능한 PROM(읽기 전용 메모리) 디바이스에는 Cisco IOS® 소프트웨어 번들 또는 플래시 메모리에서 마이크로코드 이미지를 찾고 로드하는 데 도움이 되는 기본 마이크로코드 부팅 이미지가 포함되어 있습니다. PROM의 마이크로코드 부팅 이미지는 VIP2를 초기화한 다음 VIP2 마이크로코드 이미지 다운로드를 지원합니다. 동일한 유형의 모든 인터페이스는 Cisco IOS 소프트웨어 번들 또는 플래시 메모리에서 동일한 마이크로코드 이미지를 로드합니다. 플래시 메모리는 특정 인터페이스 유형에 대해 여러 마이크로코드 버전을 저장할 수 있지만 시작 시 하나의 이미지만 로드할 수 있습니다.
show controllers cbus 명령은 각 인터페이스 프로세서 및 VIP2에 대해 현재 로드되고 실행 중인 마이크로코드 버전을 표시합니다. show startup-config 명령은 시작할 때 마이크로코드를 로드하기 위한 현재 시스템 지침을 보여줍니다.
문제를 해결할 때 이 섹션의 그림을 VIP crashinfo 파일 또는 syslog에서 정보를 읽는 지침으로 사용할 수 있습니다. 예를 들어, VIP SRAM에서 읽을 때 잘못된 패리티가 표시되는 이 syslog 출력을 확인합니다.
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
다음 섹션의 권장 사항에서 볼 수 있듯이 이 출력의 VIP를 모니터링해야 하며 유사한 충돌이 다시 발생할 경우 SRAM 또는 VIP를 교체해야 합니다.
VIP의 모델을 확인하기 위해 show diag 명령 출력에서 EPROM에서 주소 0x21의 내용을 확인할 수 있습니다. 각 VIP 유형에 해당하는 값은 다음 표에 나와 있습니다.
가치 | VIP | 컨트롤러 유형 |
---|---|---|
0x14 | VIP1 | VIP 컨트롤러 |
0x15 | VIP2(VIP2-10, VIP2-15, VIP2-20, VIP2-40) | VIP2 컨트롤러 |
0x1E | VIP2-50 | VIP2 R5K 컨트롤러 |
0x20 | FIP2 | FIP2 컨트롤러 |
0x21 | GEIP | GEIP 컨트롤러 |
0x40 | GEIP +* | GEIP+ 컨트롤러 |
0x22 | VIP4-80 | VIP4-80 RM7000 컨트롤러 |
0x31 | VIP4-50 | VIP4-50 RM5271 컨트롤러 |
0x4E | VIP6-80 | VIP6-80 RM7000B 컨트롤러 |
참고: GEIP+는 VIP4-80을 기반으로 합니다. VIP4-80에 대한 이 문서의 모든 추가 정보는 GEIP+에도 적용됩니다.
예를 들면 다음과 같습니다.
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
이 출력에서 이 VIP가 VIP2-50임을 확인할 수 있습니다.
VIP2-10, VIP2-15, VIP2-20 및 VIP2-40의 차이점은 각각 DRAM과 SRAM의 양입니다. 다양한 VIP2s(업그레이드되지 않은 경우)는 show diag 명령 출력에서 이 표에 표시된 메모리 컨피그레이션으로 구분할 수 있습니다.
메모리 | VIP |
---|---|
8MB DRAM/512KB SRAM | VIP2-10 |
8MB DRAM/1MB SRAM | VIP2-15 |
16MB DRAM/1MB SRAM | VIP2-20 |
32MB DRAM/2MB SRAM | VIP2-40 |
crashinfo 파일에 포함된 정보는 소프트웨어 문제를 해결하거나 시스템 충돌의 근본 원인을 진단하려고 시도할 때 매우 유용할 수 있습니다. crashinfo 파일에는 VIP에 대한 로깅 정보와 스택 추적이 포함될 뿐만 아니라 광범위한 메모리 및 컨텍스트 정보도 포함됩니다. VIP가 충돌할 때마다 VIP는 crashinfo 파일을 RSP의 bootflash에 쓰려고 시도합니다. Crashinfo 파일은 다음 형식으로 저장됩니다.
crashinfo_vip_<slot#>_<data>_<time>
다음과 같이 dir 명령을 실행하여 VIP crashinfo 파일을 찾을 수 있습니다.
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
라우터의 이 부트플래시에는 두 개의 VIP crashinfo 파일이 포함되어 있습니다. 다음 절차에 따라 show file 또는 more 명령을 실행하여 이러한 파일의 내용을 보고 캡처합니다.
터미널 프로그램으로 로깅을 시작합니다.
term length 0 명령을 실행합니다.
more bootflash:<crashinfo filename> 명령을 실행합니다.
출력을 파일에 저장합니다.
crashinfo 파일 작업 방법에 대한 자세한 내용은 Crashinfo 파일에서 정보 검색을 참조하십시오.
Cisco 디바이스에서 show technical-support(enable 모드에서) 명령의 출력이 있는 경우 잠재적인 문제 및 수정 사항을 표시합니다. 등록된 고객이어야 하며 로그인되어 있어야 하며 JavaScript를 사용할 수 있어야 합니다. .
VIP 충돌은 충돌 원인에 따라 여러 범주로 분류됩니다. 복구할 수 없는 오류가 발견될 때마다 VIP가 충돌합니다. 이러한 오류는 패리티 오류, 소프트웨어 또는 하드웨어 때문에 CyBus에 NACK(Negative Acknowledgement Message)가 발생하거나 소프트웨어 문제가 발생할 수 있습니다. 이 섹션에서는 이러한 각 오류 유형에 대한 정보를 제공합니다.
Cisco 디바이스에서 show technical-support(enable 모드에서) 명령의 출력이 있는 경우 잠재적인 문제 및 수정 사항을 표시합니다. 등록된 고객이어야 하며 로그인되어 있어야 하며 JavaScript를 사용할 수 있어야 합니다. .
동일한 데이터에 대해 계산된 패리티 값을 이전 패리티 값과 비교하여 하드웨어가 데이터의 유효성을 검사하려고 할 때 패리티 오류가 VIP에서 발생합니다. 데이터를 한 비트 뒤집으면 패리티 오류가 발생할 수 있습니다. VIP에서 패리티 오류를 진단할 때 패리티가 확인되는 각 위치와 패리티 오류가 발생할 수 있는 위치를 이해하는 것이 중요합니다. 이 다이어그램은 이 정보를 간략하게 보여줍니다. 또한 패리티 오류에 대한 자세한 내용은 Cisco 7500 VIP Fault Tree Analysis를 참조하십시오.
이 다이어그램에서 볼 수 있듯이 VIP에서 발생할 수 있는 7가지 유형의 패리티 오류가 있습니다. 다른 소스에서 오류를 수신할 수 있으며 VIP 자체 내에서 시작되지 않았을 수 있습니다. 패리티 오류의 원인은 RSP(Route/Switch Processor), 다른 VIP 또는 잘못 장착되었거나 결함이 있는 포트 어댑터일 수 있습니다. VIP 충돌을 제대로 이해하려면 충돌 원인을 진단하는 것이 중요합니다.
또한 VIP 및 Cisco 7500 Series 라우터의 여러 패리티 검사 디바이스에서 단일 읽기 또는 쓰기 작업을 위해 패리티가 잘못된 데이터를 보고할 수 있다는 점을 이해하는 것이 중요합니다. 예를 들어, VIP가 RSP의 전송 대기열의 패킷을 자체 SRAM으로 읽는데 RSP의 SRAM에 패리티 오류가 있는 경우 RSP의 MD ASIC, VIP의 CYA ASIC 및 VIP의 PCI/패킷 메모리 ASIC에서 오류 메시지가 표시됩니다.
다음 다이어그램은 VIP 충돌에 대한 장애 트리 분석을 보여줍니다.
VIP4-50, VIP4-80 및 VIP6-80은 CPU 메모리 및 패킷 메모리에 단일 비트 오류 수정 및 ECC(Double Bit Error Detection Error Code Correction)를 사용합니다. 둘 다 동기식 동적 RAM(SDRAM)입니다. SDRAM에서 단일 비트 오류가 수정되고 시스템이 정상적으로 계속 작동합니다.
이 표에 있는 숫자 2 또는 3의 멀티비트 패리티 오류는 ECC 멀티비트 오류가 발생하는 치명적 이벤트입니다. 시스템의 CPU 내부 캐시 및 버스는 단일 비트 패리티 탐지를 사용합니다. 여기에 표시된 것처럼 VIP4 및 VIP6의 아키텍처는 VIP2와 다릅니다. 따라서 일부 오류 메시지가 표시되지 않으며 기타 오류 메시지는 VIP2에 있는 것과 다르게 보고됩니다. 이 패리티 오류 섹션에서는 VIP2, VIP4 및 VIP6의 차이점을 표시하고 설명합니다.
캐시 패리티 오류 예외는 CPU 또는 기본 데이터 캐시에서 잘못된 패리티가 검색될 때 발생합니다. VIP DRAM, DRAM 컨트롤러, 기본 캐시 또는 CPU 자체에서 패리티 오류가 발생했을 수 있습니다. 이 위치에서 검색된 패리티 오류는 PMPE(프로세서 메모리 패리티 오류)라고도 합니다. 이러한 오류는 VIP가 즉시 충돌하고 VIP와 RSP에서 출력이 비슷하게 나타납니다. sig 값 2(sig=20)은 캐시 패리티 오류 예외가 발생했음을 나타냅니다. sig 값은 시스템 로그 메시지에 충돌 시 표시됩니다.
최근 코드는 다음과 같이 의미 있는 세부 정보 표시 줄을 제공합니다.
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
VIP crashinfo 파일에 포함된 정보는 기본 데이터 캐시에서 동일한 패리티 오류 위치를 가리킵니다.
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
기본 캐시 또는 PMPE는 일시적인 오류가 될 수 있습니다. PMPE의 첫 번째 인스턴스인 경우, 일반적으로 무시해도 됩니다. 그러나 동일한 VIP에 두 번째 또는 그 이후의 PMPE가 있는 경우 VIP를 교체해야 합니다. DRAM 자체를 교체하면 문제를 해결할 수도 있습니다.
VIP4 및 VIP6 참고 - CPU 내부 캐시 및 CyAsic에서 발생하는 패리티 오류가 캐시 패리티 오류 예외로 탐지됩니다. CPU 메모리의 단일 비트 패리티 오류가 수정되므로 아무 작업도 수행할 필요가 없습니다. CPU 메모리의 다중 비트 패리티 오류는 프로세스 ecc 멀티 비트 패리티 오류로 탐지됩니다. VIP의 CPU 메모리는 프로세스 ecc 멀티 비트 패리티 오류가 보고될 경우 교체해야 합니다.
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
RSP의 MEMD에서 VIP를 다운로드하고 이러한 오류가 표시되면 일반적으로 다른 VIP가 MEMD에 대해 잘못된 패리티를 기록했거나 MEMD가 손상되었음을 나타냅니다. 소스가 MEMD의 소스이고 계속 진행되면 RSP를 교체해야 합니다. 반대로, 패리티의 소스가 다른 VIP인 경우 재연결하고 필요한 경우 패리티를 기록하는 VIP를 교체해야 합니다.
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
참고: VIP4 및 VIP6에는 CyBus 패리티 오류에 대한 동일한 오류 메시지가 표시되지만 패킷 버스 쓰기 패리티 오류 메시지는 표시되지 않습니다.
DRAM 컨트롤러 패리티 오류와 I/O(Input/Output) 컨트롤러 패리티 오류가 모두 RENO ASIC에서 탐지됩니다. DRAM 또는 DRAM 컨트롤러에서 발생한 패리티 오류는 캐시 패리티 예외로 보고됩니다. 이 출력에 표시된 대로 I/O 컨트롤러에서 탐지된 패리티 오류가 보고됩니다. I/O 컨트롤러에서 보고된 패리티 오류는 다른 위치에서 발생하며 I/O 컨트롤러에서 다른 위치에서 보낸 메시지 외에도 보고되는 경우가 많습니다.
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
참고: VIP4 및 VIP6에는 이 오류 메시지가 표시되지 않습니다.
PMA ASIC에서는 VIP의 SRAM(패킷 메모리)에서 패리티 오류를 읽을 때마다 패킷 메모리 읽기 패리티 오류를 보고합니다. 이 오류는 다음과 같이 시스템 로그에 보고됩니다.
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
또한 VIP crashinfo 파일에서 패킷 메모리 읽기 패리티 오류의 증거를 볼 수 있습니다.
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
SRAM 패리티 오류도 일시적일 수 있으므로 첫 번째 발생을 DRAM 패리티 오류와 동일하게 처리합니다. 오류가 계속되면 SRAM 또는 VIP를 교체합니다.
VIP4 및 VIP6 참고 - 패킷 메모리의 단일 비트 패리티 오류가 수정됩니다. 패킷 메모리의 다중 비트 패리티 오류는 패킷 ecc 멀티 비트 패리티 오류로 탐지됩니다. VIP 패킷 메모리는 패킷 ecc 멀티 비트 패리티 오류가 보고될 경우 교체해야 합니다.
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
PMA ASIC에서는 패리티 오류가 패킷 메모리에 기록될 때마다 패킷 버스 쓰기 패리티 오류를 보고합니다. 이 예에서는 VIP가 메신저이며 이 VIP의 메모리에 문제가 없습니다.
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
참고: VIP4 및 VIP6에는 이 오류 메시지가 표시되지 않습니다.
패리티 오류는 PCI 버스 1 및 2에서 탐지될 수 있으며, 둘 다 포트 어댑터와 직접 인터페이스입니다. 이러한 버스는 세 번째 PCI 버스인 버스 0에 의해 연결되며, 이 버스 역시 패리티 오류를 감지할 수 있습니다. PCI 버스에서 발생한 패리티 오류는 일반적으로 포트 어댑터가 잘못 장착되었거나 결함이 있는 경우에 발생합니다. VIP 충돌의 syslog 출력에 이러한 메시지가 표시될 때마다 포트 어댑터를 다시 장착하여 문제를 해결해야 합니다.
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
포트 어댑터를 다시 장착해도 문제가 해결되지 않으면 포트 어댑터 또는 VIP에 문제가 있습니다. 문제를 해결하려면 포트 어댑터를 다른 베이로 이동하고 두 번째 포트 어댑터를 원래 베이에 삽입합니다. 이는 일반적으로 문제가 되는 하드웨어를 가리킵니다. 다음은 예입니다.
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
참고: VIP4와 VIP6에서는 동일한 오류가 발생하지만 오류 메시지는 다릅니다. PCI 마스터 패리티 오류 및 PCI 슬레이브 패리티 오류로 탐지됩니다. 이 문제를 해결하려면 VIP PCI 버스 패리티 오류에 대해 설명한 것과 동일한 단계를 수행하십시오.
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
패리티 오류는 VIP에서 CyBus에 대한 읽기 또는 쓰기 작업의 데이터 또는 주소에서 탐지할 수도 있습니다. 이 경우 다음과 유사한 syslog 출력이 표시됩니다.
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
이 정보를 시스템 로그에 있는 정보와 함께 사용하여 오류의 실제 원인을 확인합니다.
참고: VIP4 및 VIP6에는 CyBus 패리티 오류에 대한 동일한 오류 메시지가 표시됩니다.
VIP가 MEMD의 잘못된 주소에 쓰려고 하면 RSP는 해당 슬롯에 대한 CyBus에 NACK를 배치합니다. 이는 일반적으로 소프트웨어 문제이지만 하드웨어 문제일 수도 있습니다. 예를 들어 이 출력에서 VIP는 잘못된 주소에 4바이트를 기록하므로 RSP는 해당 슬롯에 대한 CyBus에 NACK를 배치합니다.
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
그러나 이 출력에 표시된 것처럼 RSP는 MEMD에 잘못된 패리티를 기록하려고 시도하기 위해 VIP에 NACK를 배치합니다.
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
이 출력에 표시된 것처럼 모든 슬롯에 NACK가 나타나면 하드웨어 오류입니다. 중재자에 결함이 있으며 카드 케이지를 교체해야 합니다.
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
이 문서의 어떤 이유로 인해 발생한 것이 아닌 VIP 충돌은 다른 소프트웨어 문제로 인해 가장 일반적으로 발생합니다. 이러한 사고는 다양한 방식으로 나타날 수 있습니다. 소프트웨어 문제로 인한 VIP 충돌 위험을 줄이고 발생 시 이를 해결하기 위한 일반적인 제안입니다.
Cisco IOS 소프트웨어 이미지가 VIP를 지원하는지 항상 확인합니다.
항상 RSP-BOOT 이미지와 기본 Cisco IOS 소프트웨어 이미지를 동일한 버전으로 유지합니다.
VIP 컨피그레이션 및 포트 어댑터가 현재 버전의 Cisco IOS 소프트웨어에서 지원되는지 확인합니다.
올바른 Cisco IOS 소프트웨어 레벨 및 메모리 요구 사항에 대해서는 릴리스 정보를 확인하십시오.
소프트웨어 문제로 인해 VIP 충돌이 발생한 시스템 로그 출력의 예입니다.
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
소프트웨어 문제 발생 시 가장 중요한 정보는 VIP의 crashinfo 파일일 수 있습니다. 이 정보를 캡처하기 위한 지침은 Obtain a VIP Crashinfo File(VIP Crashinfo 파일 가져오기) 섹션을 참조하십시오.
VIP가 여러 번 충돌하며 충돌 정보 파일을 검토할 때 다음 메시지가 표시될 수 있습니다.
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
CPU 신호 10 오류 메시지는 버스 예외 오류를 의미합니다. 버스 오류는 소프트웨어 또는 하드웨어 문제일 수 있습니다. 이 문제를 해결하려면 모듈을 재장착하고 라우터를 모니터링하는 것입니다. 모듈을 재장착한 후 모듈이 계속 다운되면 TAC Case Open 툴(등록된 고객만 해당)에 충돌 정보 파일에 문의하십시오.
케이스를 열기 전에 이 정보로 VIP 충돌 요약 파일을 생성하는 것이 좋습니다. TAC 케이스 열기 툴의 문제 설명 필드에 이 정보를 포함합니다(등록된 고객만 해당).
문제 설명
show version 명령의 출력
show diag slot [x] 명령의 출력
Crashinfo 파일 발췌문
Syslog 발췌문
그런 다음 TAC 케이스를 열 경우 수집할 정보를 수집합니다.
다음은 충돌 요약 파일의 예입니다.
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
이 문서의 문제 해결 단계를 수행한 후에도 도움이 필요한 경우 Cisco 기술 지원 서비스에 케이스를 열려면 다음 정보를 포함해야 합니다. |
---|
참고: 이 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜면 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있으므로 됩니다. |
개정 | 게시 날짜 | 의견 |
---|---|---|
1.0 |
02-Oct-2006 |
최초 릴리스 |