소개
이 문서에서는 Cisco 라우터에 패리티 오류가 발생하는 원인과 그 문제를 해결하는 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 라우터 충돌을 해결하는 방법을 알고 있는 것이 좋습니다.
자세한 내용은 라우터 충돌 트러블슈팅을 참조하십시오.
사용되는 구성 요소
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
표기 규칙
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참고하십시오.
패리티 오류 식별
다음과 같은 MIPS(MultiChannel Interface Processor) 기반 프로세서 제품에서 메모리 패리티 오류가 발생합니다.
-
Cisco 4500/4700 Series 라우터
-
Cisco 7500 Series 라우터(RSP1, RSP2, RSP4, RSP8, VIP2-10, VIP2-15, VIP2-20, VIP2-40, VIP2-50)
-
Cisco 7000 Series 라우터(RSP 7000)
-
Cisco 7200 Series 라우터(NPE-100, NPE-150, NPE-175, NPE-200, NPE-225, NPE-300)
-
Cisco 12000 Series 인터넷 라우터
다음은 일부 메시지입니다. 이 메시지는 모두 시스템 어딘가에 있는 잘못된 패리티의 탐지와 관련이 있습니다(목록은 완전하지 않지만 가장 일반적인 메시지를 포함합니다).
소프트 패리티 오류와 하드 패리티 오류
패리티 오류에는 두 가지 유형이 있습니다.
연구에 따르면 소프트 패리티 오류가 하드 패리티 오류보다 10~100배 더 자주 발생합니다. 따라서 Cisco에서는 두 번째 패리티 오류가 발생할 때까지 기다린 다음 교체하는 것이 좋습니다. 이렇게 하면 네트워크에 미치는 영향이 크게 줄어듭니다.
문제 파악
라우터에는 서로 다른 위치에 메모리가 있습니다. 이론적으로 모든 메모리 위치는 패리티 오류의 영향을 받을 수 있지만 대부분의 메모리 문제는 DRAM(동적 RAM) 또는 SRAM(공유 RAM)에서 발생합니다. 플랫폼을 기반으로 어떤 메모리 위치가 영향을 받았는지, 하드 패리티 오류로 판명될 경우 어떤 부분을 교체해야 하는지 알아보십시오.
Cisco 4500 및 4700 플랫폼
Cisco 4500 및 4700 플랫폼에서는 Cisco IOS® Software Release 12.2(10) 및 12.2(10)T 이전 버전에서 crashinfo 파일을 사용할 수 없습니다.
오류가 발생한 위치를 확인할 수 있는 한 가지 방법은 콘솔 로그와 show version 명령 출력에서 "restart reason"을 확인하는 것입니다.
-
DRAM의 패리티 오류:
충돌 후 라우터를 수동으로 다시 로드하지 않은 경우 show version 출력은 다음과 같습니다.
System restarted by processor memory parity error at PC 0x601799C4,
address 0x0
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
crashinfo 파일을 사용할 수 있거나 콘솔 로그를 캡처한 경우 다음과 같은 내용도 볼 수 있습니다.
*** Cache Error Exception ***
Cache Err Reg = 0xa0255c61
data reference, primary cache, data field error , error on SysAD Bus
PC = 0xbfc0edc0, Cause = 0xb800, Status Reg = 0x34408007
DRAM에서 패리티 오류가 반복적으로 발생하면 DRAM 또는 섀시에 결함이 있음을 나타냅니다. 최근에 섀시를 제거한 경우 또는 하드웨어 컨피그레이션 변경을 수행한 경우 DRAM 칩을 다시 장착하여 문제를 해결하십시오. 그렇지 않은 경우 첫 번째 단계로 DRAM을 교체합니다. 패리티 오류를 방지해야 합니다. 라우터가 여전히 충돌할 경우 섀시를 교체합니다.
-
SRAM의 패리티 오류:
충돌 후 라우터를 수동으로 다시 로드하지 않은 경우 show version 명령 출력은 다음과 같습니다.
System restarted by shared memory parity error at PC 0x60130F40
System image file is "flash:c4500-inr-mz.111-14.bin", booted via flash
crashinfo 파일을 사용할 수 있거나 콘솔 로그를 캡처한 경우 다음과 같은 내용도 볼 수 있습니다.
*** Shared Memory Parity Error ***
shared memory control register= 0xffe3
error(s) reported for: CPU on byte(s): 0/1
또는
%PAR-1-FATAL: Shared memory parity error
shared memory status register= 0xFFEF
error(s) reported for: CPU on byte(s): 0/1 2/3
또는
*** Shared Memory Parity Error ***
shared memory control register= 0xffdf
error(s) reported for: NIM1 on byte(s): 0/1 2/3
참고:
-
CPU에 오류가 보고되면 SRAM을 교체합니다.
-
NIM(x)에 대해 오류가 보고되면 슬롯(x)의 네트워크 모듈을 교체합니다. 슬롯(x)에 할당된 SRAM도 영향을 받을 수 있다. 이 경우 SRAM을 교체합니다.
SRAM에서 반복되는 패리티 에러는 결함이 있는 SRAM 칩 또는 SRAM에 불량 패리티를 기록한 결함 있는 네트워크 모듈을 나타낸다. 최근에 섀시를 분리한 경우 또는 하드웨어 컨피그레이션을 변경한 경우에는 네트워크 모듈과 SRAM 칩을 다시 장착하여 문제를 해결하십시오. 그렇지 않으면 콘솔 로그에서 오류가 보고된 위치를 확인합니다(위의 출력 예 참조).
RSP(Route/Switch Processor), NPE(Network Processing Engine) 및 RP(Route Processor) 플랫폼
Cisco 4000 Series와 마찬가지로, 이러한 플랫폼에 결함이 있는 DRAM 또는 SRAM이 문제가 될 수 있습니다. 결함이 있는 프로세서 카드(RP, RSP 또는 NPE) 때문일 수도 있습니다. Cisco 7000 및 7500은 또한 인터페이스 프로세서(레거시 xIP 또는 VIP)에 결함이 있거나 잘못 장착된 경우 발생하는 패리티 오류를 보고할 수 있습니다.
crashinfo 파일 및 콘솔 로그에서 다음 오류 메시지 중 하나를 확인합니다.
DRAM 또는 SRAM(MEMD)의 패리티 오류
RP, RSP 및 NPE의 경우 일반적으로 다음과 같은 내용이 표시됩니다.
Error: primary data cache, fields: data, (SysAD)
virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000
virtual address corresponds to main:data, cache word 0
간단히 말해,
Error: primary data cache, fields: data, SysAD
phy21:3 0x201880, va14:12 0x1000, addr 63E01880
이는 RSP 자체에 문제가 있음을 나타냅니다. 문제가 한 번만 발생하면 일시적인 문제일 가능성이 높습니다.
SRAM에서 패리티 오류 발생
RSP의 경우 메시지는 다음과 같이 표시될 수 있습니다.
%RSP-3-ERROR: MD error 0000008000000200
%RSP-3-ERROR: QA parity error (bytes 0:3) 02
%RSP-3-ERROR: MEMD parity error condition
%RSP-2-QAERROR: reused or zero link error, write at addr 0100 (QA)
log 22010000, data 00000000 00000000
%RSP-3-RESTART: cbus complex
또는
%RSP-3-ERROR: CyBus error 01
%RSP-3-ERROR: read data parity
%RSP-3-ERROR: read parity error (bytes 0:7) 20
%RSP-3-ERROR: physical address (bits 20:15) 000000
SRAM에 불량 패리티를 기록하는 다른 인터페이스 프로세서의 표시가 없는 경우(예: VIP2-1-MSG 오류 메시지), 패리티 오류의 가장 가능성 있는 원인은 SRAM 자체입니다. 이 경우 RSP를 교체합니다.
인터페이스 프로세서가 잘못된 패리티를 쓴다는 다른 오류 메시지가 나타나면 카드에 결함이 있거나 잘못 장착된 것일 수 있습니다.
다기능 인터페이스 프로세서
로그 또는 crashinfo 파일에서 %VIP2-1-MSG: slot(x) 메시지를 수신하는 경우 VIP 충돌 문제 해결을 참조하십시오.
권장 작업
패리티 에러의 첫 번째 발생 시에, 소프트 패리티 에러와 하드 패리티 에러를 구별할 수 없다. 경험에 따르면 대부분의 패리티 발생은 소프트 패리티 오류이며 일반적으로 무시할 수 있습니다. 최근에 일부 하드웨어를 변경하거나 박스를 이동한 경우 해당 부품(DRAM, SRAM, NPE, RP, RSP 또는 VIP)을 다시 장착해 보십시오. 패리티가 여러 번 자주 발생하는 경우 하드웨어에 결함이 있는 것입니다. 영향을 받는 부품(DRAM, RSP, VIP 또는 마더보드)을 이 문서에 설명된 지침에 따라 교체합니다.
TAC 서비스 요청을 열 경우 수집할 정보
위의 트러블슈팅 단계를 수행한 후에도 여전히 도움이 필요한 경우 Cisco TAC에 서비스 요청을 열려면 다음 정보를 포함해야 합니다. |
- 서비스 요청을 열기 전에 문제 해결을 수행했습니다.
- show technical-support 명령 출력(가능한 경우 활성화 모드)
- show log 명령 출력 또는 콘솔 캡처(사용 가능한 경우)
- crashinfo 파일(있는 경우 및 show technical-support 명령 출력에 아직 포함되어 있지 않은 경우) 여러 crashinfo 파일이 있는 경우 모두 포함).
- 프로세서 메모리 패리티 오류로 인한 다시 로드 수 및 이러한 오류가 발생한 시간.
수집된 데이터를 압축되지 않은 일반 텍스트 형식(.txt)으로 케이스에 첨부하십시오. 서비스 요청에 정보를 첨부하려면 TAC Service Request Tool을 통해 업로드하십시오(등록된 고객만 해당). Service Request Tool에 액세스할 수 없는 경우 서비스 요청에 관련 정보를 첨부한 후 메시지의 제목 줄에 서비스 요청 번호를 포함하여 attach@cisco.com으로 전송합니다. 참고: 프로세서 메모리 패리티 오류를 해결하는 데 필요한 경우가 아니면 라우터를 수동으로 다시 로드하거나 전원을 껐다가 다시 켜지 마십시오. 그러면 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있습니다. |
관련 정보