본 제품에 대한 문서 세트는 편견 없는 언어를 사용하기 위해 노력합니다. 본 설명서 세트의 목적상, 편견 없는 언어는 나이, 장애, 성별, 인종 정체성, 민족 정체성, 성적 지향성, 사회 경제적 지위 및 교차성에 기초한 차별을 의미하지 않는 언어로 정의됩니다. 제품 소프트웨어의 사용자 인터페이스에서 하드코딩된 언어, RFP 설명서에 기초한 언어 또는 참조된 서드파티 제품에서 사용하는 언어로 인해 설명서에 예외가 있을 수 있습니다. 시스코에서 어떤 방식으로 포용적인 언어를 사용하고 있는지 자세히 알아보세요.
Cisco는 전 세계 사용자에게 다양한 언어로 지원 콘텐츠를 제공하기 위해 기계 번역 기술과 수작업 번역을 병행하여 이 문서를 번역했습니다. 아무리 품질이 높은 기계 번역이라도 전문 번역가의 번역 결과물만큼 정확하지는 않습니다. Cisco Systems, Inc.는 이 같은 번역에 대해 어떠한 책임도 지지 않으며 항상 원본 영문 문서(링크 제공됨)를 참조할 것을 권장합니다.
이 문서에서는 소프트 패리티 오류와 하드 패리티 오류에 대해 설명하고 일반적인 오류 메시지를 설명하고 패리티 오류를 방지하거나 최소화하는 방법을 권장합니다.하드웨어 및 소프트웨어 설계의 최근 개선으로 패리티 문제도 감소했습니다.
프로세서 또는 메모리 패리티 오류란 무엇입니까?
패리티 검사는 데이터가 메모리에 저장되는 동안 작은 양의 컴퓨터 데이터(일반적으로 1바이트)의 패리티(홀수 또는 짝수)를 나타내기 위해 추가 이진 숫자(비트)를 저장하는 것입니다.저장된 데이터에서 계산된 패리티 값을 최종 패리티 값과 비교합니다.이 두 값이 다른 경우 데이터 오류를 나타내며 데이터 손상으로 인해 하나 이상의 비트가 변경되었을 수 있습니다.
컴퓨터 시스템 내에서 내부 또는 외부의 원인에 의한 전기 또는 자기적 간섭은 한 개의 메모리 비트를 자연적으로 반대 상태로 뒤집게 할 수 있습니다.이 이벤트는 원래 데이터 비트가 잘못되고 패리티 오류라고 합니다.
이러한 메모리 오류는 탐지되지 않은 경우 탐지되지 않고 결과적이지 못한 결과를 가지거나 저장된 데이터의 영구적인 손상 또는 시스템 충돌을 일으킬 수 있습니다.
메모리 패리티 오류는 소프트 패리티 오류나 하드 패리티 오류로 분류되는 많은 원인이 있습니다.
대부분의 패리티 오류는 정전기 또는 자기 관련 환경 조건에 의해 발생합니다.
메모리 칩에서 발생하는 단일 이벤트 오류의 대부분은 배경 방사선(예: 우주 광선의 중성자), 전자기 간섭(EMI) 또는 정전기 방전(ESD)으로 인해 발생합니다. 이러한 이벤트는 하나 이상의 메모리 셀의 전기 상태를 임의로 변경하거나 메모리 셀을 읽고 쓰는 데 사용되는 회로를 방해할 수 있습니다.
소프트 패리티 오류라고 하는 이러한 이벤트는 일반적으로 일시적이거나 무작위적이며 일반적으로 한 번 발생합니다.소프트 오류는 사소한 또는 심각한 것일 수 있습니다.
소프트 오류는 하드웨어 오작동으로 인한 것이 아닙니다.이는 일시적이며 드물게 SEU일 가능성이 높으며 메모리 데이터의 환경 중단으로 인해 발생합니다.
소프트 패리티 오류가 발생할 경우 영향을 받는 시스템 위치에서 발생한 최근의 환경 변경 사항을 분석합니다.소프트 패리티 오류를 일으킬 수 있는 ESD 및 EMI의 일반적인 소스는 다음과 같습니다.
다른 패리티 오류는 메모리 하드웨어의 물리적 오작동 또는 메모리 셀을 읽고 쓰는 데 사용되는 회로에 의해 발생합니다.
하드웨어 제조업체는 하드웨어 결함을 예방하고 테스트하기 위해 광범위한 조치를 취합니다.하지만 하자가 있는 것은 아니다.예를 들어, 데이터 비트를 저장하는 데 사용되는 메모리 셀의 형식이 잘못된 경우 요금이 부과되지 않거나 환경 조건에 더 취약할 수 있습니다.
마찬가지로 메모리 자체가 정상적으로 작동하지만 메모리 셀을 읽고 쓰는 데 사용되는 회로의 물리적 또는 전기적 손상은 전송 중에 데이터 비트가 변경될 수 있으므로 패리티 오류가 발생할 수 있습니다.
하드 패리티 오류라고 하는 이러한 이벤트는 일반적으로 매우 자주 반복되며 영향을 받는 메모리 또는 회로를 사용할 때마다 발생합니다.정확한 빈도는 오작동 범위와 손상된 장비의 사용 빈도에 따라 달라집니다.
하드 패리티 오류는 하드웨어 오작동의 결과이며 영향을 받는 구성 요소를 사용할 때마다 다시 발생합니다.
하드 패리티 오류가 발생하면 영향을 받는 시스템의 위치에서 발생한 물리적 변경 사항을 분석합니다.하드 패리티 오류로 이어질 수 있는 하드웨어 오작동의 일반적인 원인은 다음과 같습니다.
Cisco IOS® 소프트웨어는 다양한 패리티 오류 메시지를 제공하며, 이는 영향을 받는 구성 요소 및 시스템에 대한 상대적 영향력에 따라 달라집니다.
캐시 오류가 검색되었습니다! 실제 캐시 오류가 검색되었습니다. 시스템이 중지됩니다. 오류:기본 인스턴스 캐시, 필드:데이터, 정확하지 않은 데이터 패리티 오류 |
|
설명 | 이는 MSFC3(Multilayer Switch Feature Card 3)의 RP(Route Processor) 또는 SP(Switch Processor) CPU에서 사용되는 Level 2(L2) 캐시 내의 패리티 오류(정적 임의 액세스 메모리 또는 SRAM)로 인해 발생합니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 수퍼바이저 엔진을 교체하기 위해 RMA(Return Material Authorization)를 요청하고 모듈을 EFA(Equipment Failure Analysis)로 표시합니다. |
%SYSTEM_CONTROLLER-3-오류:발견된 오류 조건:SYSAD_PARITY_ERROR | |
설명 | 이는 MSFC3의 IBC(In-Band Controller)에서 사용하는 시스템 주소(데이터 버스)에서 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 수퍼바이저 엔진을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
%SYSTEM_CONTROLLER-3-오류:발견된 오류 조건:TM_DATA_PARITY_ERROR | |
설명 | 이는 MSFC3의 IBC에서 사용하는 테이블 관리자 데이터에 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 수퍼바이저 엔진을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
%SYSTEM_CONTROLLER-3-오류:발견된 오류 조건:TM_NPP_PARITY_ERROR | |
설명 | 이는 MSFC3의 IBC에서 사용하는 테이블 관리자 'next page pointer'에 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 수퍼바이저 엔진을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. 12.1(8)E와 12.2(33)SXI3 사이의 Cisco IOS 소프트웨어 버전에서 SYSTEM_CONTROLLER-3-ERROR 이벤트에 대한 기본 동작은 IBC를 재설정하고 오류 메시지를 기록하는 것이었습니다. 그러나 이러한 수정 조치로 인해 IBC(그리고 CPU)의 일부 문서화된 사례가 더 이상 데이터를 전송하거나 수신할 수 없게 되었습니다.따라서 Cisco IOS 소프트웨어 버전 12.2(33)SXI4 이후 동작이 변경되어 오류 메시지를 기록하고 시스템을 재설정합니다.Cisco 버그 ID CSCtf51541을 참조하십시오. |
인터럽트 예외, CPU 신호 20, PC = 0x[dec] | |
설명 | 이는 Cisco Catalyst 6700 Series 모듈에서 사용하는 CPU L2 캐시(SRAM)에서 단일 비트 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 6700 모듈을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. 12.2(33)SXI5 이전 Cisco IOS 소프트웨어 버전에서는 소프트웨어 버그(Cisco 버그 ID CSCtj06411)로 인해 단일 비트 패리티 오류도 6700 모듈을 재설정할 수 있습니다.이 문제는 Supervisor Engine 720용 버전 12.2(33)SXI6 및 12.2(33)SXJ 및 Supervisor Engine 2T용 버전 15.0SY에서 해결되었습니다. |
%SYSTEM_CONTROLLER-3-오류:발견된 오류 조건:SYSDRAM_PARITY_ERROR | |
설명 | 이는 MSFC3에서 사용하는 동기식 DRAM(SDRAM) 메모리 모듈(DIMM)에서 수정 불가능한 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하면 DIMM을 청소하고 재장착하고 계속 모니터링하십시오.오류가 계속되면 DIMM을 교체하거나 업그레이드하려면 RMA를 요청하십시오. |
%SYSTEM_CONTROLLER-3-COR_MEM_ERR:수정 가능한 DRAM 메모리 오류입니다.카운트 [dec], 로그 [16진수] | |
설명 | 이는 MSFC3에서 사용하는 SDRAM(DIMM)에서 수정 가능한 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하면 DIMM을 청소하고 재장착하고 계속 모니터링하십시오.오류가 계속되면 DIMM을 교체하거나 업그레이드하려면 RMA를 요청하십시오. |
%MWAM-DFC[dec]-0-CORRECTABLE_ECC_ERR:수정 가능한 ECC 오류가 발생했습니다. A_BUS_L2_ERRORS:0x10000, A_BUS_MEMIO_ERRORS:0x0, A_SCD_BUS_ERR_STATUS:0x80983000 | |
설명 | 6700 Series 모듈에서 사용되는 DRAM에서 단일 비트 패리티 오류가 발생한 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하면 DIMM을 청소하고 재장착하고 계속 모니터링하십시오.오류가 계속되면 DIMM을 교체하거나 업그레이드하려면 RMA를 요청하십시오. |
%PM_SCP-SP-2-LCP_FW_ERR_INFORM:모듈 [dec]에 다음 오류가 발생했습니다.Coil #[dec]에서 LTL 패리티 오류가 발견되었습니다. | |
설명 | 이는 Cisco Catalyst 6100 및 Cisco Catalyst 6300 Series 모듈에서 사용되는 SRAM의 패리티 오류의 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 6100 또는 6300 모듈을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
%SYS-4-SYS_LCPERR4:모듈 [12]:Coil #[dec]에서 LTL 패리티 오류가 감지되었습니다. | |
설명 | 이는 6100 및 6300 Series 모듈에서 사용되는 SRAM의 패리티 오류의 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 6100 또는 6300 모듈을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
%PM_SCP-SP-2-LCP_FW_ERR_INFORM:모듈 [dec]에 다음 오류가 발생했습니다.포트 [dec]에서 포트 ASIC([name]) 패킷 버퍼 오류가 감지되었습니다. | |
설명 | 이는 Cisco Catalyst 6148A Series Ethernet 모듈에서 사용되는 포트 ASIC 패킷 버퍼(SRAM)의 패리티 오류의 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 6148A 모듈을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
%LTL-SP-2-LTL_PARITY_CHECK:0x[hex]에 대한 LTL 패리티 검사 요청] | |
설명 | 이는 Catalyst 6100-6500 및 6700 Series 모듈에서 사용되는 포트 ASIC 포트 인덱스 테이블(SRAM)의 패리티 오류의 결과입니다. |
권장 사항 | 시스템을 정기적으로 모니터링하여 재발생하는지 확인합니다.추가 이벤트가 관찰되지 않으면 소프트 오류입니다.오류가 자주 발생하는 경우 모듈을 교체하기 위해 RMA를 요청하고 모듈을 EFA로 표시합니다. |
오류 메시지의 포괄적인 목록은 다음 Cisco IOS 소프트웨어 문서를 참조하십시오.
Output Interpreter 도구(등록된 고객만 해당)는 특정 show 명령을 지원합니다.show 명령 출력의 분석을 보려면 [출력 인터프리터 도구]를 사용합니다.
패리티 오류 필드에 대한 조사가 진행 중이며, 모든 시나리오를 해결할 수는 없지만, Cisco Catalyst 6500 하드웨어 및 소프트웨어 개발 조직은 패리티 오류의 발생을 최소화하고 완화할 수 있도록 ECC(Error-Correcting Code) 보호 등의 새로운 방법을 계속해서 도입하고 있습니다.
이 문서에서는 Catalyst 6500 제품의 3세대(WS-XSUP720 및 초기 6700 Series)에 대한 논의로 시작되었지만, 4세대(VS-S720-10G 및 이후 6700 Series) 및 5세대(VS-SUP2T-10G 및 609000 Series)로 도입된 개선 사항을 요약합니다. ).
VS-S720-10G 모듈은 새로운 MSFC3 부속 보드를 제공하며, 각각 600Mhz에서 작동하는 새로운 IBC 및 업데이트된 SR7010A RISC(Reduced Instruction Set Computing) RP 및 SP CPU를 제공합니다.레벨 1(L1), L2 및 레벨 3(L3) 캐시는 패리티 탐지를 지원합니다.최신 IBC는 이전 세대의 모든 기능을 포함하며 연결된 SRAM에 ECC 보호(단일 비트 수정, 다중 비트 탐지)를 추가합니다.
6700 Series 모듈은 ECC로 보호되는 L2 캐시(L1 캐시는 패리티 탐지 지원)를 사용하는 CPU를 지원하므로 재설정할 필요 없이 단일 비트 패리티 오류를 수정할 수 있습니다.그러나 Cisco 버그 ID CSCsz39222로 인해 단일 비트 CPU 캐시 패리티 오류가 발생할 경우 Cisco IOS 소프트웨어(Supervisor Engine 720)의 버전 12.2SXI가 모듈을 재설정합니다.이는 Cisco IOS 소프트웨어의 버전 12.2SXJ(Supervisor Engine 720) 및 15.0SY(Supervisor Engine 2T)에서 해결됩니다.
VS-SUP2T-10G는 통합 IBC와 새로운 단일 듀얼 코어 MPC8572 PPC RP CPU(ECC 보호 L2 및 L3 캐시, L1 캐시는 패리티 탐지 지원)를 갖춘 새로운 MSFC5 도터보드를 코어당 1.5Ghz에서 작동합니다.또한 별도의 새로운 CMP(Out-of-Band Connectivity Management Processor) CPU와 ECC 보호 DRAM을 갖추고 있으며, 이는 RP CPU를 현재 사용할 수 없는 경우에도 사용할 수 있습니다.
새로운 IBC는 이전 세대의 모든 기능을 포함하며 연결된 SRAM에 대한 ECC 보호 및 패리티 오류 처리 개선을 지원합니다.새로운 MSFC5에는 모든 모듈 초기화 및 진단 이벤트를 저장하는 OBFL(Onboard Failure Logging) ROM도 포함되어 있습니다.새로운 단일 CPU 설계는 패리티 오류 이벤트의 통계적 가능성을 줄여줍니다.
6900 Series 모듈은 ECC로 보호되는 L1 및 L2 캐시를 사용하는 새로운 CPU를 지원하므로 재설정할 필요 없이 단일 비트 패리티 오류를 수정할 수 있습니다.새로운 세대는 동일한 IBC를 지원하며, 단일 비트 패리티 오류 수정을 위한 소프트웨어 처리가 통합되었습니다.
MSFC3가 포함된 VS-S720-10G는 266Mhz에서 작동하는 ECC 보호 기능이 포함된 DDR(double-data-rate) SDRAM을 지원합니다.
6700 Series 모듈은 266Mhz에서 작동하는 ECC 보호 기능이 포함된 DDR SDRAM을 지원합니다.
DDR SDRAM 인터페이스는 SDR(Single-Data-rate) SDRAM과 달리 전기 데이터 및 클럭 신호의 타이밍을 더욱 엄격하게 제어하여 전송 속도를 높일 수 있습니다.DDR 인터페이스는 클럭 주파수를 낮추기 위해 이중 펌핑(클럭 신호의 상승과 낙하 가장자리 모두에서 데이터 전송)을 사용합니다.클럭 주파수가 낮을수록 메모리를 컨트롤러에 연결하는 회로 기판의 신호 무결성 요구 사항이 줄어듭니다.
MSFC5가 포함된 VS-SUP2T-10G는 667Mhz에서 작동하는 ECC 보호 기능이 포함된 DDR3 SDRAM을 지원합니다.
6900 Series 모듈은 667Mhz에서 작동하는 ECC 보호 기능이 포함된 DDR3 SDRAM을 지원합니다.
DDR3 SDRAM의 직접적인 이전 제품(DDR2 및 DDR)보다 뛰어난 이점은 내부 메모리 어레이의 8배 빠른 속도로 데이터를 전송할 수 있기 때문에 대역폭이 높거나 데이터 속도가 빠를 수 있다는 것입니다.DDR3 메모리는 DDR 및 DDR2와 동일한 전기 신호 표준을 사용하더라도 전력 소비량을 30% 줄입니다.
PFC3C를 사용하는 VS-S720-10G는 ECC 보호 기능을 갖춘 SRAM 패킷 버퍼를 제공합니다.이렇게 하면 모듈 재설정 없이 단일 비트 패리티 오류 수정 및 다중 비트 패리티 오류 감지 기능이 제공됩니다.
DFC3C가 포함된 6700 Series는 ECC 보호 기능을 갖춘 SRAM 패킷 버퍼를 제공합니다.이렇게 하면 모듈 재설정 없이 단일 비트 패리티 오류 수정 및 다중 비트 패리티 오류 감지 기능이 제공됩니다.
PFC4가 포함된 VS-SUP2T-10G는 ECC 보호 기능을 갖춘 SRAM 패킷 버퍼를 제공합니다.이렇게 하면 모듈 재설정 없이 단일 비트 패리티 오류 수정 및 다중 비트 패리티 오류 감지 기능이 제공됩니다.
DFC4가 포함된 6900 Series는 ECC 보호 기능을 갖춘 SRAM 패킷 버퍼를 제공합니다.이렇게 하면 모듈 재설정 없이 단일 비트 패리티 오류 수정 및 다중 비트 패리티 오류 감지 기능이 제공됩니다.
Cisco IOS 소프트웨어는 ECC 보호를 지원하도록 설계되었습니다.ECC 보호를 지원하는 하드웨어 구성 요소에 SEU가 발생하는 경우 코드는 손상된 데이터를 수정하거나 영향을 받는 구성 요소를 재설정해야 하며 영향을 받는 모듈의 전체 하드웨어 재설정이 필요하지 않습니다.
그러나 이전 버전의 Cisco IOS 소프트웨어에서는 소프트웨어 버그로 인해 동작이 의도적으로 변경되었거나 오류가 발생한 몇 가지 예외가 있습니다.여기에는 두 가지 주목할 만한 예외가 있습니다.
12.1(8)E와 12.2(33)SXI3 사이의 Cisco IOS 소프트웨어 버전에서 SEU SYSTEM_CONTROLLER-3-ERROR 이벤트에 대한 기본 동작은 IBC를 재설정하고 오류 메시지를 로깅하는 것이었습니다.그러나 이러한 수정 조치로 인해 IBC(그리고 CPU)의 일부 문서화된 사례가 더 이상 데이터를 전송하거나 수신할 수 없게 되었습니다.
따라서 Version 12.2(33)SXI4(Cisco 버그 ID CSCtf51541) 이후 오류 메시지를 기록하고 시스템을 재설정하기 위해 동작이 변경되었습니다.이러한 반응이 더 심각한 것처럼 보일 수 있지만 시스템이 응답하지 않는 것보다는 시스템을 재설정하고 메모리 구조를 수정하는 것이 좋습니다.
현재 개발 중인 기능(Cisco 버그 ID CSCtr89859)은 기본 동작을 전환할 수 있는 새로운 CLI(command-line interface) 명령을 추가합니다.이러한 개선 사항은 단일 수퍼바이저를 사용하므로 수퍼바이저 이중화가 없는 시스템에 가장 적합합니다.
12.2(33)SXI5 이전 Cisco IOS 소프트웨어 버전에서는 소프트웨어 버그(Cisco 버그 ID CSCtj06411)로 인해 단일 비트 패리티 오류도 6700 모듈을 재설정할 수 있습니다.이는 일반적으로 수정 가능한 패리티 오류이며 모듈을 재설정할 필요가 없습니다.
이 버그는 Supervisor Engine 720용 버전 12.2(33)SXI6+ 및 12.2SXJ, Supervisor Engine 2T용 버전 15.0SY에서 해결되었습니다.적절한 버전으로 업그레이드한 후 6700 모듈은 오류 메시지를 기록하고 계속 작동합니다.
이 시점에서는 소프트 또는 하드 패리티 오류가 발생했는지 확인했을 것입니다.단일 인시던트를 해결할 수 있지만 다른 패리티 오류 취약성은 여전히 존재할 수 있으므로 전체 네트워크에 대해 보다 포괄적인 접근 방식을 취해야 합니다.
따라서 Cisco와 Catalyst 6500 사업부는 이러한 완화 절차를 검토하고 향후 패리티 오류를 제거하거나 줄이기 위해 적절한 시정 조치를 취할 것을 권장합니다.
단일 이벤트(소프트) 패리티 오류는 환경 조건에 의해 발생하며 한 번만(SEU) 또는 매우 드물게 발생(예: 월 또는 연간)하드웨어를 교체할 필요는 없지만 향후 발생하는 문제를 완화하고자 합니다.
이러한 모범 사례는 소프트 패리티 오류의 가능성을 크게 줄입니다.
Cisco에서는 영향을 받는 네트워크 위치에 대한 환경 감사를 수행하는 것이 좋습니다.직접 또는 Cisco 담당자, Cisco 팀(예: Cisco Advanced Services) 또는 타사 컨설턴트를 통해 이 감사를 수행할 수 있습니다.
환경 감사의 정확한 범위와 복잡성은 지리적 위치, 건물 및 공간 크기 및 설계, 전기 설계 및 레이아웃, 기타 관련 요소 등 다양한 변수에 따라 달라집니다.
ESD와 EMI의 환경 소스가 네트워크 또는 그 주변에 존재할 수 있는 것을 고려하십시오.다음은 소프트 패리티 오류로 이어질 수 있는 간섭 소스입니다.
SEU는 전원 공급 장치, 전원 생성기 또는 조명 시스템이 섀시와 너무 가깝거나 여러 전원 케이블이 섀시에 있거나 섀시 옆에 있을 경우 발생할 수 있습니다.
Catalyst 6500 섀시와 이러한 전기 및 마그네틱 소스 간에 적절한 거리를 제공하는 것이 중요합니다.권장 거리는 구성 요소에 따라 다르며 구성 요소 데이터시트에서 사용할 수 있습니다.
일반적으로 Cisco는 일반적인 전기 및 마그네틱 간섭원에서 최소 3~6인치 정도의 시스템을 찾는 것을 권장합니다.전원 케이블은 가능한 경우 섀시에서 아래로 또는 멀리 라우팅해야 하며, 섀시의 전체 또는 옆에 빽빽하게 채워진 번들이나 많은 숫자로 배치해서는 안 됩니다.
전력 변동 및 전력 과전도는 비교적 일반적이며, Catalyst 6500 전원 공급 장치는 전압 전류의 사소한 변화를 수용하도록 설계되었습니다.
그러나 섀시 및 랙에 적절한 전기 접지를 제공하여 초과 전압이 시스템에서 분리되도록 해야 합니다.적절한 접지가 없으면 여러 ASIC 및 메모리 구성 요소에 손상 또는 오작동이 발생할 수 있습니다.자세한 내용은 Catalyst 6500 Series 스위치 설치 가이드, 스위치 설치, 시스템 접지 설정을 참조하십시오.
ESD는 눈에 보이는 손상 없이 중요한 구성 요소를 쉽게 손상시킬 수 있습니다.연구실 운영에 적절한 예방 조치를 취하되, 편법과 감독 제한 때문에 자주 간과되고 있다.
Cisco는 랩 운영 관리(Lab Operations Management)를 Cisco Systems와 함께 모든 네트워크 영역에 대한 환경 감사를 실시하거나, 하드웨어 장애가 발생했거나 미션 크리티컬 분야로 지정된 모든 영역에 대해 최소한 환경 감사를 실시할 것을 권장합니다.감사가 완료되면 향후 SEU 패리티 이벤트를 방지하기 위해 새로 설치된 모든 시스템에 대해 표준화된 환경 체크리스트를 구현하는 것이 좋습니다.
Catalyst 하드웨어 구성 요소는 펌웨어(Rommon이라고도 함) 코드를 사용하여 진단을 초기화, 통신 및 실행합니다.이러한 기능이 완료되면 시스템 작업이 Cisco IOS 소프트웨어로 전환됩니다.펌웨어에 문제가 발생하는 경우는 드물지만 수퍼바이저와 모듈에 대해 다른 버전의 펌웨어 코드를 사용하는 경우 문제가 발생할 수 있습니다.
따라서 올바른 모듈 초기화 및 통신을 보장하기 위해 모든 구성 요소에서 최신 펌웨어 코드를 사용하도록 하는 것이 좋습니다.Cisco는 운영 관리에서 네트워크 감사를 수행하고 최신 펌웨어 버전으로 모든 하드웨어 구성 요소를 업그레이드할 것을 권장합니다.
알려진 펌웨어 문제 및 업그레이드 절차는 다음과 같습니다.
Cisco 웹 사이트에서 최신 펌웨어 버전을 다운로드합니다.
모든 모듈형 네트워킹 시스템은 물리적 인터페이스 핀 세트로 섀시 백플레인에 삽입하도록 설계되었습니다.섀시 백플레인 자체는 기본적으로 연결된 일련의 와이어입니다.각 섀시 슬롯의 핀은 수퍼바이저와 이더넷 모듈 간의 물리적 데이터 연결을 형성합니다.따라서 이러한 핀의 적절한 삽입과 정렬이 중요합니다.
Catalyst 6500은 섀시의 설치를 지원하는 가이드 레일 및 정렬 핀을 제공합니다.슬롯 핀(소켓) 및 모듈 커넥터는 쉽게 연결하고 고대역폭 지원 전기 연결을 제공하도록 설계되었습니다.섀시에 삽입되면 모듈 양쪽에 백플레인 핀을 완전히 연결하는 엄지 나사가 있습니다.Catalyst 6500 Series Switch Module 설치 참고 사항을 참조하십시오.
모듈이 슬롯에 제대로 삽입되어 있고 엄지 나사가 올바르게 조여졌다면 통신 문제가 발생하지 않을 것입니다.그러나 모듈을 매일 삽입하면 잘못된 핀 삽입이나 불완전한 핀 삽입으로 이어질 수 있는 몇 가지 조건이 발생할 수 있습니다.
프로덕션 환경의 모든 Catalyst 6500 모듈에서 엄지 나사를 사용해야 하는 작업 관리 프로세스를 구현하는 것이 좋습니다.따라서 백플레인 핀이 제대로 삽입되고 완전히 정렬되며 비트 오류 및 관련 통신 장애로 인한 향후 오류를 방지할 수 있습니다.
자주 또는 반복 가능한(하드) 패리티 오류는 메모리 또는 읽기 및 쓰기에 사용되는 회로의 물리적 오작동으로 인해 발생합니다.이 경우 하드웨어를 교체하고 Cisco TAC(Technical Assistance Center) 또는 Cisco Systems Engineer에게 반품된 하드웨어에 대한 EFA를 수행하도록 요청합니다.
이러한 모범 사례는 하드 패리티 오류의 가능성을 크게 줄입니다.
영향을 받는 네트워크 위치에 대한 네트워크 감사를 수행하는 것이 좋습니다.직접 또는 Cisco 담당자, Cisco 팀(예: Cisco Advanced Services) 또는 타사 컨설턴트를 통해 이 감사를 수행할 수 있습니다.
모든 공급업체의 모든 하드웨어는 결국 물리적 무결성이 저하될 수 있으며, 시간이 지남에 따라 구성 요소에 장애가 발생할 가능성을 완전히 파악하려면 네트워크의 모든 하드웨어 구성 요소의 수명 주기를 추적하는 것이 중요합니다.
하드웨어 신뢰성은 MTBF(Mean Time Between Failure) 프레임워크로 측정할 수 있습니다.MTBF는 통계 평균이므로 MTBF 기간이 끝날 때 반드시 장애가 발생한다는 의미는 아닙니다.그러나 구성 요소 장애의 가능성 및 취약성이 증가하므로 이러한 하드웨어는 새로 고침을 위해 플래그되어야 합니다.각 Catalyst 6500 제품에 대한 특정 MTBF 값은 Cisco Catalyst 6500 Series Switches 데이터 시트를 참조하십시오.
집계된 Catalyst 6500 'system-level' MTBF 값은 > 7년입니다.
Cisco는 MTBF 프레임워크 외에도 특정 제품의 예상 수명 주기를 정의하고 레거시 장비를 교체할 수 있도록 적용 가능한 공지를 제공하는 EOL(End-of-Life) 프레임워크를 제공합니다.다양한 레거시 Catalyst 6500 제품에 대한 End-of-Life 및 End-of-Sale 공지를 참조하십시오.
이 하드웨어 감사 결과, Cisco는 교체 가능성이 있는 하드웨어를 식별하고 추적하는 MTBF 및 EOL 프로세스를 구현하는 것이 좋습니다.이를 통해 최신 하드웨어가 실행되고 있으며 하드웨어 오작동 가능성을 최소화할 수 있습니다.
Catalyst 6500 Series 및 Cisco IOS 소프트웨어는 시스템에 사용되는 모든 하드웨어 구성 요소에 대해 GOLD(Generic Online Diagnostics) 및 HM(Health Monitoring) 진단을 제공합니다.활성화할 수 있는 두 가지 기본 진단 유형은 온디맨드 및 부팅입니다.자세한 내용은 Cisco Catalyst 6500 Series 스위치의 일반 온라인 진단을 참조하십시오.
모든 진단 테스트를 실행하고 부팅 시 모든 하드웨어 구성 요소가 예상대로 작동하는지 확인하기 위해 모든 하드웨어 구성 요소에 대해 '완료' 부팅 진단을 활성화하는 것이 좋습니다.
또한 주요 인프라 구성 요소에 대한 정기적인 온디맨드 진단 일정을 매일 또는 매주 예약할 것을 권장합니다.초기화 동안에만 발생하는 부팅 진단 외에 온디맨드 진단 기능을 통해 하드웨어가 예상대로 계속 작동하도록 합니다.자세한 내용은 Catalyst 6500 릴리스 12.2SX 소프트웨어 구성 설명서, 인터페이스 및 하드웨어 구성 요소, 온라인 진단을 참조하십시오.
기본 온디맨드 진단 테스트 외에도, Cisco에서는 이러한 온디맨드 진단 테스트를 활성화하여 오작동할 수 있는 메모리 구성 요소를 사전에 식별할 것을 권장합니다.