소개
이 문서에서는 Aggregation Services Router 903(ASR903)에서 일반적으로 나타나는 하드웨어 장애 증상 및 문제 해결 방법을 분석하는 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 이러한 주제에 대한 기본적인 지식을 얻을 것을 권장합니다.
- Cisco IOS-XE 소프트웨어
- ASR 903 CLI
사용되는 구성 요소
이 문서의 정보는 장애 증상이 관찰된 특정 랩 환경의 디바이스에서 생성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다
개요
Cisco ASR 903 라우터는 통합된 모바일 및 비즈니스 서비스를 비용 효율적으로 제공하기 위해 설계된 완전한 기능을 갖춘 통합 플랫폼입니다. 이 컴팩트한 3RU(Rack-Unit) 라우터는 낮은 깊이와 낮은 전력 소비량과 확장된 온도 범위를 통해 높은 서비스 확장성, 전체 이중화 및 유연한 하드웨어 구성을 제공합니다. Cisco ASR 903 라우터는 IP Radio Access Network(RAN) 또는 어그리게이션 네트워크에서 사전 어그리게이션 라우터로 포지셔닝됩니다. Carrier Ethernet 네트워크.
이 플랫폼은 아래 그림과 같이 다음과 같은 주요 FRU(Field Replaceable Unit)로 구성됩니다.
레이블 |
구성 요소 |
1 |
인터페이스 모듈(IM) |
2 |
RSP(Route Switch Processor) 유닛 슬롯 2개RSP1A-55, RSP1B-55, RSP2A-64 및 RSP2A-128 지원 |
3 |
팬 트레이 |
4 |
예비 DC 전원 장치 |
정상 작동 시 FRU(Field Replaceable Unit)는 장애 증상을 나타낼 수 있습니다.하드웨어 오류가 아닐 수도 있는 하드웨어 구성 요소를 교체하는 경우가 많습니다. 특정 문제 해결 기술을 통해 이러한 모듈을 장애 상태에서 복구하여 네트워크 다운타임을 줄일 수 있습니다.
문제 해결
DC 전원 공급 장치(A900-PWR550-D)에서 보고된 장애
- 멀티미터를 사용하여 DC PSU(전원 공급 장치) 커넥터에서 입력 DC 전압을 측정하여 전원을 확인합니다.24V ~ 60V 범위여야 합니다.
- 입력 전압 판독이 정상이면 패널에 있는 LED의 상태를 확인합니다('Input Ok' 및 'Output Fail'). 두 LED가 모두 꺼져 있는 경우 DC PSU를 교체합니다.
- 'Input OK' LED가 녹색이지만 'output Fail' LED가 주황색/빨간색인 경우 먼저 입력 전원 커넥터를 제거한 다음 전체 DC PSU를 꺼냅니다.15초 동안 기다립니다.DC PSU를 다시 넣고 입력 전원 커넥터를 연결합니다.이 연습은 DC PSU 모두에 대해 수행해야 합니다(시스템에 DC PSU가 2개 있는 경우).
- 'Input OK' LED가 녹색이고 'output FAIL' LED가 전혀 켜지지 않으면 DC PSU를 교체합니다.
참고:단일 전원 공급 장치로 라우터를 작동할 수 있습니다.전원을 켜지 않은 경우 보조 전원 공급 장치를 물리적으로 삽입해야 합니다.
팬 트레이에서 보고된 오류
Cisco ASR 903 라우터는 전원 공급 장치와 분리된 모듈형 팬 트레이를 사용합니다.팬 트레이에는 12개의 팬이 포함되어 있으며 팬 장애가 발생하더라도 작동을 유지할 수 있는 충분한 용량을 제공합니다.라우터가 사용되는 환경에 따라 두 가지 유형의 팬 트레이 모듈(A903-FAN 및 A903-FAN-E)이 있습니다.후자(A903-FAN-E)에는 8mm 팬 먼지 필터가 포함되어 있어 먼지가 장치에 들어가지 않고 구성 요소의 손상 가능성을 방지합니다.
시나리오 1:트레이의 개별 팬 모듈에 장애가 발생했습니다.
트레이에 있는 팬의 상태를 확인하려면 "show platform" 또는 "show facility-alarm status" 명령을 사용합니다.팬 장애가 발생하면 장애가 발생한 개별 유닛의 세부사항과 함께 팬 트레이 상태가 "실패"로 표시됩니다.
ASR903#
show platform | in FAN|State
Chassis type: ASR-903
Slot Type State Insert time (ago)
P2 A903-FAN-E
f2, f4, f6, fail
05:00:00
[an error occurred while processing this directive]
ASR903#
sh facility-alarm status
System Totals Critical: 1 Major: 3 Minor: 0
Source Severity Description [Index]
Fan Tray CRITICAL Multiple Fan Failures [2]
Fan Tray MAJOR Fan 2 Failure [5]
Fan Tray MAJOR Fan 4 Failure [7]
Fan Tray MAJOR Fan 6 Failure [9]
[an error occurred while processing this directive]
이러한 출력에는 슬롯 f2, f4 및 f6의 팬 모듈이 실패하여 교체해야 한다는 내용이 나와 있습니다.
시나리오 2:팬 트레이가 "알 수 없음"으로 보고됨
경우에 따라 팬 트레이가 "show platform" 출력에서 "Unknown(알 수 없음)"으로 보고되고 NMS(Network Management System) 스테이션에서 경보를 생성할 수도 있습니다.
ASR903#
sh platform | in P2
Chassis type: ASR-903
Slot Type State Insert Time (ago)
P2 Unknown N/A never
[an error occurred while processing this directive]
모듈을 복구하는 데 도움이 되는 다음 단계를 수행합니다.
- FAN 모듈을 물리적으로 재장착합니다.팬 트레이를 제거하거나 교체한 후 시스템이 다시 초기화될 때까지 최소 2분이 걸립니다.먼지 필터와 함께 "A903-FAN-E" 모델을 사용하는 경우, 필터를 청소하여 FAN 모듈을 잠그지 않도록 하십시오.
- 라우터의 전원 주기를 수행하고 FAN 트레이가 탐지되었는지 확인합니다.
- FAN 트레이가 여전히 "알 수 없음"으로 보고되고 있는 경우 문제를 해결하려면 교체해야 할 수 있습니다.
참고:CSCuu75796에 설명되어 있는 알려진 외관 결함은 있으며 FAN tray는 unknown으로 보고됩니다.오류 메시지를 방지하려면 팬 트레이를 제거하거나 교체한 후 시스템이 다시 초기화될 때까지 최소 2분 정도 기다립니다.
RSP에서 보고된 오류
시나리오 1: RSP가 알 수 없음으로 보고됨
ASR903#
show platform | in R1
Chassis type: ASR-903
Slot Type State Insert Time (ago)
R1 A903-RSP1B-55 unknown 1d01h
[an error occurred while processing this directive]
- "hw-module slot R1 reload" 명령을 실행하고 프로세서가 초기화 중인지 확인합니다.
- 스탠바이 RSP가 "init,standby" 상태로 전환하지 않고 "booting"과 "unknown" 상태를 전환하면 대부분 로컬 bootflash에서 IOS-XE 이미지가 없기 때문입니다.
- 유효한 IOS-XE 이미지가 있는 USB 플래시 드라이브를 사용하여 RSP를 부팅합니다.모듈이 "알 수 없음" 상태인 경우 모듈의 물리적 재설치를 수행합니다.
- 위의 모든 단계가 실패하면 RSP 모듈에서 콘솔 로그를 수집하고 TAC에서 서비스 요청을 엽니다.
시나리오 2: 스탠바이 RSP는 "booting"과 "init,standby" 상태를 전환합니다.
스탠바이 RSP 모듈에서 이 동작을 보여 주는 일반적인 이유 중 하나는 액티브 RSP와 스탠바이 RSP 간의 컨피그레이션 동기화 장애 때문입니다.다음 명령을 실행하여 이를 확인해야 합니다.
ASR903#show redundancy config-sync failures bem
ASR903#show redundancy config-sync failures mcl
ASR903#show redundancy config-sync failures prc
[an error occurred while processing this directive]
위의 명령에서 보고된 오류가 있는 경우 다음 해결 방법을 구현하고 RSP가 UP를 유지하고 있는지 확인합니다.
ASR903# config terminal
ASR903config)#redundancy
ASR903(config)#mode sso
ASR903(config-red)#no policy config-sync lbl prc reload
ASR903config-red)#no policy config-sync bulk prc reload
ASR903(config-red)#end
[an error occurred while processing this directive]
RSP 모듈이 계속해서 부팅 루프에 남아 있는 경우 디바이스 로그에서 아래에 표시된 링크 오류를 확인합니다.대답이 "예"인 경우 물리적 재장착 시 문제가 해결되지 않으면 RSP 모듈을 교체해야 할 수 있습니다.
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel: pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive]
IM(Interface Module)을 초기화하지 못했습니다.
모듈이 설치되면 IM은 특정 상태(서비스 중지->삽입->부팅->확인)를 통해 전환됩니다. 사용 가능한 슬롯 6개 중 하나에서 IM(Interface Module)이 부팅 상태를 지나 장애가 발생한 경우 다음 단계를 수행하십시오.
ASR903#sh platform
Chassis type: ASR-903
Slot Type State Insert Time (ago)
0/4 A900-IMA8S inserted/unkown 00:27:02 (physical)
[an error occurred while processing this directive]
- "hw-module subslot <slot/subslot> reload" 명령을 사용하여 영향받는 모듈을 다시 로드합니다.모듈이 복구되었는지 확인합니다.
ASR903#hw-module subslot 0/1 reload
Proceed with reload of module? [confirm]
%IOSXE_OIR-6-SOFT_RELOADSPA: SPA(A900-IMA1X) reloaded on subslot 0/1
[an error occurred while processing this directive]
- 모듈을 동일한 슬롯에 물리적으로 재장착합니다.모듈이 "unknown(알 수 없음)"으로 유지되면 다른 슬롯에 모듈을 삽입하여 섀시의 잘못된 라인 카드 슬롯을 제외합니다.
- 로그를 관찰하고 아래에 표시된 대로 커널/링크 오류를 확인합니다.
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Link Training Error occurs
%IOSXE-3-PLATFORM: R0/0: kernel:pciehp 0000:02:07.0:pcie24: Failed to check link status
[an error occurred while processing this directive] "링크 교육" 오류는 기본적으로 특정 슬롯에 대한 PCIe(Peripheral Component Interconnect Express) 버스 상의 통신 오류가 있음을 의미합니다.PCIe 핫 플러그 모듈은 RSP 엔진에서 호스팅됩니다.모듈이 스탠바이 RSP(Route-Switch Processor)의 PCIe 버스에 등록되도록 RSP 스위치오버를 수행합니다. 스위치오버 후 모듈이 복구되면 이전 활성 RSP 모듈을 교체해야 합니다.
ASR903#redundancy force-switchover
Proceed with switchover to standby RP? [confirm]
[an error occurred while processing this directive]
참고:자세한 내용은 Cisco TAC(Technical Assistance Center)에서 서비스 요청을 열어 트러블슈팅 및 라우터의 'show tech-support' 출력을 확인하십시오.