소개
이 문서에서는 server power state-MC 오류로 인해 블레이드를 검색하지 못하는 문제를 해결하는 단계를 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 다음 항목에 대한 실무 지식을 갖춘 것을 권장합니다.
- Cisco UCS(Unified Computing System)
- Cisco FI(Fabric Interconnect)
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
배경 정보
- 블레이드 펌웨어 업그레이드, 가동 시간 정책 재부팅 후 서버가 다운되었습니다.
- 데이터 센터의 일부 전력 이벤트.
위와 같은 것이 그 문제의 가능한 계기가 될 수 있을 것이다.
문제
이 오류 메시지는 재부팅 시 또는 검색 중에 발생합니다.
"블레이드 전원 상태를 변경할 수 없습니다."
UCSM에서 전원을 켜지 못한 블레이드에 대해 이 알림을 보고합니다.
펌웨어 업그레이드 또는 기타 유지 보수의 일환으로 블레이드가 리부팅되면서 FSM에서 아래 메시지가 포함된 발견/턴업이 실패함:
"서버 전원 상태를 변경할 수 없음-MC 오류(-20): 관리 컨트롤러가 요청을 처리할 수 없거나 실패했습니다(sam:dme:ComputePhysicalTurnup:Execute)."
SEL 로그에 아래와 같은 오류 항목이 표시됩니다.
CIMC | 플랫폼 알림 POWER_ON_FAIL #0xde | 예측 실패 선언됨 | 설정 취소됨
CIMC | 플랫폼 알림 POWER_ON_FAIL #0xde | 예측 실패 선언됨 | 어설션
문제 해결
UCSM CLI 셸에서 블레이드의 cimc에 연결하고 power 명령을 사용하여 블레이드 전력 상태를 확인합니다
- ssh FI-IP-ADDR
- cimc X 연결
- 전력
Failure Scenario # 1
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ active ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
Failure Scenario #2
OP:[ status ]
Power-State: [ off ]
VDD-Power-Good: [ inactive ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ permanent lock ] <<<----------------
Power-System-Status: [ Bad ] <<<---------------
Front-Panel Power Button: [ Disabled ]
Front-Panel Reset Button: [ Disabled ]
OP-CCODE:[ Success ]
작업 시나리오 번호의 출력
[ help ]# power
OP:[ status ]
Power-State: [ on ]
VDD-Power-Good: [ active ]
Power-On-Fail: [ inactive ]
Power-Ctrl-Lock: [ unlocked ]
Power-System-Status: [ Good ]
Front-Panel Power Button: [ Enabled ]
Front-Panel Reset Button: [ Enabled ]
OP-CCODE:[ Success ]
[ power ]#
센서 값 # 확인
POWER_ON_FAIL | 디스크 -> | 분리되 | 0x0200 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | >>> 휴무 중
센서 값 번호
POWER_ON_FAIL | 디스크 -> | 분리되 | 0x0100 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | 해당 없음 | >>>> 작업 중
센서 명령을 실행하고 전원 및 전압 센서의 값을 확인합니다. 블레이드의 전원이 켜진 상태와 동일한 모델의 출력을 비교합니다.
특정 센서의 Reading(읽기) 또는 Status(상태) 열이 NA이면 항상 하드웨어 오류가 아닐 수 있습니다.
로그 스니펫 번호
Sel.log#
CIMC | 플랫폼 알림 POWER_ON_FAIL #0xde | 예측 실패 선언됨 | 어설션
power-on-fail.hist(tmp/techsupport_pidXXXX/CIMCX_TechSupport-nvram.tar.gz 내부)
위 사항이 도움이 되지 않을 경우 다음 단계로 UCSM 및 섀시 techsupport 로그 번들을 수집합니다.
문제를 더 자세히 조사하는 데 도움이 됩니다.
앞에서 언급한 증상과 함께 이 단계를 수행하여 문제를 복구하십시오.
1단계: 블레이드 FSM 상태가 "Failed(실패)"이고 설명이 "state-MC Error(-20)"인지 확인합니다.
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y) > FSM으로 이동합니다.
2단계: 영향을 받은 블레이드 일련 번호를 기록하고 블레이드를 해제합니다.
<< IMP: 해제하기 전에 General(일반) 탭에서 문제 블레이드 일련 번호를 기록해 두십시오. 이후 단계(4단계 >>)에서 필요합니다.
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y) > General(일반) > Server Maintenance(서버 유지 관리) > Decommission(서비스 해제) > Ok(확인)로 이동합니다.
3단계. FI-A/B# 재설정 슬롯 x/y
예를 들어 #Chassis2-Server 1이 영향을 받습니다.
FI-A# 재설정 슬롯 2/1
위 명령을 실행한 후 30-40초 동안 기다립니다.
4단계: 서비스 해제된 블레이드를 재지정합니다.
Equipment(장비) > Decommissioned(서비스 해제됨) > Servers(서버) > Look for the server we decommisated(서비스 해제되기 전에 Step-2(2단계에서 일련 번호가 표시된 올바른 블레이드 찾기) > Check Recommission Tick box agents against correct Blade(Validate with Serial number) > Save Changes(변경 사항 저장)로 이동합니다.
5단계: 관찰된 경우 슬롯 확인
Equipment(장비) > Chassis X(섀시 X) > Server Y(서버 Y)로 이동합니다.
다시 실행한 블레이드에 대해 "Resolve Slot Issue(슬롯 문제 해결)" 팝업이 표시되면 일련 번호를 확인하고 "here"를 클릭하여 슬롯의 서버를 수락합니다.
블레이드 검색을 지금 시작해야 합니다.
서버 검색이 완료될 때까지 기다립니다. Server FSM(서버 FSM) 탭의 진행 상태를 모니터링합니다.
6단계. 1~5단계에서 문제가 발생하지 않고 FSM에서 다시 장애가 발생하면 블레이드를 분리하고 물리적으로 재장착을 시도합니다.
하드웨어 문제인 경우 아직 서버에서 Cisco TAC에 연결할 수 없는 경우
NOTE: If you have B200 M4 blade and notice failure scenario #2 , please refer following bug and Contact TAC
CSCuv90289
B200 M4 fails to power on due to POWER_SYS_FLT
관련 정보
섀시 검색 절차
UCSM 서버 관리 가이드