소개
이 문서에서는 Intersight를 통한 Hyperflex 클러스터 구축의 일반적인 트러블슈팅 시나리오에 대해 설명합니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
- Intersight
- Hyperflex 클러스터 구축
사용되는 구성 요소
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
배경 정보
Intersight 설치 관리자 워크플로는 차트에 표시된 작업을 따라 hyperflex 클러스터를 배포합니다.
작업 이름 |
정의 |
준비 사전 클러스터 정보 작업 |
클러스터를 배포하는 데 필요한 정보가 포함된 구성 파일을 생성합니다(예: 구성 파일 경로, 소프트웨어 YAML 파일). |
서버구성검증작업 |
UCS 서버 컨피그레이션을 검증하여 필요한 하드웨어 및 펌웨어 컨피그레이션(예: 디스크 크기/PID 검증, 올바른 NIC 등)이 있는지 확인합니다. |
사전 구성검증작업 |
서버 컨피그레이션이 시작되기 전에 네트워크 컨피그레이션을 검증합니다(예: DNS, NTP, vCenter 도달 가능성, 중복 IP 확인). |
로컬 이미지 준비 작업 |
로컬 이미지 저장소에 소프트웨어 이미지(컨트롤러 VM OVA, hxdp 패키지)를 다운로드합니다. 이 작업은 연결된 어플라이언스 환경에서 실행되는 경우에만 워크플로에 포함됩니다. |
서버구성작업 |
UCS 서버에서 필요한 컨피그레이션을 수행합니다. FI 연결 구축의 경우 서비스 프로필 생성 및 연결이 포함됩니다. |
하이퍼바이저Esx컨피그레이션 작업 |
하이퍼바이저의 네트워크 부분을 구성합니다. 여기에는 Serial Over Lan을 사용하여 관리 vSwitch에 업링크를 추가하고 IP 주소, 호스트 이름 및 DNS/NTP 컨피그레이션을 구성하는 것이 포함됩니다. |
PreDeployValidationTask |
클러스터 구축이 시작되기 전에 검증을 수행합니다. 검증에는 네트워크 연결성 확인 및 노드가 이미 다른 클러스터의 일부가 아니라는 확인이 포함됩니다. |
준비하이퍼바이저배포작업 |
컨트롤러 VM(가상 머신) 컨피그레이션을 위해 하이퍼바이저를 준비합니다. ESXi에서 호스트 정보를 가져오고 적절한 OS 매개변수가 설정되었는지 확인합니다. |
하이퍼바이저네트워킹작업 |
ESXi 호스트에서 네트워크 부분을 구성합니다. 클러스터가 작동하는 데 필요한 호스트의 여러 vSwitch/포트 그룹 컨피그레이션을 포함합니다. |
하이퍼바이저소프트웨어 업데이트작업 |
필요한 경우 호스트의 필수 VIB로 구성된 하이퍼바이저의 소프트웨어를 업데이트합니다. |
하이퍼바이저데이터저장소작업 |
필요한 경우 컨트롤러 VM에 대한 데이터 저장소를 생성합니다. |
HyperflexControllerVm 구축 |
필요한 경우 하이퍼바이저에 스토리지 컨트롤러 OVA를 구축합니다. |
Vm작업 구성 |
필요한 매개변수 및 데이터/관리 네트워크의 컨피그레이션을 포함하는 컨트롤러 VM의 네트워크 부분을 구성합니다. |
소프트웨어 Vm작업 배포 |
컨트롤러 VM에 HXDP 패키지를 설치합니다. |
노드 정보 수집 작업 |
UUID 및 IP와 같은 노드 정보를 수집합니다. |
인벤토리 데이터 수집 작업 |
인벤토리 데이터를 컨트롤러 VM에 보냅니다. |
클러스터 유효성 검사 작업 만들기 |
검증을 수행하여 컨트롤러 VM이 클러스터에 참가할 준비가 되었는지 확인합니다. MTU 확인을 포함하고 스토리지 서비스가 준비되었는지 확인합니다. |
클러스터작업 생성 |
스토리지 클러스터를 생성하고 컨트롤러 VM을 클러스터에서 모든 노드에 조인합니다. |
설치 후 호스트 구성 |
클러스터가 구축된 후 호스트를 구성합니다. Hyperflex 클러스터 프로필에 제공된 새 비밀번호로 변경하는 ESXi 비밀번호를 포함합니다. |
설치 후 스토리지 컨트롤러 VmConfig |
클러스터를 구축한 후 컨트롤러 VM을 구성하고, 컨트롤러 VM 비밀번호 변경을 Hyperflex 클러스터 프로필에 제공된 새 비밀번호로 포함합니다. |
클러스터자동클레임작업 |
Intersight 사용자 계정에 HyperFlex 클러스터를 요청합니다. |
문제
다음은 클러스터 구축에서 찾을 수 있는 일반적인 오류입니다.
유효성 검사 오류/경고:
- 중복 IP(동일한 패브릭 인터커넥트에서 오류 발생, 전역적으로 중복될 경우 경고)
- 2 노드 클러스터 생성
- 선택한 복제 요인에 대해 2(데이터 복제 요인 3이 권장됨)
런타임 유효성 검사:
- DNS, NTP에 연결할 수 없음
- vCenter에 연결할 수 없거나 자격 증명이 잘못되었습니다.
- 관리 IP 주소가 이미 사용 중입니다.
배포 오류:
- 동일한 L2 도메인의 서로 다른 두 클러스터에 대한 동일한 데이터 VLAN(업링크 스위치)
- Cross-over 링크
- 잘못된 ESXi 자격 증명으로 인한 ESXi IP 컨피그레이션 실패
솔루션
실패한 작업과 발생한 오류를 기반으로 다음 작업을 수행할 수 있습니다.
DNS/NTP에 연결할 수 없음
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list
작업: IP를 확인한 후 정책을 수정하고 워크플로를 다시 시작하십시오.
vCenter에 연결할 수 없음
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."
조치: vCenter IP/자격 증명이 잘못된 경우 이를 확인하여 정책을 수정하고 워크플로를 다시 시작합니다.
중복 IP
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”
작업: IP가 이미 사용 중인지 확인합니다. 사용 중인 경우 정책을 수정하고 워크플로를 다시 시작합니다.
호스트에 연결 실패
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'
작업: VLAN/IP/게이트웨이가 잘못된 경우 이를 확인하여 정책을 수정하고 워크플로를 다시 시작하십시오.
자동 클레임 실패
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "
조치: 디바이스 클레임 절차에 설명된 HyperFlex 클러스터를 클레임하고 워크플로를 다시 시작합니다.
서버 프로필 연결을 구성하지 못했습니다.
failed in Task: 'Failed to Configure Server Profile Association
작업:
ESXi IP 컨피그레이션은 CIMC Serial Over LAN을 통해 콘솔 액세스를 통해 수행됩니다. 때때로 CIMC SoL은 로그인 프롬프트에 콘솔을 가져오지 못합니다. KVM을 통해 ESXi에 대한 CIMC 콘솔을 확인하고 CIMC를 재설정하고 워크플로를 다시 시작합니다.
작업 실패: OS 부팅 모니터링
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'
작업:
- ESXi 루트 비밀번호가 올바른지 확인합니다.
- 최초 설치의 경우 공장 기본 비밀번호를 확인합니다.
- 재설치의 경우 공장 기본 비밀번호의 선택을 취소합니다.
- SoL 액세스 오류를 확인합니다.
- OS 부팅 중에 장치 커넥터의 연결이 끊겼는지 확인합니다.
새 설치인 경우 공장 기본 비밀번호 라디오 버튼을 선택한 후에도 제공된 비밀번호가 기본 비밀번호(Cisco123)가 아닌지 확인합니다.
이 작업을 수행하면 설치 프로그램에서 ESXi에 로그인할 수 있지만 기본 비밀번호의 강도가 약하기 때문에 비밀번호를 설정할 수 없습니다
작업에서 실패: Sha1에 대해 OVA 확인
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"
작업:
- ESXi에 DNS가 구성되어 있지 않은지 확인합니다.
- ESXi 관리 IP 서브넷이 Intersight 액세스에 대해 차단되었는지 확인합니다.
작업 실패: vCenter 클러스터에 호스트 추가
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts
작업:
vCenter 버전은 클러스터의 모든 호스트와 같거나 더 높아야 합니다. vCenter를 ESXi 버전 이상으로 업그레이드하거나 ESXi를 더 낮은 안정 버전으로 다운그레이드합니다.
작업에 실패했습니다. 네트워크 스토리지 컨트롤러 VM 컨피그레이션이 실패했습니다.
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'
작업:
EXSI API 서버는 경우에 따라 제시간에 응답하지 않습니다.
- 호스트 서비스 상태를 확인하여 실행 중인지 확인합니다.
- ESXi를 재부팅하고 구축을 재시도합니다.
MTU 문제로 인해 워크플로가 실패했습니다.
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
작업:
점보 프레임이 모든 경로에서 활성화되지 않았습니다. 점보 프레임이 활성화된 경우 업링크 스위치에서 MTU 값 9216을 구성해야 합니다. 모든 경로에서 MTU가 점보 프레임으로 설정되었는지 확인하고 워크플로를 다시 시작합니다
작업 실패: 소프트웨어 패키지를 Storage Controller VM에 복사
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.
작업:
- SCVM에서 Intersight로의 네트워크 연결이 있는지 확인합니다.
- 필요한 포트가 네트워크에서 허용되는지 확인합니다.
- 네트워크 요구 사항에 대해서는 사전 설치 확인 링크를 참조하십시오.
관련 정보