簡介
本文檔介紹通過Intersight部署Hyperflex群集的常見故障排除方案。
必要條件
需求
思科建議您瞭解以下主題:
採用元件
本文件所述內容不限於特定軟體和硬體版本。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
背景資訊
Intersight安裝程式工作流程遵循圖表中顯示的任務部署hyperflex群集:
任務名稱 |
定義 |
PreparePreClusterInfoTask |
生成包含部署群集所需資訊的配置檔案(例如,配置檔案路徑、軟體YAML檔案)。 |
伺服器配置驗證任務 |
驗證UCS伺服器配置,以確保其具有所需的硬體和韌體配置(例如,磁碟大小/PID驗證、正確的NIC等)。 |
PreConfigurationValidationTask |
在伺服器配置啟動之前驗證網路配置(例如,DNS、NTP、vCenter可訪問性、重複IP檢查) |
PrepareLocalImageRepoTask |
將軟體映像(控制器VM OVA、hxdp包)下載到本地映像儲存。只有在連線的裝置環境中運行此任務時,此任務才會包含在工作流中。 |
伺服器配置任務 |
在UCS伺服器上執行所需的配置。對於FI連線的部署,這涉及服務配置檔案的建立和關聯。 |
虛擬機器監控程式EsxConfigurationTask |
配置虛擬機器監控程式上的網路部分。這包括使用Serial Over Lan將上行鏈路新增到管理vSwitch並配置IP地址、主機名和DNS/NTP配置。 |
PreDeployValidationTask |
在群集部署開始之前執行驗證。驗證包括網路可達性檢查和節點尚未屬於另一個群集的驗證。 |
PrepareHypervisorDeploymentTask |
為控制器虛擬機器(VM)配置準備虛擬機器監控程式。從ESXi獲取主機資訊並確保設定正確的作業系統引數。 |
虛擬機器監控程式網路任務 |
配置ESXi主機上的網路部分。包括群集運行所需的主機上不同vSwitches/埠組的配置。 |
虛擬機器監控程式軟體更新任務 |
更新虛擬機器監控程式上的軟體,如有必要,該軟體會包括主機上的所需VIB。 |
HypervisorDatastoreTask |
如果需要,為控制器VM建立Datastore。 |
部署HyperflexControllerVm |
如果需要,在虛擬機器監控程式上部署儲存控制器OVA。 |
ConfigVmTask |
在控制器VM上配置網路部分,包括配置所需的引數和資料/管理網路。 |
DeploySoftwareVmTask |
在控制器VM上安裝HXDP包。 |
CollectNodeInfoTask |
收集節點資訊,如UUID和IP。 |
CollectInventoryDataTask |
將清單資料傳送到控制器VM。 |
CreateClusterValidationTask |
執行驗證以確保控制器VM已準備好加入群集。包括MTU檢查並驗證儲存服務是否就緒。 |
CreateClusterTask |
建立儲存群集並使控制器VM將群集中的所有節點連線在一起。 |
PostInstallHostConfig |
部署群集後配置主機。包括ESXi密碼更改至Hyperflex群集配置檔案中提供的新密碼。 |
PostInstallStorageControllerVmConfig |
在部署群集後配置控制器VM,包括將控制器VM密碼更改為Hyperflex群集配置檔案中提供的新密碼 |
ClusterAutoClaimTask |
向Intersight使用者帳戶宣告HyperFlex群集。 |
問題
以下是可以在群集部署中找到的常見錯誤:
驗證錯誤/警告:
- 重複IP(同一交換矩陣互聯上出錯,全域性重疊時發出警告)
- 2節點群集建立
- 2表示已選擇複製因子(建議資料複製因子為3)
運行時驗證:
- DNS,無法訪問NTP
- vCenter無法訪問或不正確的憑據
- 管理IP地址已在使用中
部署錯誤:
- 同一第2層域(上行鏈路交換機)中兩個不同集群的相同資料VLAN
- 交叉鏈路
- ESXi IP配置失敗(由於ESXi憑據不正確)
解決方案
根據失敗的任務和遇到的錯誤,您可以執行建議的操作:
無法訪問DNS/NTP
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list
操作:檢查IP(如果修改策略不正確),然後重新啟動工作流。
vCenter無法訪問
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."
操作:檢查vCenter IP/憑據,如果它不正確,請修改策略並重新啟動工作流。
重複的IP
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”
操作:檢查IP是否已在使用,如果是,請修改策略並重新啟動工作流。
連線到主機失敗
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'
操作:檢查VLAN/IP/網關,如果它不正確,請修改策略並重新啟動工作流。
自動宣告失敗
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "
操作:宣告裝置宣告過程中概述的HyperFlex群集並重新啟動工作流。
無法配置伺服器配置檔案關聯
failed in Task: 'Failed to Configure Server Profile Association
Action:
ESXi IP配置是通過通過CIMC Serial Over LAN通過控制檯訪問完成的。有時CIMC SoL無法使控制檯進入登入提示。通過KVM檢查CIMC控制檯到ESXi,重置CIMC並重新啟動工作流。
任務失敗:監控作業系統啟動
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'
Action:
- 確保ESXi根密碼正確
- 對於首次安裝,請確保檢查出廠預設密碼。
- 要重新安裝,請確保取消選中出廠預設密碼。
- 檢查SoL訪問失敗。
- 檢查裝置聯結器在作業系統引導期間是否斷開連線。
如果是新安裝,請確保所提供的密碼不是預設密碼(Cisco123),即使在選中出廠預設密碼單選按鈕之後也是如此。
此操作的結果是安裝程式能夠登入到ESXi,但無法設定密碼,因為預設密碼的強度較弱
任務失敗:針對Sha1驗證OVA
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"
Action:
- 檢查ESXi是否未配置DNS。
- 檢查ESXi管理IP子網是否被阻止訪問Intersight。
任務失敗:將主機新增到vCenter群集
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts
Action:
vCenter版本必須高於或等於群集中的所有主機。將vCenter升級到更高或相當於ESXi版本,或將ESXi降級到較低穩定版本。
任務失敗:網路儲存控制器VM配置失敗
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'
Action:
EXSI API伺服器偶爾不及時響應。
- 檢查hostd服務狀態以確保正在運行。
- 重新啟動ESXi並重試部署。
由於MTU問題,工作流失敗
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
Action:
並非所有路徑都啟用巨型幀,當啟用巨型幀時,必須在上行鏈路交換機中配置MTU值9216。 確保所有路徑中的MTU設定為巨型幀,並重新啟動工作流
任務失敗:將軟體包複製到儲存控制器VM
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.
Action:
- 確儲存在從SCVM到Intersight的網路連線。
- 驗證網路中是否允許所需的埠。
- 請參閱安裝前檢查連結瞭解網路要求。
相關資訊