概要
このドキュメントでは、HyperFlexクラスタの新しいインストール/展開またはバージョン3.0(1c)へのアップグレード後に発生するHyperFlexプラグインの問題をトラブルシューティングする手順について説明します。
前提条件
要件
次の項目に関する知識があることが推奨されます。
- Cisco HyperFlex
- VMware vCenter
使用するコンポーネント
このドキュメントの情報は、次のソフトウェアとハードウェアのバージョンに基づいています。
- HyperFlexバージョン3.0(1c)
- UCS C240M5
- VMWare vCenter 6.0または6.5
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
トラブルシューティングの手順
ステップ1:vCenter Web ClientにHyperFlexプラグインが表示されていないことを確認します。[Home] > [Global Inventory List]に移動し、プラグインがvCenterに表示されているかどうかを確認します。図に示すように、プラグインはDistributed Switchesの直下にある必要があります。
ステップ2:vCenterログインユーザに完全な管理者権限があることを確認します。
ステップ3:vCenterからHX Cluster Management IPへのpingが動作したかどうかを確認します(CMIP)。
ステップ4:重複するIPの問題を切り分けるために、CMIPへのpingが断続的であったかどうかを確認します。
ステップ5:プラグインがvCenter Manage Object Browser(MOB)経由でインストールされたことを確認します。 この手順を実行する前に、クラスタドメインIDを確認します。クラスタドメインIDを収集するには、CMIPに対してセキュアシェル(SSH)を実行し、D"stcli cluster info | grep -i domain」と表示されます。
ステップ6:この場合、ドメインIDはc122です。ここで、vCenter MOBに移動し、このプラグインの拡張子が存在するかどうかを確認します。これを行うには、https://<vCenter IPまたはFQDN>/mobにログインします。
プロパティセクションでcontent>extensionManagerに移動し、(more...)を選択します。リストの下部には2つのスプリングパス拡張が表示されます。そのうちの1つは、以前に収集したドメインIDを含んでいます。
ステップ7:HyperFlexプラグインがvCenter Web Clientにインストールされたことを確認するには、[Home] > [Administration] > [Solutions] > [Client Plug-Ins]に移動します。
表にHyperFlex (Springpath Plugin)が表示されていない場合は、[新しいプラグインのチェック]をクリックします。Springpathプラグインが存在する場合は、このプラグインにデータが入力されます。これには数分かかります。
新しいプラグインを確認する前に:
新しいプラグインを確認した後:
ステップ8:vSphere Web Clientサービス(vsphere-clientサービス)を再起動します。
Windows上のvCenter Server
-
vCenter Serverが実行されているWindowsシステムでServer Managerを開きます。
-
[Configuration] > [Services] に移動します。
-
[VMware vSphere Web Client]を選択し、[Restart]をクリックします。
vCenterサーバアプライアンス
-
SSHを使用して、vCenterサーバアプライアンスにルートとしてログインします。
-
vSphere Web Clientサービスを停止し、次のいずれかのコマンドを実行します。
-
次のコマンドを使用して、vSphere Web Clientサービスを再起動します。
ラボvCenterサーバアプライアンスからのコマンド出力:
ステップ9:vCenterからextensionList ["com.springpath.sysmgmt"]のmobを削除します。
注:未使用のドメインIDだけを削除してください。誤ったドメインIDを削除すると、クラスタはオフラインになります。ステップ5から正しいドメインIDを収集します。また、vCenter Hosts & Clustersビューからクラスタを削除し、mobエントリを削除して、vCenterでクラスタを再作成し、クラスタを再登録することもできます。疑わしい場合は、先に進む前にTAC SRを開いてください。
ステップ10:同じvCenterにHXクラスタを再登録します。
次のコマンドを実行して、HXをvCenterに再登録します。
root@ucs-stctlvm-116-1:~# stcli cluster reregister --vcenter-datacenter
DATACENTER --vcenter-cluster <CLUSTER> --vcenter-url <vCenterIP> --vcenter-user <USER>
ステップ11:vSphere Web Clientサービスがオンラインになるのを待ってからログインし直します。これには5 ~ 10分かかります。
ログインすると、Cisco Hyperflex Systemsの下にCisco HX Data Platformが表示されます。
ステップ12:これが機能しない場合は、プラグインがVCSA SSHコンソールからダウンロードできるかどうかを確認します。このテストでは、ファイアウォール、ポートの問題、または証明書の問題を切り分けます。
wget:
sup-ucs-vc:~ # wget https://<CMIP>/plugins/stGui-1.0.zip —no-check-certificate
Curlの使用:
sup-ucs-vc:~ # curl-v https://<CMIP>/plugins/stGui-1.0.zip
ステップ 13https://vCenterIPaddress/ mobthen login asadministrator@vsphere.localを参照します。
[Content] > [Extension] > [ExtensionManager] > [extensionList] ["com.springpath.sysmgmt" ] > [Server]に移動します
これは見た目です。ExtensionServerInfoは、特定のHXクラスタで同じURL/IPを表示します。これは、CMIPと同じIPである必要があります。
ステップ14:サーバモブの出力に同じURL DNS名が表示されない場合([0]ExtensionServerInfoと[1]ExtensionServerInfoが2つの別々のURL DNS名である場合など)、問題が発生している可能性があります。
クラスタ管理IPであるURLを検索します。CtrlVMでDNSを確認し、次の手順を実行します。
- HXクラスタからのDNSを無効にします。任意のストレージへのSSH CtrlVM
- DNSサーバを確認します。#stcli services dns show(DNSサーバのIPを取得)
- DNSの停止:#stcli services dns remove —dns <DNSサーバIP>
- DNSが停止したことを確認します。#stcli services dns show
- extensionList ["com.springpath.sysmgmt"]のmobをvCenterから削除します(手順9で説明します)。
- HXクラスタをvCenterに再登録します(ステップ10で説明)。
- Webクライアントからログアウトし、再度ログインします。プラグインが表示されているかどうかを確認します。
- DNSサーバをhxクラスタに戻します。#stcli services dns add —dns <DNSサーバIP>
- DNSサーバが実行されていることを確認します。#stcli services dns show
ログ分析
ログ収集
1. vCenterログ – https://kb.vmware.com/s/article/1011641
2. Hyperflex storfsバンドル – https://www.cisco.com/c/en/us/support/docs/hyperconverged-infrastructure/hyperflex-hx-data-platform/210831-Visual-guide-to-collect-Tech-Support-fil.html
エラーメッセージの例
1. vCenterでHX Cluster stMgrとの通信に問題がある場合は、vCenterの仮想ログを確認し、メッセージを探します。
2. VCSA Virgoログの場所:/var/log/vmware/vsphere-client/logs/vsphere_client_virgo.log
3. stMgrログの場所を確認します。/var/log/springpath/stMgr.logを参照して、HyperflexクラスタまたはvCenterプラグインに対応するエラーメッセージまたは失敗したメッセージを探してください。
問題状況でのログの例:
stMgr failed to return a simple cluster name,
[2016-11-15T19:48:40.542Z] [WARN ] pool-9-thread-1 70000096 100001 200001 com.storvisor.sysmgmt.service.ThriftServiceAccess Failed to get cluster name when checking for cluster access. org.apache.thrift.transport.TTransportException: java.net.UnknownHostException: cisco-storage-cluster.com
at org.apache.thrift.transport.THttpClient.flush(THttpClient.java:356)
at org.apache.thrift.TServiceClient.sendBase(TServiceClient.java:65)
at com.storvisor.sysmgmt.StMgr$Client.send_getName(StMgr.java:1308)
at com.storvisor.sysmgmt.StMgr$Client.getName(StMgr.java:1301)
at com.storvisor.sysmgmt.service.ThriftServiceAccess.hasValidAccess(ThriftServiceAccess.java:228)
at com.storvisor.sysmgmt.service.util.StorvisorServerCacheForceUpdaterThread.call(StorvisorServerCacheForceUpdaterThread.java:28)
at com.storvisor.sysmgmt.service.util.StorvisorServerCacheForceUpdaterThread.call(StorvisorServerCacheForceUpdaterThread.java:12)
at java.util.concurrent.FutureTask.run(Unknown Source)
at java.util.concurrent.ThreadPoolExecutor.runWorker(Unknown Source)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(Unknown Source)
at java.lang.Thread.run(Unknown Source)
Caused by: java.net.UnknownHostException: cisco-storage-cluster.com
at java.net.AbstractPlainSocketImpl.connect(Unknown Source)
at java.net.SocksSocketImpl.connect(Unknown Source)
at java.net.Socket.connect(Unknown Source)
at sun.security.ssl.SSLSocketImpl.connect(Unknown Source)
4. Cisco TAC SRをオープンしても問題が解決しない場合:https://mycase.cloudapps.cisco.com/case