システムリカバリが必要な場合
注意
|
このトピックで説明されている方法は、3 つのハイブリッド VM ノードのみ(およびワーカーノードなし)で構成されるクラスタプロファイルを使用すると失敗する可能性があります。この障害は、ワーカーノードがないために VM の回復力が不足しているために発生します。
|
Cisco Crosswork クラスタの通常の操作中に、システム全体を回復する必要がある場合があります。これは、1 つ以上のノードの誤動作、1 つ以上のサービスまたはアプリケーションの誤動作、またはクラスタ全体のホストを破壊する災害の結果である可能性があります。
機能クラスタには、3 つ以上のハイブリッドノードが必要です。これらのハイブリッドノードは、コア Cisco Crosswork の管理、オーケストレーション、およびインフラストラクチャ サービスによって課される処理およびトラフィック負荷を共有します。ハイブリッドノードは可用性が高く、処理負荷をノード間とワーカーノードに自動的に再分散することができます。
クラスタは、1 つのハイブリッドノードの再起動(グレースフルまたはアングレースフル)を許容できます。ハイブリッドノードの再起動中もシステムは機能しますが、可用性の観点からは低下します。システムは、ワーカーノードにかなり多数の障害が発生しても許容できますが、ワーカーノードが復元されるまで、システムの可用性は低下します。
Cisco Crosswork は、ノード、アプリケーション、またはサービスが誤動作するとアラームを生成します。システム障害が発生している場合は、まずアラームを調べます。次に、アラームで識別された個々のノード、アプリケーション、またはサービスの正常性を確認します。クラスタの正常性の確認に記載されている機能を使用して、問題の発生源をドリルダウンし、サービス障害であることが判明した場合は、問題のあるサービスを再起動できます。
1 つのハイブリッドノードに障害が発生したことを示すか、または 1 つのハイブリッドノードと 1 つ以上のワーカーノードに障害が発生したことを示すアラームが表示された場合は、障害が発生したノードの再起動または交換(消去してから再度追加)を試します。それでも問題が解決しない場合は、システムのクリーンリブートを実行することを検討してください。
2 つ以上のハイブリッドノードの損失は二重障害になります。障害が発生したハイブリッドノードを交換または再起動しても、システムが正しく回復する保証はありません。また、システム全体が劣化し、思わしくない状態になっている場合もあります。このような状態の場合は、新しいクラスタを展開した後、古いクラスタから取得した最新のバックアップを使用してシステム全体を回復できます。
重要
|
-
Crosswork ネットワーク コントローラー ソリューションを実行している 3 VM クラスタでは、VM のシャットダウンはサポートされていません。VM に障害が発生した場合、残りの 2 つの VM は、障害が発生した VM から移行されるすべてのポッドをサポートできません。VM
のシャットダウンを有効にするには、追加のワーカーノードを展開する必要があります。
-
いずれかの VM の再起動は、3 VM クラスタでサポートされています。再起動の場合、VM の復元には 5 分(再起動された VM で orch pod が実行されていない場合)から最大 25 分(再起動された VM で orch pod が実行されている場合)かかることがあります。
|
次の 2 つの項では、それぞれの場合に実行する手順について説明します。
システムのクリーンリブート(VMware)
システムのクリーンリブートを実行するには、次の手順を実行します。
-
Crosswork をメンテナンスモードにします。詳細については、メンテナンスモード設定の管理を参照してください。
-
各ノードをホストしている VM の電源を切ります。
-
VMware vSphere Web クライアントにログインします。
-
[ナビゲータ(Navigator)] ペインで、シャットダウンする VM を右クリックします。
-
を選択します。
-
VM のステータスが [オフ(Off)] に変わるまで待ちます。
-
残りのすべての VM が確実にシャットダウンするまで、手順 2 を各 VM に繰り返します。
-
最初のハイブリッドノードをホストする VM の電源を入れます。
-
[ナビゲータ(Navigator)] ペインで、電源をオンにする VM を右クリックします。
-
を選択します。
-
VM のステータスが [オン(On)] に変わるまで待ち、さらに 30 秒待ってから続行します。
-
残りの各ハイブリッドノードに対して手順 4 を繰り返し、再起動を 30 秒ずらして続行します。その後、各ワーカーノードで続行し、再起動を 30 秒ずらします。
-
すべての VM の電源がオンになるまでにかかる時間は、ハードウェアのパフォーマンス特性によって異なります。すべての VM の電源を入れたら、数分待ってから Crosswork にログインします。
-
Crosswork をメンテナンスモードから移動します。詳細については、メンテナンスモード設定の管理を参照してください。
(注)
|
Crosswork クラスタが正常な状態でない場合、メンテナンスモードを強制しようとすると失敗する可能性があります。試行が成功したにもかかわらず、アプリケーションの同期の問題が引き続き発生する可能性があります。このような場合、失敗したサービスのリストと失敗の理由を示すアラームが生成されます。このシナリオに直面した場合でも、以下で説明する「再展開と復元」の方法を続行できます。
|
再展開と復元(VMware)
バックアップからシステムを再展開して回復するには、次の手順を実行します。この方法では、リカバリが必要になる前にシステムのバックアップを定期的に実行していることを前提としています。バックアップの実行方法については、「Cisco Crosswork のバックアップと復元の管理」を参照してください。
-
各ノードをホストしている VM の電源を切ります。
-
VMware vSphere Web クライアントにログインします。
-
[ナビゲータ(Navigator)] ペインで、シャットダウンする VM を右クリックします。
-
を選択します。
-
VM のステータスが [オフ(Off)] に変わるまで待ちます。
-
必要に応じて、クラスタ内の残りのノードでこれらの手順を繰り返します。
-
すべての VM の電源がオフになったら、次の手順を実行して削除します。
-
VMware vSphere Web クライアントの [ナビゲータ(Navigator)] ペインで、削除する VM を右クリックします。
-
[ディスクから削除(Delete from Disk)] を選択します。
-
VM のステータスが [削除済み(Deleted)] に変わるまで待ちます。
-
必要に応じて、クラスタ内の残りの VM ノードに対してこれらの手順を繰り返します。
-
『Cisco Crosswork Infrastructure 4.4 and Applications Installation Guide』の説明に従って、新しい Cisco Crosswork クラスタを展開します。
-
災害後に Cisco Crosswork を復元するの説明に従って、新しく展開したクラスタのシステム状態を回復します。