Cisco Nexus 1000V インタークラウドハイアベイラビリティおよび冗長性コンフィギュレーションガイドリリース 5.2(1)IC1(1.1)

偏向のない言語

この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。

翻訳について

このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。

マニュアルのコンテンツ

このマニュアル内で検索

ご利用いただける言語

Download Options

Book Title

Cisco Nexus 1000V インタークラウドハイアベイラビリティおよび冗長性コンフィギュレーションガイドリリース 5.2(1)IC1(1.1)

Chapter Title

サービスレベルハイアベイラビリティの理解

PDF - Complete Book (2.22 MB) PDF - This Chapter (1.17 MB)
View with Adobe Reader on a variety of devices

検索結果

Updated:: 2013年12月4日

この章は、次の項で構成されています。

Cisco NX-OS サービスの再起動について
再起動性インフラストラクチャ
プロセスの再起動性
再起動のトラブルシューティング

Cisco NX-OS サービスの再起動について

Cisco NX-OS サービス再起動機能では、スーパーバイザを再起動せずに障害の発生したサービスを再起動することによって、プロセスレベルの障害がシステムレベルの障害に拡大するのを防ぐことができます。サービスは、現在のエラー、障害状況、サービスのハイアベイラビリティポリシーに基づいて再起動できます。サービスの再起動には、ステートフルな再起動とステートレスな再起動があります。 Cisco NX-OS では、サービスが実行時の状態情報とメッセージを保存することで、ステートフルな再起動を実現しています。ステートフルな再起動では、サービスが保存されていた状態情報を取り出して、直前のチェックポイントサービス状態から動作を再開します。ステートレスな再起動では、サービスは、初めて起動するときのように、初期化および実行されます。

再起動性インフラストラクチャ

Cisco NX-OS は、ほとんどのプロセスおよびサービスでステートフルリスタートが可能です。プラットフォーム内のプロセス、サービス、アプリケーションのバックエンド管理および調整は一連の高レベルのシステムコントロールサービスによって処理されます。

システムマネージャ
永続ストレージサービス
メッセージおよびトランザクションサービス
HA ポリシー

システムマネージャ

システムマネージャは、あらゆるシステム機能、システム管理、システムヘルスモニタリングの実行を制御します。システムマネージャは、サービスの起動、停止、モニタリング、再起動を担当します。

永続ストレージサービス

Cisco NX-OS サービスは、永続ストレージサービス（PSS）を使用して、運用の実行時情報とプラットフォームサービスの設定を保存および管理します。 PSS コンポーネントは、システムサービスを使用して、サービス再起動時に状態を回復します。 PSS は状態および実行時情報のデータベースとして機能します。これにより、各サービスは、必要なときにいつでも、サービス自体の状態情報のチェックポイントを作成できます。サービスを再起動すると、障害が発生する直前の既知の動作状態を回復できるので、ステートフルな再起動が可能になります。

PSS を使用する各サービスは、保存された情報を次のいずれかとして定義できます:

プライベート：そのサービスからのみ読み取ることができます。
共有：情報は他のサービスから読み取ることができます。

サービスは次のいずれかに指定できます:

ローカル：情報は、同じスーパーバイザ上のサービスのみ読み取りできます。
グローバル：スーパーバイザまたはモジュール上のサービスから読み取ることができます。

メッセージおよびトランザクションサービス

Message and Transaction Service（MTS; メッセージおよびトランザクションサービス）は、ハイアベイラビリティセマンティクスに特化した高パフォーマンス Interprocess Communication（IPC; プロセス間通信）メッセージブローカです。 MTS は、モジュール内とモジュール間、およびスーパーバイザ間でメッセージのルーティングとキューイングを行います。また、イベント通知や同期などのメッセージ交換を容易にし、システムサービス間およびシステムコンポーネント間のメッセージ永続性を促進します。 MTS では、永続メッセージおよびログメッセージをキュー内に保管できるため、サービスの再起動後もそれらのメッセージにアクセスできます。

HA ポリシー

Cisco NX-OS では、各サービスに、障害の発生したサービスの再起動方法を定義する一連の内部 HA ポリシーのセットを作成できます。サービスごとに 4 つの定義済みポリシーを用意できます。つまり、スーパーバイザが 2 つの場合のプライマリポリシーとセカンダリポリシー、スーパーバイザが 1 つだけの場合のプライマリポリシーとセカンダリポリシーです。 HA ポリシーが定義されていないサービスでは、サービスの障害発生時に実行されるデフォルトの HA ポリシーは、スーパーバイザが 2 つの場合はスイッチオーバー、スーパーバイザが 1 つの場合はスーパーバイザのリセットとなります。

HA ポリシーには、次の 3 つのパラメータを指定します。

システムマネージャによって実行されるアクション：
- ステートフルな再起動
- ステートレスな再起動
- スーパーバイザのスイッチオーバー（または再起動）
最大再試行回数：システムマネージャによって実行される再起動試行回数。再試行をその回数行ってもサービスが正常に再起動しない場合、その HA ポリシーは失敗したものと見なされ、定義されている次の HA ポリシーが使用されます。他の HA ポリシーが定義されていない場合はデフォルトのポリシーが適用されます。つまり、スーパーバイザのスイッチオーバーまたは再起動が実行されます。
最小ライフタイム：再起動が正常に行われたと見なすために、再起動試行後にサービスを実行する必要がある時間。最小ライフタイムは最低でも 4 分です。

プロセスの再起動性

Cisco NX-OS のプロセスは、保護メモリ領域内で互いに独立して、またカーネルとも独立して動作します。このようにプロセスが分離されているため、障害が閉じこめられ、迅速な再起動が可能になります。プロセスの再起動性により、プロセスレベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。また、大半のサービスはステートフルな再起動を実行できます。これにより、プラットフォーム内の他のサービス、およびネットワーク内の隣接デバイスへ透過的に、障害の発生したサービスを再起動し、動作を再開できます。

障害を起こしたサービスはサービスの HA の実装および HA ポリシーに応じて、異なる方法によって再起動されます。

次の表に、さまざまな障害発生時にシステムマネージャによって実行されるアクションを示します。

障害	アクション
サービス/プロセスの例外	サービスの再起動
サービス/プロセスのクラッシュ	サービスの再起動
サービス/プロセスの応答がない	サービスの再起動
サービスの障害が繰り返される	スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）
システムマネージャからの応答がない	スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）
カーネル障害	スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）
ウォッチドッグタイムアウト	スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）

ステートフルな再起動
ステートレスな再起動

ステートフルな再起動

再起動可能なサービスで障害が発生すると、サービスは同じスーパーバイザ上で再起動されます。サービスの新しいインスタンスは、以前のインスタンスがオペレーティングシステムによって異常終了させられたと判断した場合、永続コンテキストがあるかどうかを確認します。新しいインスタンスは初期化時に永続コンテキストを読み込んで、実行時コンテキストを構築します。この結果、新しいインスタンスは障害発生前のインスタンスと同じ状態になります。初期化が完了すると、サービスは、停止したときに実行していたタスクを再開します。新しいインスタンスが再起動および初期化されている間、他のサービスは、そのような障害が発生していることを認識していません。他のサービスから障害が発生したサービスに送信されたメッセージは、サービスが再開された時点で MTS から取得できます。

新しいインスタンスでステートフルな初期化を完了できるかどうかは、前のインスタンスの障害の原因に依存します。サービスで再起動を数回実行できない場合、そのサービスの再起動は失敗したと見なされます。その場合、システムマネージャは、再起動に失敗したサービスの HA ポリシーに指定されたアクション（ステートレスな再起動、再起動しない、スーパーバイザのスイッチオーバーまたはリセットのいずれか）を実行します。

ステートフルな再起動に成功した場合、システムが矛盾のない状態に到達するまでに遅延が発生することはありません。ステートフルな再起動により、障害発生後の回復に要する時間が短縮されます。

ステートフルな再起動の前後および最中に発生するイベントは次のとおりです。

実行中のサービスが、実行時状態情報のチェックポイントを PSS に作成します。
システムマネージャがハートビートを使用している実行中サービスのヘルス状態を監視します。
システムマネージャが、クラッシュまたはハングしたサービスを即座に再起動します
再起動のあとに、サービスは、PSS から状態情報を回復し、保留中のすべてのトランザクションを再開します。
何度か再起動してもサービスの動作が安定しない場合、システムマネージャはスーパーバイザのリセットまたはスイッチオーバーを開始します。
Cisco NX-OS はプロセススタックとコアをデバッグ用に収集します。また、オプションでコアファイルをリモートに転送します。

ステートフルな再起動が発生すると、Cisco NX-OS がレベル LOG_ERR の Syslog メッセージを送信します。 SNMP トラップがイネーブルになっている場合は、SNMP エージェントがトラップを送信します。

ステートレスな再起動

Cisco NX-OS インフラストラクチャコンポーネントは、ステートレスな再起動を管理します。ステートレスな再起動中、システムマネージャは、障害の発生したプロセスを特定し、新しいプロセスに置き換えます。障害の発生したサービスは再起動時に実行時状態を保持していないため、実行コンフィギュレーションから実行時状態を構築するか、必要な場合は、他のサービスと情報を交換して実行時状態を構築します。

ステートレスな再起動が発生すると、Cisco NX-OS がレベル LOG_ERR の Syslog メッセージを送信します。 SNMP トラップがイネーブルになっている場合は、SNMP エージェントがトラップを送信します。

再起動のトラブルシューティング

サービスで障害が発生すると、システムは障害の原因を判定するために使用できる情報を生成します。次の情報ソースが使用可能です。

サービスの再起動によって、LOG_ERR レベルの Syslog メッセージが生成されます。
SNMP トラップがイネーブルになっている場合は、サービスが再起動されると、SNMP エージェントがトラップを送信します
サービス障害が発生すると、イベントがログに記録されます。ログを参照するには、そのモジュールで show processes log コマンドを使用します。プロセスのログは、のスイッチオーバーまたはリセット後も保持されます。
サービスの障害が発生すると、システムのコアイメージファイルが生成されます。最新のコアイメージを表示するには、ゲートウェイ上で show cores コマンドを入力します。コアファイルはのスイッチオーバーまたはリセット後は削除されますが、簡易ファイル転送プロトコル（TFTP）などのファイル転送ユーティリティを使用してコアファイルを外部サーバにエクスポートするようにシステムを設定することもできます。

目次

サービスレベルハイアベイラビリティの理解

Cisco NX-OS サービスの再起動について

再起動性インフラストラクチャ

システムマネージャ

永続ストレージサービス

メッセージおよびトランザクションサービス

HA ポリシー

プロセスの再起動性

ステートフルな再起動

ステートレスな再起動

再起動のトラブルシューティング

この章は、次の項で構成されています。

Cisco NX-OS サービスの再起動について

再起動性インフラストラクチャ

プロセスの再起動性

再起動のトラブルシューティング

Cisco NX-OS サービスの再起動について

Cisco NX-OS サービス再起動機能では、スーパーバイザを再起動せずに障害の発生したサービスを再起動することによって、プロセスレベルの障害がシステムレベルの障害に拡大するのを防ぐことができます。サービスは、現在のエラー、障害状況、サービスのハイアベイラビリティポリシーに基づいて再起動できます。サービスの再起動には、ステートフルな再起動とステートレスな再起動があります。 Cisco NX-OS では、サービスが実行時の状態情報とメッセージを保存することで、ステートフルな再起動を実現しています。ステートフルな再起動では、サービスが保存されていた状態情報を取り出して、直前のチェックポイントサービス状態から動作を再開します。ステートレスな再起動では、サービスは、初めて起動するときのように、初期化および実行されます。

再起動性インフラストラクチャ

Cisco NX-OS は、ほとんどのプロセスおよびサービスでステートフルリスタートが可能です。プラットフォーム内のプロセス、サービス、アプリケーションのバックエンド管理および調整は一連の高レベルのシステムコントロールサービスによって処理されます。

システムマネージャ

永続ストレージサービス

メッセージおよびトランザクションサービス

HA ポリシー

システムマネージャ

システムマネージャは、あらゆるシステム機能、システム管理、システムヘルスモニタリングの実行を制御します。システムマネージャは、サービスの起動、停止、モニタリング、再起動を担当します。

永続ストレージサービス

Cisco NX-OS サービスは、永続ストレージサービス（PSS）を使用して、運用の実行時情報とプラットフォームサービスの設定を保存および管理します。 PSS コンポーネントは、システムサービスを使用して、サービス再起動時に状態を回復します。 PSS は状態および実行時情報のデータベースとして機能します。これにより、各サービスは、必要なときにいつでも、サービス自体の状態情報のチェックポイントを作成できます。サービスを再起動すると、障害が発生する直前の既知の動作状態を回復できるので、ステートフルな再起動が可能になります。

PSS を使用する各サービスは、保存された情報を次のいずれかとして定義できます:

プライベート：そのサービスからのみ読み取ることができます。

共有：情報は他のサービスから読み取ることができます。

サービスは次のいずれかに指定できます:

ローカル：情報は、同じスーパーバイザ上のサービスのみ読み取りできます。

グローバル：スーパーバイザまたはモジュール上のサービスから読み取ることができます。

メッセージおよびトランザクションサービス

Message and Transaction Service（MTS; メッセージおよびトランザクションサービス）は、ハイアベイラビリティセマンティクスに特化した高パフォーマンス Interprocess Communication（IPC; プロセス間通信）メッセージブローカです。 MTS は、モジュール内とモジュール間、およびスーパーバイザ間でメッセージのルーティングとキューイングを行います。また、イベント通知や同期などのメッセージ交換を容易にし、システムサービス間およびシステムコンポーネント間のメッセージ永続性を促進します。 MTS では、永続メッセージおよびログメッセージをキュー内に保管できるため、サービスの再起動後もそれらのメッセージにアクセスできます。

HA ポリシー

Cisco NX-OS では、各サービスに、障害の発生したサービスの再起動方法を定義する一連の内部 HA ポリシーのセットを作成できます。サービスごとに 4 つの定義済みポリシーを用意できます。つまり、スーパーバイザが 2 つの場合のプライマリポリシーとセカンダリポリシー、スーパーバイザが 1 つだけの場合のプライマリポリシーとセカンダリポリシーです。 HA ポリシーが定義されていないサービスでは、サービスの障害発生時に実行されるデフォルトの HA ポリシーは、スーパーバイザが 2 つの場合はスイッチオーバー、スーパーバイザが 1 つの場合はスーパーバイザのリセットとなります。

HA ポリシーには、次の 3 つのパラメータを指定します。

システムマネージャによって実行されるアクション：

ステートフルな再起動

ステートレスな再起動

スーパーバイザのスイッチオーバー（または再起動）

最大再試行回数：システムマネージャによって実行される再起動試行回数。再試行をその回数行ってもサービスが正常に再起動しない場合、その HA ポリシーは失敗したものと見なされ、定義されている次の HA ポリシーが使用されます。他の HA ポリシーが定義されていない場合はデフォルトのポリシーが適用されます。つまり、スーパーバイザのスイッチオーバーまたは再起動が実行されます。

最小ライフタイム：再起動が正常に行われたと見なすために、再起動試行後にサービスを実行する必要がある時間。最小ライフタイムは最低でも 4 分です。

プロセスの再起動性

Cisco NX-OS のプロセスは、保護メモリ領域内で互いに独立して、またカーネルとも独立して動作します。このようにプロセスが分離されているため、障害が閉じこめられ、迅速な再起動が可能になります。プロセスの再起動性により、プロセスレベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。また、大半のサービスはステートフルな再起動を実行できます。これにより、プラットフォーム内の他のサービス、およびネットワーク内の隣接デバイスへ透過的に、障害の発生したサービスを再起動し、動作を再開できます。

障害を起こしたサービスはサービスの HA の実装および HA ポリシーに応じて、異なる方法によって再起動されます。

次の表に、さまざまな障害発生時にシステムマネージャによって実行されるアクションを示します。

障害

アクション

サービス/プロセスの例外

サービスの再起動

サービス/プロセスのクラッシュ

サービスの再起動

サービス/プロセスの応答がない

サービスの再起動

サービスの障害が繰り返される

スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）

システムマネージャからの応答がない

スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）

カーネル障害

スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）

ウォッチドッグタイムアウト

スーパーバイザのリセット（シングルスーパーバイザの場合）またはスイッチオーバー（デュアルスーパーバイザの場合）

ステートフルな再起動

ステートレスな再起動

ステートフルな再起動

再起動可能なサービスで障害が発生すると、サービスは同じスーパーバイザ上で再起動されます。サービスの新しいインスタンスは、以前のインスタンスがオペレーティングシステムによって異常終了させられたと判断した場合、永続コンテキストがあるかどうかを確認します。新しいインスタンスは初期化時に永続コンテキストを読み込んで、実行時コンテキストを構築します。この結果、新しいインスタンスは障害発生前のインスタンスと同じ状態になります。初期化が完了すると、サービスは、停止したときに実行していたタスクを再開します。新しいインスタンスが再起動および初期化されている間、他のサービスは、そのような障害が発生していることを認識していません。他のサービスから障害が発生したサービスに送信されたメッセージは、サービスが再開された時点で MTS から取得できます。

新しいインスタンスでステートフルな初期化を完了できるかどうかは、前のインスタンスの障害の原因に依存します。サービスで再起動を数回実行できない場合、そのサービスの再起動は失敗したと見なされます。その場合、システムマネージャは、再起動に失敗したサービスの HA ポリシーに指定されたアクション（ステートレスな再起動、再起動しない、スーパーバイザのスイッチオーバーまたはリセットのいずれか）を実行します。

ステートフルな再起動に成功した場合、システムが矛盾のない状態に到達するまでに遅延が発生することはありません。ステートフルな再起動により、障害発生後の回復に要する時間が短縮されます。

ステートフルな再起動の前後および最中に発生するイベントは次のとおりです。

実行中のサービスが、実行時状態情報のチェックポイントを PSS に作成します。

システムマネージャがハートビートを使用している実行中サービスのヘルス状態を監視します。

システムマネージャが、クラッシュまたはハングしたサービスを即座に再起動します

再起動のあとに、サービスは、PSS から状態情報を回復し、保留中のすべてのトランザクションを再開します。

何度か再起動してもサービスの動作が安定しない場合、システムマネージャはスーパーバイザのリセットまたはスイッチオーバーを開始します。

Cisco NX-OS はプロセススタックとコアをデバッグ用に収集します。また、オプションでコアファイルをリモートに転送します。

ステートフルな再起動が発生すると、Cisco NX-OS がレベル LOG_ERR の Syslog メッセージを送信します。 SNMP トラップがイネーブルになっている場合は、SNMP エージェントがトラップを送信します。

ステートレスな再起動

Cisco NX-OS インフラストラクチャコンポーネントは、ステートレスな再起動を管理します。ステートレスな再起動中、システムマネージャは、障害の発生したプロセスを特定し、新しいプロセスに置き換えます。障害の発生したサービスは再起動時に実行時状態を保持していないため、実行コンフィギュレーションから実行時状態を構築するか、必要な場合は、他のサービスと情報を交換して実行時状態を構築します。

ステートレスな再起動が発生すると、Cisco NX-OS がレベル LOG_ERR の Syslog メッセージを送信します。 SNMP トラップがイネーブルになっている場合は、SNMP エージェントがトラップを送信します。

再起動のトラブルシューティング

サービスで障害が発生すると、システムは障害の原因を判定するために使用できる情報を生成します。次の情報ソースが使用可能です。

サービスの再起動によって、LOG_ERR レベルの Syslog メッセージが生成されます。

SNMP トラップがイネーブルになっている場合は、サービスが再起動されると、SNMP エージェントがトラップを送信します

サービス障害が発生すると、イベントがログに記録されます。ログを参照するには、そのモジュールで show processes log コマンドを使用します。プロセスのログは、のスイッチオーバーまたはリセット後も保持されます。

サービスの障害が発生すると、システムのコアイメージファイルが生成されます。最新のコアイメージを表示するには、ゲートウェイ上で show cores コマンドを入力します。コアファイルはのスイッチオーバーまたはリセット後は削除されますが、簡易ファイル転送プロトコル（TFTP）などのファイル転送ユーティリティを使用してコアファイルを外部サーバにエクスポートするようにシステムを設定することもできます。

このドキュメントは役に立ちましたか?

フィードバック

シスコに問い合わせ

サポートケースをオープン
(シスコサービス契約が必要です。)

Cisco Nexus 1000V インタークラウド ハイ アベイラビリティおよび冗長性コンフィギュレーション ガイド リリース 5.2(1)IC1(1.1)

偏向のない言語

翻訳について

検索結果

章のタイトル： サービスレベル ハイ アベイラビリティの理解

Cisco NX-OS サービスの再起動について

再起動性インフラストラクチャ

システム マネージャ

永続ストレージ サービス

メッセージおよびトランザクション サービス

HA ポリシー

プロセスの再起動性

ステートフルな再起動

ステートレスな再起動

再起動のトラブルシューティング

Cisco NX-OS サービスの再起動について

再起動性インフラストラクチャ

システム マネージャ

永続ストレージ サービス

メッセージおよびトランザクション サービス

HA ポリシー

プロセスの再起動性

ステートフルな再起動

ステートレスな再起動

再起動のトラブルシューティング

このドキュメントは役に立ちましたか?

シスコに問い合わせ

Cisco Nexus 1000V インタークラウドハイアベイラビリティおよび冗長性コンフィギュレーションガイドリリース 5.2(1)IC1(1.1)

章のタイトル：サービスレベルハイアベイラビリティの理解

システムマネージャ

永続ストレージサービス

メッセージおよびトランザクションサービス

システムマネージャ

永続ストレージサービス

メッセージおよびトランザクションサービス