システムのモニタリング

この章では、コマンドラインインターフェイス(CLI)にある show コマンドを使用して、システムのステータスとパフォーマンスをモニタリングする方法について説明します。これらのコマンドには関連するキーワードが多数あります。それらのキーワードを使用すると、現在のソフトウェア設定からコールのアクティビティやステータスに至るまで、システムのすべての側面に関する有益な情報が得られます。

この章で説明するキーワードの選択は、システムのモニタリングに関する最も有益で詳細な情報の提供を目的としています。これらのキーワードやその他の show コマンドのキーワードの詳細については、『Command Line Interface Reference』の Exec モードの show コマンド 「Exec Mode show Commands」の章を参照してください。 Command Line Interface Referenceと呼ばれます。


(注)  


VPC-DI または VPC-SI の仮想マシン(VM)は、それが実行されているハイパーバイザや市販 の(COTS)サーバーを認識しません。ハイパーバイザと COTS サーバーのステータスをモニターするには、このシステムのコンポーネントに付属しているユーザーマニュアルを参照してください。



重要


リリース 21.1 以降では、 do show グローバル構成モードのままで コマンドを使用してすべての Exec モードの show コマンドを実行します。show コマンドを実行するために構成モードを終了する必要はありません。 show コマンドを削除しないでください。パイプ文字 | は、コマンドが Exec モードで有効である場合にのみ使用できます。


SNMP 通知

CLI に加えて、システムはステータスとアラーム状態を示す Simple Network Management Protocol(SNMP)通知をサポートしています。参照先 SNMP MIB Reference これらの通知の詳細なリストについては、『SNMP MIB Reference』を参照してください。

システムのステータスとパフォーマンスのモニタリング

このセクションには、システム内のタスク、マネージャ、アプリケーション、およびその他のソフトウェアコンポーネントのステータスをモニターするために使用されるコマンドが含まれています。ほとんどのコマンドの出力に関する説明は、『Statistics and Counters Reference』に記載されています。 Statistics and Counters Referenceと呼ばれます。

表 1. システムのステータスとパフォーマンスのモニタリングコマンド
手順は次のとおりです。 次のコマンドを入力します。
管理情報を表示
現在の管理ユーザアクセスを表示
現在システムにログオンしているすべての管理ユーザーのリストを表示 show administrators
管理ユーザーが作業しているコンテキスト、管理ユーザーが CLI にアクセスしている IP アドレス、およびシステムによって生成された ID 番号を表示 show administrators session id
システムに設定されているローカルユーザー管理アカウントに関連する情報を表示 show local-user verbose
ローカルユーザー管理アカウントの統計情報を表示 show local-user statistics verbose
CLI セッションに関連する情報を表示 show cli
システム稼働時間を決定
システム稼働時間を表示(前回の再起動からの経過時間) show system uptime
NTP サーバーのステータスを表示
NTP サーバーのステータスを表示 show ntp status
システムリソースを表示
すべてのシステムリソースを表示(CPU リソースや作成されたマネージャの数など) show resources [ cpu ]
システムアラームを表示
現在未処理のすべてのアラームに関する情報を表示 show alarm outstanding all verbose
システムアラームの統計情報を表示 show alarm statistics
輻輳制御の統計情報を表示
輻輳制御の統計情報を表示 show congestion-control statistics
リモート管理の統計情報を表示
SNMP 通知の統計情報を表示 show snmp notifies
SNMP アクセスの統計情報を表示 show snmp accesses
SNMP トラップの履歴を表示 show snmp trap history
SNMP トラップの統計情報を表示 show snmp trap statistics
ポートカウンタを表示
特定のポートのデータリンクカウンタを表示 show port datalink counters slot# /port#
特定のポートのポート ネットワーク プロセッサ ユニット(NPU)カウンタを表示 show port npu counters slot#/port#
システム情報とネットワークインターフェイスを表示

システムコンポーネント、ストレージデバイス、およびネットワーク インターフェイスに関する情報を表示

show hardware
カード情報と統計情報を表示

すべてのカードまたは特定のスロット/ポート(VPC の場合、スロットはVM)にあるカードの診断を表示

show card diag slot / port

すべてのカードまたは特定のスロット/ポート(VPC の場合、スロットは VM)にあるカードの詳細情報を表示

show card info slot / port

すべてのカードまたは VM の動作ステータスを表示

show card table

起動設定(param.cfg)ファイルのコンテツを表示

[VPC-DI]

show cloud configuration

設置されているハードウェアに関する情報と、システム内の特定のカードまたはすべてのカードに対して最適かどうかを表示

[VPC-DI]

show cloud hardware

特定のカードに関連する VPC-DI I ネットワークに関するモニター対象統計情報を表示

[VPC-DI]

show cloud monitor di-network

重要


使用可能なコマンドまたはキーワードと変数は、プラットフォームのタイプ、製品のバージョン、およびインストールされているライセンスによって異なります。

重要


一部のコマンドでは、プラットフォームのタイプによって出力が異なります。

DI ネットワークのモニタリング

DI ネットワークは、VM をインターコネクトするプライベート L2 ネットワークです。DI ネットワークは、受信した VM から別の VM 上でサービスを提供するセッションマネージャにユーザートラフィックを転送します。また、CLI コマンド、正常性チェック、ステータス変更などの SF 通信にも CF を転送します。リンクが侵害されると、予期しない事態(CLI コマンドへの応答が遅いなど)が発生し、サービスが中断される可能性があります。

DI ネットワークの正常性を確認するために使用可能なモニタリング機能は、次のとおりです。

SF 間の DI ネットワークテスト

各 SF は、非ブロッキング UDP テストパケットを他のアクティブ SF とスタンバイ SF のそれぞれに定期的に送信し、応答を追跡し続けて遅延とパケット損失を計算します。テストパケットは 1 秒に 1 回送信されます。ジャンボと非ジャンボの両方のテストパケットは、交互に送信されます。非ジャンボ UDP テストパケットのペイロードサイズは 200 バイトで、ジャンボテストパケットのペイロードサイズは 4000 バイトです。統計情報が記録されます。

  • ドロップされたパケット数:別の SF からのテストパケットを受信すると、受信 SF は応答を返します。SF が 1 秒以内にテストパケット応答を受信しなかった場合、パケットはドロップされたものとしてマークされます。

  • ドロップされたジャンボパケット:ドロップされたパケット数と同じ計算ですが、ジャンボテストパケットのみをカウントします。

  • 長時間の遅延が発生しているパケットの数:SF が 200 ミリ秒後にテストパケット応答を受信した場合、パケットに長い遅延があるとマークします。


(注)  


カウンタは、SF の再起動後にクリアされます。


レポート間隔は 15 秒で開始され、3600 秒のまでの範囲で指定できます。間隔の間にエラーが検出されなかった場合は、警告ログは生成されず、間隔が 3600 秒になるまでレポート間隔が倍増します。間隔の間にエラーが検出されると、警告ログが生成され、ドロップされたパケットがなくなるまで、レポート間隔が半減します。

パケット損失または長時間の遅延が発生した場合は、警告イベントが生成されます。次に、警告の例を示します。

2016-Jan-10+22:00:01.477 [hat 3081 warning] [5/0/5146 <hatcpu:50> hatcpu.c:1307] [software 
internal system syslog] Over the past 15 seconds, tests from card 5 to 4 had 1 total drops, 
0 jumbo drops, 0 long latency.
  

使用するコマンド SF 間通信に関して収集された統計情報を表示するには、show heartbeat stats card cardnumber cpu cpunumber コマンドを使用します。

DI ネットワークのモニタリングはデフォルトでは有効になっています。使用するコマンド debug heartbeat test 特定の SF 上の SF パケットテストを停止して開始するか、または特定の SF 上でテストパケットカウンタをクリアするには、 コマンドを使用します。

また、コマンドを使用して、 show cloud monitor di-network DI ネットワークモニタリングの統計情報を表示することもできます。次に、 show cloud monitor di-network summary カード番号 3 での コマンドの出力例を示します。


Card 3 Test Results:

ToCard   Health   5MinLoss   60MinLoss
   1      Good       0.0%      0.0%
   2      Good       0.0%      0.0%
   4       Bad       6.32%     5.36%
   5      Good       0.0%      0.0%
   6      Good       0.0%      0.0%
  

この表示には、過去 5 分間および過去 60 分間のテストパケット損失率が示されます。この率が 1% を超えると、正常性ステータスが「Bad」としてマークされます。

SF からスタンバイ CF への DI ネットワークテスト

SF の起動中に、各 SF は非ジャンボ ping パケットおよびジャンボ ping パケットの両方をスタンバイ CF に送信して、スタンバイ CF が到達可能であることを確認します。

SF の通常動作中に、SF は非ブロッキング UDP テストパケットをスタンバイ CF に定期的に送信し、応答を追跡し続けて遅延とパケット損失を計算します。11965 この機能は、SF 間の DI ネットワークテストで説明されているものと同じです。 SF 間の DI ネットワークテストと呼ばれます。

SF セカンダリ IP アドレスの DI ネットワークテスト

SF の起動中に、各 SF は、SF プライマリ IP アドレスを使用して、非ジャンボ ping パケットおよびジャンボ ping パケットの両方をアクティブ CF に送信します。さらに、各 SF は、それぞれのセカンダリ IP アドレスを使用して、非ジャンボ ping パケットをアクティブ CF に送信します。これらの ping のいずれかが失敗すると、SF はアクティブ CF に通知し、SF が再起動します。

スタンバイ CF からアクティブ CF への DI ネットワークテスト

スタンバイ CF の起動時に、スタンバイ CF は、非ジャンボ ping パケットおよびジャンボ ping パケットの両方をアクティブ CF に送信します。

DI: ネットワークのバルク統計情報

次に、 mon-di-net スキーマは、VPC-DI プラットフォーム上の DI ネットワークの正常性をモニタリングするために、次のバルク統計情報を提供します。この情報は、Exec モードの show cloud monitor di-network summary コマンドの出力で提供されるものと類似しています。

  • src-card:モニタリングが実行された送信元カードのスロット番号。

  • dest-card ;トラフィックがルーティングされた接続先カードのスロット番号。

  • total-pkts-5mins :過去 5 分間に送信されたパケットの合計数。

  • total-drops-5mins:過去 5 分間にドロップされたパケットの合計数。

  • total-pkts-60mins:過去 60 分間に送信されたパケットの合計数。

  • total-drops-60mins:過去 60 分間にドロップされたパケットの合計数。

  • total-pkts:送信されたすべてのパケットの合計数。

  • total-pkts-jumbo :送信されたジャンボパケットの合計数。

  • total-drops :ドロップされたジャンボテストパケットと非ジャンボテストパケットの合計数。

  • total-drops-jumbo : ドロップされたジャンボテストパケットの数。

  • latency-warnings:遅延がしきい値を超えた回数の合計。

  • long-rtt :ミリ秒単位の最長ラウンドトリップ時間(RTT)。

  • average-rtt:見ろ秒単位の平均ラウンドトリップ時間(RTT)。

次に、 mon-di-net 統計情報モードの コマンドは、Mon-DI-Net スキーマの統計情報の収集を設定します。

See the バルク統計情報 バルク統計情報収集の設定については、「バルク統計情報」の章を参照してください。

DI ネットワークのハートビートのしきい値

この機能により、VPC-DI の展開でカード間のネットワークの正常性をモニターするために、ハートビート損失の割合で内部 DI ネットワークのしきい値を定義する機能が追加されます。

(いずれかのカード上の)ハートビート損失がしきい値の制限を超えた場合、この機能によってアラーム/SNMP トラップが生成され、その損失が示されます。

内部高可用性タスク(HAT)は、過去 5 分間のハートビート損失とカード間の 60 分間の割合を追跡し、しきい値を超えた場合、または前のアラームがクリアされた場合に SNMP アラームを生成できます。

システムには複数のカードがあり、どのカードも同じトラップ ID を生成できますが、カード情報は異なる場合があります。

この機能の範囲はシステム全体に及びます。これはサービスに固有ではなく、グローバル構成モードで設定されます。

ブートストラップファイルの生成については、 DI ネットワークハートビートのしきい値の設定 この機能を有効にする手順の詳細は、を参照してください。

モニター VPC-DI ネットワーク

機能の概要と変更履歴

要約データ

該当製品または機能エリア

すべて

該当プラットフォーム

VPC - DI

機能のデフォルト

有効、常時オン

このリリースでの関連する変更点

N/A

関連資料

  • Command Line Interface Reference

  • VPC-DI システム管理ガイド

  • Statistics and Counters Reference

マニュアルの変更履歴

改訂の詳細

リリース

最初の導入。

21.8 よりも前

機能説明

DI ネットワークでは、DI ネットワークポートが飽和状態になっている場合、または基盤となるネットワーク インフラストラクチャが信頼できない場合にパケット損失が発生します。VPC-DI ネットワークのモニター機能は、VPC-DI システムでのコントロールプレーンとデータプレーンのパケット損失の識別と定量化を可能にします。

VPC-DI は、CLI レポートとしきい値アラームで使用するコントロールプレーンとデータプレーンのモニターデータを収集して集約します。

また、この機能ではカードの障害を宣言するための VPC-DI の基準を設定することもできます。現在、アクティブな CF カードと SF カードの間に固定数のハイアベイラビリティタスク(HAT)コントロールプレーンのハートビートが連続してバウンスされると、カード障害が発生します。この機能を使用して、連続する失敗の数を設定できます。この機能により、セカンダリデータプレーンの設定パラメータが追加され、これを使用することで、DI ネットワークパケット損失とパケット処理障害のシナリオを効率的に区別できます。

機能の仕組み

コントロールプレーンとデータプレーンモニターは、2 つの基本的な DI ネットワークトラフィックタイプを固定または定期的に生成し、損失を追跡します。トラッキングデータは、DI ネットワーク通信の損失または中断を表示することを目的としています。

コントロールプレーンパケットは、通常、カード間の双方向 UDP/TCP ストリームをユニキャストします。基本的には、StarOS Proclet 間の要求と応答のペアです。

データプレーントラフィックは、カード間で転送されるユニキャスト IP プロトコル 254 パケットで構成されます。このトラフィックは、StarOs が適切なアプリケーションインスタンス(入力)またはサービスポートインターフェイス(出力)に内部的に転送するサービスポートの入力または出力であり、確認応答されません(つまり、応答パケットはありません)。たとえば、SF5 で Session Manager インスタンスがサービスを提供する SF3 ポートに到着した入力パケットは、SF3 から SF5 への DI ネットワークを通過します。

すべての動作カード(つまり、動作状態がアクティブまたはスタンバイの CF および SF)は、モニターパケットを送受信します。モニタートラフィックは完全にメッシュ化されており、すべてのカードが他のすべてのカードにモニターパケットを送信し、他のすべてのカードからモニターパケットを受信します。

データプレーンパケットは、10/秒のレートで生成されます。コントロール プレーン モニター パケットは、5/秒のレートで生成されます。両方のパケットヘッダーに、デフォルトの優先順位が付けられています。

StarOS は、すべてのカード接続について、モニターの送信、受信、およびドロップデータを収集および集約します。次に、 show cloud monitor controlplane show cloud monitor dataplane および CLI コマンドは、現在の 15 秒、5 分、および 60 分のデータを表示します。5 分と 60 分の損失率は、bulkstat mon-di-net スキーマの変数として使用できます。5 分と 60 分の損失率は、しきい値アラームやトラップとしてもアクセス可能です。

ゼロ以外の破棄確率または低破棄確率は正常であることに注意してください。測定には、完全には同期していないカードペア間の相関関係が含まれているため、要求が生成されたのと隣接する間隔で応答を受信する可能性があります。これは、要求間隔のドロップとして反映されます。

一定の間隔で表示される場合、ドロップまたは損失率が高くなると、DI ネットワークの設定または動作上の問題、トラフィックの過負荷、または VM や ホストの問題が発生することがあります。クラウドモニターは、DI ネットワークトラフィックの損失を表示し、特性を把握する機能を提供します。通常は、根本原因を特定するためにさらに調査する必要があります。

制限事項

モニター VPC-DI ネットワーク機能には、次の制限事項があります。

  • VPC-DI プラットフォームでのみサポートされています。

  • ライセンス制御されていません。

モニター VPC-DI ネットワーク機能の設定

ここでは、機能を有効または無効にするために使用できる CLI コマンドについて説明します。

カード障害検出の設定

セカンダリカードの障害検出基準を設定するには、次のコマンドを使用します。このコマンドはグローバル構成モードで設定します。

configure 
   high-availability fault-detection card dp-outage seconds 
   end 

NOTES

  • default :デフォルトの dp-outage の値を復元します。デフォルト値は 2 秒です。

  • dp-outage の延期は制限されていることに注意してください。連続するハートビートバウンスが設定された hb-loss パラメータより 5 以上大きい場合、dp-outage 設定に関係なく、カード障害が宣言されます。

  • 次に、 dp-outage パラメータは、VPC-DI プラットフォームでの管理者アクセスに制限されています。

  • この CLI が設定されていない場合、デフォルトの dp-outage の値は 2 秒です。

コントロールプレーンでのパケット損失しきい値の設定

次のコマンドを使用して、コントロールプレーン上の対応する時間間隔でのパケット損失率を測定します。しきい値アラームと SNMP トラップは、指定された期間に設定された損失率を超えるカード間接続に対して発生します。このコマンドはグローバル構成モードで設定します。

configure 
   [ default ] threshold cp-monitor-5min-loss pct [ clear pct ] 
   end 
[ default ] threshold poll cp-monitor-5min-loss interval duration 
configure 
   [default] threshold cp-monitor-60min-loss pct [ clear pct ] 
   end 
[default] threshold poll cp-monitor-60min-loss interval duration 

NOTES

  • default :コントロールプレーンの設定されたしきい値をクリアします。

  • clear pct :設定されているパケット損失率をクリアします。

  • interval duration :ポーリング間隔を構成する時間(秒単位)を指定します。 duration は、60 〜 60000 の整数である必要があります。デフォルトは 300 秒です。

  • このコマンドは、デフォルトでディセーブルになっています。


(注)  


この機能に関する補足情報については、『Command Line Reference』の 「Global Configuration Mode Commands」 セクションを参照してください。 コマンド ライン リファレンスと呼ばれます。


これらのしきい値を超過すると、次のアラームまたはトラップが生成されます。

  • ThreshControlPlaneMonitor5MinsLoss / ThreshClearControlPlaneMonitor5MinsLoss

  • ThreshControlPlaneMonitor60MinsLoss / ThreshControlPlaneMonitor60MinsLoss

See the SNMP MIB Reference これらのアラームまたはトラップの詳細については、『SNMP MIB Reference』を参照してください。

データプレーンでのパケット損失しきい値の設定

次のコマンドを使用して、データプレーン上の対応する時間間隔でのパケット損失率を測定します。しきい値アラームと SNMP トラップは、指定された期間に設定された損失率を超えるカード間接続に対して発生します。このコマンドはグローバル構成モードで設定します。

configure 
   [ default ] threshold dp-monitor-5min-loss pct [ clear pct ] 
   end 
[ default ] threshold poll dp-monitor-5min-loss interval duration 
configure 
   [default] threshold dp-monitor-60min-loss pct [ clear pct ] 
   end 
[ default ] threshold poll dp-monitor-60min-loss interval duration 

NOTES

  • default :データプレーンの設定されたしきい値を無効にします。

  • clear pct :設定されたパケット損失をクリアします。

  • interval duration :ポーリング間隔を構成する時間(秒単位)を指定します。 duration は、60 〜 60000 の整数である必要があります。デフォルトは 300 秒です。

  • このコマンドは、デフォルトでディセーブルになっています。


(注)  


この機能に関する補足情報については、『Command Line Reference』の 「Global Configuration Mode Commands」 セクションを参照してください。 コマンド ライン リファレンスと呼ばれます。


これらのしきい値を超過すると、次のアラームまたはトラップが生成されます。

  • ThreshDataPlaneMonitor5MinsLoss / ThreshClearDataPlaneMonitor5MinsLoss

  • ThreshDataPlaneMonitor60MinsLoss / ThreshDataPlaneMonitor60MinsLoss

See the SNMP MIB Reference これらのアラームまたはトラップの詳細については、『SNMP MIB Reference』を参照してください。

モニタリングおよびトラブルシューティング

この項では、機能のモニタリングとトラブルシューティングのサポートで使用できる CLI コマンドについて説明します。

コマンドや出力の表示

この項では、この機能のサポートにおける show コマンドまたはその出力について説明します。

show cloud monitor controlplane

この新しい show コマンドは、最新のコントロールプレーンモニター情報に対して次の出力を表示するために導入されました。

show cloud monitor controlplane 

  Cards      15 Second Interval     5 Minute Interval    60 Minute Interval
 Src  Dst    Xmit   Recv  Miss%    Xmit   Recv  Miss%    Xmit   Recv  Miss%
 ---  ---  ------ ------ ------  ------ ------ ------  ------ ------ ------
  01   02      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  01   03      75     75   0.0%    1500   1500   0.0%   18000  17996   0.0%
  01   04      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  01   05      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  01   06      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%

  02   01      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  02   03      75     75   0.0%    1500   1500   0.0%   18000  17997   0.0%
  02   04      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  02   05      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  02   06      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%

  03   01      75     75   0.0%    1500   1500   0.0%      -incomplete-    
  03   02      75     75   0.0%    1500   1500   0.0%      -incomplete-    
  03   04      75     75   0.0%    1500   1500   0.0%      -incomplete-    
  03   05      75     75   0.0%    1500   1500   0.0%      -incomplete-    
  03   06      75     75   0.0%    1500   1500   0.0%      -incomplete-    

  04   01      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  04   02      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  04   03      75     75   0.0%    1500   1500   0.0%   18000  17996   0.0%
  04   05      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  04   06      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%

  05   01      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  05   02      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  05   03      75     75   0.0%    1500   1500   0.0%   18000  17996   0.0%
  05   04      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  05   06      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%

  06   01      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  06   02      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  06   03      75     75   0.0%    1500   1500   0.0%   18000  17997   0.0%
  06   04      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
  06   05      75     75   0.0%    1500   1500   0.0%   18000  18000   0.0%
show cloud monitor dataplane

この新しい show コマンドは、最新のデータプレーンモニター情報に対して次の出力を表示するために導入されました。

show cloud monitor dataplane

  Cards      15 Second Interval     5 Minute Interval    60 Minute Interval
 Src  Dst    Miss    Hit    Pct    Miss    Hit    Pct    Miss    Hit    Pct
 ---  ---  ------ ------ ------  ------ ------ ------  ------ ------ ------
  02   01       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  03   01       0    150   0.0%       0   3000   0.0%      -incomplete-    
  04   01       0    151   0.0%       0   3000   0.0%       0  36000   0.0%
  05   01       0    151   0.0%       0   3000   0.0%       0  36001   0.0%
  06   01       0    150   0.0%       0   3000   0.0%       2  35998   0.0%

  01   02       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  03   02       0    150   0.0%       0   3000   0.0%      -incomplete-    
  04   02       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  05   02       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  06   02       0    151   0.0%       0   3001   0.0%       1  35999   0.0%

  01   03       0    151   0.0%       0   3000   0.0%      -incomplete-    
  02   03       0    151   0.0%       0   3000   0.0%      -incomplete-    
  04   03       0    150   0.0%       0   3000   0.0%      -incomplete-    
  05   03       0    150   0.0%       0   3000   0.0%      -incomplete-    
  06   03       0    151   0.0%       0   3000   0.0%      -incomplete-    

  01   04       0    150   0.0%       0   3001   0.0%       0  36001   0.0%
  02   04       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  03   04       0    150   0.0%       0   3000   0.0%      -incomplete-    
  05   04       1    149   0.7%       1   2999   0.0%       0  36001   0.0%
  06   04       0    150   0.0%       0   3000   0.0%       2  35998   0.0%

  01   05       1    149   0.7%       1   2999   0.0%       0  36000   0.0%
  02   05       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  03   05       0    150   0.0%       0   3000   0.0%      -incomplete-    
  04   05       0    150   0.0%       1   2999   0.0%       1  35999   0.0%
  06   05       0    150   0.0%       0   3000   0.0%       2  35998   0.0%

  01   06       0    150   0.0%       0   3001   0.0%       0  36001   0.0%
  02   06       0    151   0.0%       0   3000   0.0%       1  35999   0.0%
  03   06       0    150   0.0%       0   3001   0.0%      -incomplete-    
  04   06       0    150   0.0%       0   3000   0.0%       0  36000   0.0%
  05   06       0    150   0.0%       0   3000   0.0%       0  36000   0.0%

バルク統計情報

この機能のサポートには、次の統計情報が含まれています。

mon-di-net スキーマ

VPC-DI ネットワーク機能のモニターをサポートするため、次のバルク統計情報が mon-di-net スキーマに追加されています。

バルク統計情報

説明

cp-loss-5minave

過去 5 分間の平均コントロールプレーン損失を示します。

cp-loss-60minave

過去 60 分間の平均コントロールプレーン損失を示します。

dp-loss-5minave

過去 5 分間の平均データプレーン損失を示します。

dp-loss-60minave

過去 60 分間の平均データプレーン損失を示します。

DI ネットワークハートビートのしきい値の設定

次の手順では、損失したハートビートの割合が設定されたレベルを超えた場合に、SNMP アラームを生成するようにしきい値レベルを設定する方法について説明します。


(注)  


内部高可用性タスク(HAT)は、内部 DI ネットワーク上の VM 全体のハートビートを常にモニターしています。この情報は、 show cloud monitor di-network summary Exec モードコマンドを使用していつでも表示できます。


configure 
  monitoring hat-5min-loss 
  threshold hat-hb-5min-loss high_thresh [ clear low_thresh ] 
default threshold hat-hb-5min-loss 
  [ default ] threshold poll hat-hb-5min-loss interval duration 
configure
  monitoring hat-60min-loss 
  threshold hat-hb-60min-loss high_thresh [ clear low_thresh ] 
default threshold hat-hb-60min-loss 
  [ default ] threshold poll hat-hb-5min-loss interval duration 

(注)  


この機能に関する補足情報については、『Command Line Reference』の 「Global Configuration Mode Commands」 セクションを参照してください。 コマンド ライン リファレンスと呼ばれます。


これらのしきい値を超過すると、次のアラームまたはトラップが生成されます。

  • ThreshHatHb5MinLoss / ThreshClearHatHb5MinLoss

  • ThreshHatHb60MinLoss / ThreshClearHatHb60MinLoss

See the SNMP MIB Reference これらのアラームまたはトラップの詳細については、『SNMP MIB Reference』を参照してください。

ハートビート値の設定サポート

機能の概要と変更履歴

要約データ

該当製品または機能エリア

すべて

該当プラットフォーム

  • ASR 5500

  • VPC - DI

機能のデフォルト

無効:設定が必要

このリリースでの関連する変更点

N/A

関連資料

  • ASR 5500 System Administration Guide

  • Command Line Interface Reference

  • VPC-DI システム管理ガイド

  • Statistics and Counters Reference

マニュアルの変更履歴

改訂の詳細

リリース

このリリースでは、管理カードとデータ処理カード間のデフォルトのハートビート値を変更し、管理カードがパケット処理カードを誤って検出して故障として報告しないようにできます。

21.8

最初の導入。

21.2 よりも前

変更された機能

特定の展開シナリオでは、管理カードは、約 2 秒間ハートビートを検出できない場合に、パケット処理カードを障害として報告します。この想定される障害は、内部 DI ネットワークの輻輳が原因でハートビートが遅延または損失したときに発生します。

このリリースでは、この問題に対処しています。

以前の動作:管理カードはデフォルト値の 2 秒以内にハートビートを検出できないため、パケット処理カードを故障として報告します。これにより、予定外のスイッチオーバーが発生します。

新しい動作:管理カードがパケット処理カードを誤って検出して故障として報告しないようにするために、管理カードとデータ処理カード間のデフォルトのハートビート値を変更できるようになりました。

お客様への影響:管理カードによるデータ処理の誤った報告、および予定外のスイッチオーバーを防ぎます。

コマンドの変更

high-availability fault-detection

上記の CLI コマンドは、 card hb-loss value キーワードを含めるように拡張されています。このキーワードは、管理とパケット処理カード間のハートビート値の設定に使用されます。このコマンドはグローバル構成モードで設定します。

configure 
   [default] high-availability fault-detection card hb-loss value 
   end 

注:

  • default :ハートビート値をデフォルト値の 2 ハートビートに復元します。

  • card :パケット処理カードを指定します。

  • hb-loss value :ハートビート損失値を設定します。デフォルト値は 2 ハートビートです。

  • 管理カードと管理カードの間のハートビート値は、デフォルト値の 2 ハートビートに設定されます。

  • このコマンドは、管理カードとパケット処理カードの間のハートビート値のみを変更します。

  • デフォルトでは、この CLI は無効になっています。

モニタリングおよびトラブルシューティング

この項では、この機能のサポートにおける show コマンドまたはその出力について説明します。

show heartbeat stats hb-loss all

この show コマンドには、すべてのパケット処理カード用に次の新しいフィールドの値が含まれるようになりました。

  • Max Bounces

  • Total HB Miss

  • Total HB Card Failure

    • Card/Cpu

    • Total

    • Age/Intf/Seqno/TimeStamp

    • AFD(最も古いものから順に)

show heartbeat stats hb-loss card card-number

この show コマンドには、指定されたパケット処理カード用に次の新しいフィールドの値が含まれるようになりました。

  • Max Bounces

  • Total HB Miss

  • Total HB Card Failure

    • Card/Cpu

    • Total

    • Age/Intf/Seqno/TimeStamp

    • AFD(最も古いものから順に)

SF のモニタリング

アクティブ SF とスタンバイ SF ごとに NPU 統計情報を表示するには、 コマンドを使用します。 show npu utilization table コマンドを削除しないでください。過去 5 秒間、過去 5 分間、過去 15 分間の統計情報が報告されます。出力例を次に示します。


[local]swch91# show npu utilization table

 ******** show npu utilization table card 4 *******
                5-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |     0%|       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
              300-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |     0%|       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
              900-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |     0%|       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
 
 
 
thread 1 IDLE                           99.32 % 
thread 1 QUEUE_KNI_RX                    0.63 % 
thread 1 QUEUE_PORT_RX                   0.05 % 
-----------------------------------------------

 ******** show npu utilization table card 5 *******
                5-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |       |       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |     0%|       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
              300-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |       |       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |     0%|       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
              900-Sec Avg:   lcore00|lcore01|lcore02|lcore03|lcore04|lcore05|lcore06|lcore07|
                     IDLE:          |    99%|       |       |       |       |       |       | 
            QUEUE_PORT_RX:          |       |       |       |       |       |       |       | 
            QUEUE_PORT_TX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_RX:          |       |       |       |       |       |       |       | 
            QUEUE_VNPU_TX:          |       |       |       |       |       |       |       | 
             QUEUE_KNI_RX:          |     0%|       |       |       |       |       |       | 
             QUEUE_KNI_TX:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_KNI:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_RX:          |       |       |       |       |       |       |       | 
           QUEUE_MCDMA_TX:          |       |       |       |       |       |       |       | 
       QUEUE_THREAD_MCDMA:          |       |       |       |       |       |       |       | 
        QUEUE_THREAD_VNPU:          |       |       |       |       |       |       |       | 
          QUEUE_CRYPTO_RX:          |       |       |       |       |       |       |       | 
         QUEUE_CRYPTO_IPC:          |       |       |       |       |       |       |       | 
         QUEUE_THREAD_IPC:          |       |       |       |       |       |       |       | 
              MCDMA_FLUSH:          |       |       |       |       |       |       |       | 
    QUEUE_THREAD_TYPE_MAX:          |       |       |       |       |       |       |       | 
 
  
thread 1 IDLE                           99.37 % 
thread 1 QUEUE_KNI_RX                    0.55 % 
thread 1 QUEUE_PORT_RX                   0.08 % 
-----------------------------------------------
  
表 2. show npu utilization table

フィールド

説明

IDLE

各コアのアイドル時間

QUEUE_PORT_RX

RX ポートの処理にかかった時間

QUEUE_PORT_TX

TX ポートの処理にかかった時間

QUEUE_VNPU_RX

RX vNPU の処理にかかった時間

QUEUE_VNPU_TX

TX vNPU の処理にかかった時間

QUEUE_KNI_RX

RX カーネル ネットワーク インターフェイス(KNI)の処理にかかった時間。KNI は、IFTASK からのカーネルへのパスです。

QUEUE_KNI_TX

TX KNI の処理にかかった時間

QUEUE_THREAD_KNI

KNI 処理専用のスレッド

QUEUE_MCDMA_RX

RX マルチチャネル ダイレクト メモリアクセス(DMA)(MCDMA)の処理にかかった時間。MCDMA は、IFTASK から SESSMGR へのパスです。

QUEUE_MCDMA_TX

TX MCDMA の処理にかかった時間。

QUEUE_THREAD_MCDMA

MCDMA 処理専用のスレッド

QUEUE_THREAD_VNPU

VNPU 処理専用のスレッド

QUEUE_CRYPTO_RX

IPSec の処理にかかった時間

QUEUE_CRYPTO_IPC

IPSec プロセス間通信(IPC)の処理にかかった時間

MCDMA_FLUSH

MCDMA パケットのフラッシュにかかった時間

QUEUE_THREAD_TYPE_MAX

未使用

統計情報とカウンタのクリア

新しい情報を収集するために、定期的に統計情報とカウンタをクリアする必要がある場合があります。システムは、グループ化(PPP、MIPHA、MIPFA など)に基づいて統計情報とカウンタをクリアする機能を提供します。

統計情報とカウンタは、CLI clear コマンドを使用してクリアできます。 clear コマンドを削除しないでください。参照先 Exec モードのコマンド このコマンドの使用方法の詳細については、『Command Line Interface Reference』の Command Line Interface Reference 「 Exec Mode Commands」の章を参照してください。