ネットワーク インフラストラクチャを計画するため、テレメトリ データを使用して CPU 使用率をモニタする
この使用例では、ダイヤルアウト モードで、テレメトリ データを使用して CPU 使用率をプロアクティブにモニタする方法を示します。CPU 使用率をモニタすることにより、ネットワーク内のストレージ機能を効率化することができます。この使用例では、オープンソースの収集スタックにある、テレメトリ データの保存および分析に使用するツールについて説明します。
(注) |
データ モデル、オープンソースのコレクタ、エンコーディングを利用し、それらをモニタリング ツールに統合するためにモデル駆動型テレメトリを設定する方法については、こちらのビデオをご覧ください。 |
-
定義:ルータから受信者にデータをストリーミングするためのサブスクリプションを定義します。サブスクリプションを定義するには、宛先グループとセンサーグループを作成します。
-
展開:ルータは、サブスクリプションベースのテレメトリ セッションを確立し、受信者にデータをストリーミングします。ルータでサブスクリプションの展開を確認します。
-
運用:オープンソース ツールを使用してテレメトリ データを消費および分析し、分析に基づいて必要なアクションを実行します。
始める前に
ルータから受信者にデータをストリーミングするためのサブスクリプションを定義する
手順
ステップ 1 |
ルータからテレメトリ データを収集する宛先を 1 つ以上作成します。宛先に関する詳細を格納する宛先グループを定義します。宛先グループには、宛先アドレス(ipv4 または ipv6)、ポート、トランスポート、およびエンコーディング形式を含めます。 例:データ モデルを使用して宛先グループを作成する この例では、ネイティブ データモデル
CLI を使用して宛先グループを作成する
|
||
ステップ 2 |
センサー パスを使用して、ルータからストリーミングするデータのサブセットを指定します。センサー パスは、YANG データモデルの階層内のパスを表します。センサー パスを含むセンサーグループを作成します。 例:
|
||
ステップ 3 |
ルータからストリーミングされるテレメトリ データをサブスクライブします。サブスクリプションは、宛先グループをセンサーグループにバインドし、ストリーミング方式を設定します。ストリーミング方式は、パターン駆動型テレメトリまたはイベント駆動型テレメトリにすることができます。 例:
データ モデルを使用してサブスクリプションを作成する
CLI を使用してサブスクリプションを作成する
|
サブスクリプションの展開を確認する
ルータは、受信者にダイヤルアウトし、サブスクリプション内の各宛先とのセッションを確立します。セッションが確立されると、ルータはデータを受信者にストリーミングしてデータ レイクを作成します。
サブスクリプションの展開は、ルータ上で確認できます。
手順
ステップ 1 |
ルータで、モデル駆動型テレメトリの設定を表示します。 例:
|
ステップ 2 |
サブスクリプションの状態を確認します。 例:
ルータは、サブスクリプションベースのテレメトリ セッションを使用して受信者にデータをストリーミングし、受信側にデータ レイクを作成します。 |
ネットワークの詳細な分析のためにテレメトリ データを操作する
-
Pipeline は、データを収集するために使用される軽量ツールです。Network Telemetry Pipeline は、Github からダウンロードできます。
pipeline.conf
ファイルを使用して、コレクタがルータと通信する方法と処理されたデータを送信する場所を定義します。 -
Telegraph(プラグイン駆動型サーバ エージェント)および InfluxDB(時系列データベース(TSDB))は、可視化ツールによって取得されるテレメトリ データを保存します。InfluxDB は、Github からダウンロードできます。
metrics.json
ファイルを使用して、TSDB に含めるデータを定義します。 -
Grafana は、ルータからストリーミングされたデータのグラフおよびカウンタを表示する可視化ツールです。
つまり、Pipeline は TCP および gRPC テレメトリ ストリームを受け入れてデータを変換し、そのデータを InfluxDB データベースにプッシュします。Grafana は、InfluxDB データベースからのデータを使用してダッシュボードおよびグラフを作成します。Pipeline と InfluxDB は、同じサーバ上でも異なるサーバ上でも実行できます。
ルータは 約 350 のカウンタのデータを 5 秒ごとにストリーミングし、Telegraf は Pipeline からの情報を 1 秒間隔で要求しているとします。CPU 使用率は、次を使用して 3 つのステージで分析されます。
-
最初の値を取得する単一のルータ
-
値の差異を特定し、パターンを把握する 2 台のルータ
-
証拠に基づく結論に達するための 5 台のルータ
手順
ステップ 1 |
Pipeline を開始し、ルータのクレデンシャルを入力します。
例:
|
||
ステップ 2 |
CPU 使用率に関するメトリックを読み取るため、Telegraph 設定ファイルで次の値を追加します。 例:
|
||
ステップ 3 |
Grafana を使用してダッシュボードを作成し、CPU 使用率に関するデータを可視化します。 1 台のルータ ルータは 5 秒ごとにカウンタをプッシュします。 すべての CPU コアに負荷が均等に分散され、約 10% または 11% までのスパイクが発生しています。 2 台のルータ 2 台目のルータがタイムラインの 5 台のルータ 5 台のルータが使用され、約 40% をピークとするスパイクが発生しています。中間値は 約 22 ~ 25% の範囲です。 |