概要
このドキュメントでは、ポートごとのデータリンクカウンタまたはNPUカウンタの増加を検出するスクリプトについて説明します。
前提条件
要件
次の項目に関する知識があることが推奨されます。
使用するコンポーネント
このドキュメントの内容は、特定のソフトウェアやハードウェアのバージョンに限定されるものではありません。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
問題
ポートレベルのエラーカウンタは、StarOSノードに関するさまざまな問題のトラブルシューティングに役立つ情報の優れたソースである可能性があります。
この場合、最も価値のある情報は、特定の期間におけるカウンタの変動です。
単一の「show」コマンドの出力で使用可能な静的な値は、意味のある結論を出すのに十分な情報を提供しません。
一般的なアプローチは、showコマンドの出力をいくつか収集し、手動で違いを行うことです。
これは、特に、どのポートが正確に影響を受けているかが分からない場合には、困難な作業になる可能性があります。
このスクリプトは、ポートごとに一定の期間のエラーカウンタのバリエーションを提供することで、このプロセスを簡素化します。
検出できる問題の例:
- MTUの不一致
- VLANの設定ミス
- DataLinkレベルのエラー
スクリプトの仕組み
SSDファイルには、数分の間隔でshow port npu countersとshow port datalink countersの出力が2つあります。
これにより、は特定の時点でポートレベルのカウンタを表示し、そのダイナミクスも確認できます。
このスクリプトは、コマンド出力のエラーカウンタをチェックし、カウンタの増加が確認されたときにアラートを生成します。
通常、これは物理またはネットワークレベルの問題を示します。状況に応じて、トラブルシューティングの手順に進みます。
NPUカウンタ
次のNPUカウンタが確認されています。
カウンタ |
説明 |
注意事項 |
HWエラー |
先入れ先出し(FIFO)オーバーランまたはアンダーランが原因で廃棄されたパケットの数。 |
|
ポートが非動作 |
ポートが動作していないために廃棄されたパケットの数。 |
|
送信元MACはマルチキャストです |
送信元MACアドレスが原因で廃棄されたパケットの数はマルチキャストです。 |
|
不明なVLANタグ |
認識できない仮想ローカルエリアネットワーク(VLAN)タグが原因で廃棄されたパケットの数。 |
ネクストホップスイッチのVLAN設定をチェックします |
不正なIPv4ヘッダー |
無効なIPv4ヘッダーが原因で廃棄されたパケットの数 |
|
IPv4 MRUを超えました |
パケット長が長すぎるために廃棄されたパケットの数。 |
|
TCPの小さいフラグメント |
TCPの小さいフラグメントが原因で廃棄されたパケットの数 |
|
TTL期限切れ |
存続可能時間パラメータを超えたために廃棄されたパケットの数。 |
|
短すぎます:IP |
IPパケットが短すぎるために廃棄されたパケットの数 |
|
短すぎます:ICMP |
ICMPパケットがルックアップキーに対して短すぎるために廃棄されたパケットの数 |
|
短すぎます:IGMP |
IGMPパケットがルックアップキーに対して短すぎるために廃棄されたパケットの数 |
|
短すぎます:TCP |
TCPパケットがルックアップキーに対して短すぎるために廃棄されたパケットの数 |
|
短すぎます:UDP |
UDPパケットがルックアップキーに対して短すぎるために廃棄されたパケットの数 |
|
短すぎます:IPIP |
UDPパケットがルックアップキーに対して短すぎるために廃棄されたパケットの数 |
明らかにドキュメントのタイプミス。おそらくIPIPパケットからルックアップキーが短くなります。 |
短すぎます:GRE |
GREヘッダーサイズが8バイト未満のため廃棄されたパケットの数 |
|
短すぎます:GREキー |
GREヘッダーが原因で廃棄されたパケットの数は、キーは存在するが、ヘッダーサイズが< 13バイトであることを示します |
|
廃棄をフラグ解除しない |
IPヘッダーがフラグメントビットに設定されていないため、NPUによって廃棄されるフラグメンテーションを必要とするパケット。 |
|
IPv4VlanMap dropped |
ドロップされたIPv4 VLANマップパケットの合計数。 |
|
MPLSフローが見つかりません |
MPLSフローが見つからなかったときにドロップされたパケットの総数。 |
|
データリンクカウンタ
次のデータリンクカウンタが分析されます。
カウンタ |
説明 |
注意事項 |
RXバイト不良 |
受信バイト数。 |
|
TXバイトが不正 |
エラーとともに送信されたバイト数。 |
|
RX OVF |
受信したオーバーフローの数。 |
|
TX遅延 |
ビジー回線が原因で最初の送信試行で遅延されたフレームの数。 |
|
TX COL |
送信中に発生した通常の衝突イベントの数。 |
|
RXショートCRC |
Cyclic Redundancy Check(CRC;巡回冗長検査)エラーで受信された、長さが64バイト未満のフレームの数。 |
|
TX SCOL |
1回のコリジョンの後、エラーなしで送信されたフレームの数。 |
|
RX NO SFD |
開始フレームデリミタ(SFD)が検出されずに、キャリアアサーションで受信されたフレームの数。 |
|
TX MCOL |
複数のコリジョンの後、エラーなしで送信されたフレームの数。 |
|
TX XCOL |
16回以上のコリジョンが発生したフレームの数。 |
|
TX LCOL |
長さが64バイトのパケットの送信後に発生した、衝突による送信中絶の数。 |
|
TX一時停止 |
正しく送信されたフロー制御フレームの数。 |
|
RX LONG CRC |
CRCエラーで受信した、最大フレームサイズよりも大きいフレームの数。 |
|
TX ERR |
送信FIFOアンダーフローまたはTXERR信号アサーションによるエラーで送信されたフレームの数 |
|
RX一時停止 |
正しく受信されたフロー制御フレームの数。 |
|
RX FALS CRS |
検出されたfalse carrierイベントの数。 |
|
RX SYM ERR |
物理(PHY)シンボルエラーが検出された受信フレームの数。 |
|
RX不良フレーム |
受信したエラーのあるフレームの数。 |
|
RXラントフレーム |
予想サイズより小さい受信フレームの数。 |
|
RXオーバーサイズフレーム |
受信したオーバーサイズフレームの数。 |
おそらくドキュメントのエラーです。「RX OverSize frames」と同じにする必要があります |
RX OverSizeフレーム |
受信したサイズ超過フレームの数。 |
|
RXノルムCRC |
64バイトの長さと最大フレームサイズの間のフレーム数。整数バイト数と巡回冗長検査(CRC)エラーで受信されたフレームの数。 |
|
RX NORM ALI |
64バイトの長さと最大フレームサイズの間のフレーム数。整数以外のバイト数と巡回冗長検査(CRC)エラーで受信されたフレーム数。 |
|
RX GPCS ERR |
物理(PHY)シンボルエラーが検出された受信フレームの数。 |
|
STMインターフェイスだけに表示される一連のデータリンクカウンタがあります。
カウンタ |
説明 |
注意事項 |
rx frames FECN set |
|
フレームリレー関連 |
rx frames BECN set |
|
フレームリレー関連 |
rx CRCエラー |
|
|
rxアライメントエラー |
|
|
Rx Length Violations |
|
|
rx FBP empty |
|
|
rx host queue full |
|
|
RX不正なヘッダー |
|
|
rx abort |
|
|
rxパリティエラー |
|
|
rx unsupported DLCI |
|
フレームリレー関連 |
rx SOP/EOPエラー |
|
|
rx合計エラーバイト |
|
|
tx frames FECN set |
|
フレームリレー関連 |
tx frames BECN set |
|
フレームリレー関連 |
txアンダーラン |
|
|
tx aborted frames |
|
|
|
|
|
出力例
show port npu countersorshow port datalinkカウンタ出力の一部のエラーまたはドロップカウンタの増加は、提供されているSSDで観察されます。
スクリプトは、チェックされているすべてのカウンタを強調表示しますが、増加しているカウンタだけを分析する必要があります。分析するカウンタには、「Following increase observed for port」文が含まれています
このような増加は、必ずしもノードの問題を指しているわけではありません。通常、ケーブル、SFP、誤設定、ネットワークレベルの問題が発生します。
影響を受けるカウンタの定義を確認し、それに基づいてトラブルシューティングの手順に進みます。
########################## NPU COUNTERS ######################################
No errors increase found during monitoring period
######################## DATALINK COUNTERS ###################################
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
- Following increase in errors is seen on port 6/10:
RX OverSize frames:Frames: 404
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
- Following increase in errors is seen on port 5/15:
RX OverSize frames:Frames: 3
出力の理解
どのポートでも対象のカウンタに変動が見られなかった場合、スクリプトは何も返しません。
対象のカウンタが1つ以上ある場合、少なくとも1つのポートに変動がある場合 – スクリプトはアラートを生成しません。
アラートは、タイプ(NPUまたはデータリンク)ごとにグループ化され、ポートごとにグループ化されます。
まず、すべての結果と監視期間を要約したステートメントがあります。
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
上記の範囲は月曜日、1001 12:29:49 CDT 2018年10月日、10月日、10月1日、つまり30分です。
タイムスタンプは、show port datalink countersの出力またはshow port npu countersの出力から取得されます
その後、問題のあるカウンタの要約がポートごとに特定されます。
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
前述の例では、モニタリング期間中(約30分)に6/16ポートで402個のオーバーサイズのフレームが受信されました。