소개
이 문서에서는 포트당 오류 Datalink 또는 NPU 카운터의 증가를 탐지하는 스크립트에 대해 설명합니다.
사전 요구 사항
요구 사항
다음 주제에 대한 지식을 보유하고 있으면 유용합니다.
사용되는 구성 요소
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다.이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다.네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 이해해야 합니다.
문제
포트 수준의 오류 카운터는 StarOS 노드의 다양한 문제를 해결하기 위해 유용한 정보 소스가 될 수 있습니다.
이 경우 가장 중요한 정보는 특정 기간 동안 이러한 카운터의 변형입니다.
단일 "show" 명령의 출력에서 사용할 수 있는 정적 값은 의미 있는 결론을 내릴 수 있는 충분한 정보를 제공하지 않습니다.
일반적인 방법은 show 명령의 여러 출력을 수집한 다음 수동으로 차이를 만드는 것입니다.
이는 어려운 작업일 수 있습니다. 특히 어떤 포트가 정확히 영향을 받는지 알려지지 않은 경우 더욱 그렇습니다.
이 스크립트는 포트당 특정 기간 동안 오류 카운터의 변형을 제공하여 이 프로세스를 간소화합니다.
탐지할 수 있는 문제의 예:
- MTU 불일치
- VLAN 컨피그레이션 오류
- DataLink 수준 오류
스크립트 작동 방식
SSD 파일에는 show port npu 카운터와 몇 분 간격에 소요된 show port datalink 카운터의 출력이 2개 있습니다.
이렇게 하면 특정 시점에 포트 수준 카운터를 볼 수 있으며 해당 카운터의 역성도 확인할 수 있습니다.
이 스크립트는 명령 출력에서 오류 카운터를 확인하고 카운터의 증가를 관찰하면 경고를 생성합니다.
일반적으로 물리적 또는 네트워크 레벨에서 문제가 있음을 나타냅니다.상황에 따라 트러블슈팅을 위한 단계를 진행합니다.
NPU 카운터
다음 NPU 카운터가 관찰됩니다.
카운터 |
설명 |
참고 |
HW 오류 |
FIFO(first-in, first-out) 오버런 또는 언더런으로 인해 삭제된 패킷 수 |
|
포트 비작동 |
포트가 작동하지 않아 삭제된 패킷 수입니다. |
|
SRC MAC은 멀티캐스트 |
소스 MAC 주소로 인해 삭제된 패킷 수는 멀티캐스트입니다. |
|
알 수 없는 VLAN 태그 |
인식할 수 없는 VLAN(Virtual Local Area Network) 태그로 인해 삭제된 패킷 수입니다. |
next-hop 스위치에서 VLAN 컨피그레이션을 확인합니다. |
잘못된 IPv4 헤더 |
잘못된 IPv4 헤더로 인해 삭제된 패킷 수 |
|
IPv4 MRU 초과 |
패킷 길이로 인해 삭제된 패킷 수가 너무 깁니다. |
|
TCP 작은 조각 |
TCP 작은 프래그먼트로 인해 삭제된 패킷 수 |
|
TTL 만료 |
time-to-live 매개 변수가 초과되어 삭제된 패킷 수입니다. |
|
너무 짧음:IP |
IP 패킷이 너무 짧아서 삭제된 패킷 수 |
|
너무 짧음:ICMP |
ICMP 패킷이 조회 키에 비해 너무 짧아서 폐기된 패킷 수 |
|
너무 짧음:IGMP |
IGMP 패킷이 너무 짧아서 조회 키를 사용할 수 없어 삭제된 패킷 수 |
|
너무 짧음:TCP |
TCP 패킷이 조회 키에 비해 너무 짧기 때문에 삭제된 패킷 수 |
|
너무 짧음:UDP |
UDP 패킷이 조회 키에 비해 너무 짧아서 삭제된 패킷 수 |
|
너무 짧음:IPIP |
UDP 패킷이 조회 키에 비해 너무 짧아서 삭제된 패킷 수 |
서류상의 오타아마도 조회 키에 짧아야 할 IPIP 패킷일 것입니다. |
너무 짧음:GRE |
GRE 헤더 크기 < 8바이트 때문에 삭제된 패킷 수 |
|
너무 짧음:GRE 키 |
GRE 헤더로 인해 삭제된 패킷 수는 키가 있지만 헤더 크기는 13바이트 미만입니다. |
|
폐기 금지 |
IP 헤더가 프래그먼트 비트를 설정하지 않으므로 NPU에서 폐기하는 프래그먼트화가 필요한 패킷입니다. |
|
IPv4VlanMap 삭제됨 |
삭제된 총 IPv4 VLAN 맵 패킷 수입니다. |
|
MPLS 흐름을 찾을 수 없음 |
MPLS 흐름을 찾을 수 없을 때 삭제된 총 패킷 수입니다. |
|
Datalink 카운터
이러한 데이터 링크 카운터는 분석됩니다.
카운터 |
설명 |
참고 |
RX 바이트 오류 |
수신된 바이트 수입니다. |
|
TX 바이트 BAD |
오류로 전송된 바이트 수입니다. |
|
RX OVF |
수신된 초과 플로우 수입니다. |
|
TX 지연 |
통화 중 회선으로 인해 첫 번째 전송 시도 시 지연된 프레임 수입니다. |
|
TX 열 |
전송 중에 발생하는 정기 충돌 이벤트 수입니다. |
|
RX 짧은 CRC |
길이 64바이트 미만의 프레임 수(CRC(cyclical redundancy check) 오류로 수신됨) |
|
TX SCOM |
단일 충돌 후 오류 없이 전송된 프레임 수입니다. |
|
RX NO SFD |
SFD(시작 프레임 구분 기호) 감지를 사용하지 않고 캐리어 어설션을 사용하여 받은 프레임 수입니다. |
|
TX MCOL |
여러 충돌 후 오류 없이 전송된 프레임 수입니다. |
|
TX XCOL |
16개 이상의 연속 충돌이 발생한 프레임 수입니다. |
|
TX LCOL |
길이가 64바이트인 패킷의 전송 후 발생한 충돌로 인한 전송 중단 횟수입니다. |
|
TX 일시 중지 |
올바른 전송 흐름 제어 프레임 수입니다. |
|
RX 긴 CRC |
CRC 오류와 함께 수신되는 최대 프레임 크기보다 큰 프레임 수입니다. |
|
TX 오류 |
전송 FIFO 언더플로우 또는 TXERR 신호 어설션으로 인해 오류가 발생하여 전송된 프레임 수 |
|
RX 일시 중지 |
올바른 수신 흐름 제어 프레임 수입니다. |
|
RX FALS CRS |
탐지된 잘못된 캐리어 이벤트 수 |
|
RX SYM 오류 |
물리적(PHY) 기호 오류가 탐지된 수신 프레임 수 |
|
RX 불량 프레임 |
오류가 있는 수신된 프레임 수입니다. |
|
RX 런트 프레임 |
수신된 프레임 수가 예상 크기보다 작습니다. |
|
RX 오버사이즈 프레임 |
받은 초과 크기 프레임 수입니다. |
문서에 오류가 있을 수 있습니다."RX OverSize 프레임"과 같아야 합니다. |
RX OverSize 프레임 |
받은 큰 프레임 수입니다. |
|
RX 표준 CRC |
길이가 64바이트와 최대 프레임 크기 사이인 프레임 수가 적분 바이트 수와 CRC(cyclical redundancy check) 오류와 함께 수신됩니다. |
|
RX 노엄 알리 |
길이가 64바이트와 최대 프레임 크기 사이인 프레임 수(비정수 바이트 수 및 CRC(cyclical redundancy check) 오류와 함께 수신됨). |
|
RX GPCS 오류 |
물리적(PHY) 기호 오류가 탐지된 수신 프레임 수 |
|
STM 인터페이스에만 표시되는 일련의 데이터 링크 카운터가 있습니다.
카운터 |
설명 |
참고 |
rx 프레임 FCN 세트 |
|
프레임 릴레이 관련 |
rx 프레임 세트 |
|
프레임 릴레이 관련 |
rx CRC 오류 |
|
|
rx 정렬 오류 |
|
|
rx 길이 위반 |
|
|
rx FBP가 비어 있습니다. |
|
|
rx 호스트 큐 가득 참 |
|
|
rx 잘못된 헤더 |
|
|
rx 중단 |
|
|
rx 패리티 오류 |
|
|
rx 지원되지 않는 DLCI |
|
프레임 릴레이 관련 |
rx SOP/EOP 오류 |
|
|
rx 총 오류 바이트 |
|
|
tx 프레임 FCN 세트 |
|
프레임 릴레이 관련 |
tx 프레임 BECN 세트 |
|
프레임 릴레이 관련 |
tx 언더런 |
|
|
tx 중단된 프레임 |
|
|
|
|
|
출력 예
제공된 SSD에서 포트 npu 카운터에서오류 또는 삭제 카운터의 일부를 증가시킵니다.port datalink countersourtpts가 관찰됩니다.
이 스크립트에서는 확인 중인 모든 카운터를 강조 표시하지만, 증가된 카운터만 분석해야 합니다. 이는 port문에 대해 관찰된 'Following increase'가 포함된 카운터입니다.
이러한 증가로 인해 노드 문제가 반드시 발생하는 것은 아닙니다.일반적으로 케이블, SFP, 컨피그레이션 오류 또는 네트워크 수준 문제가 있습니다.
영향을 받는 카운터의 정의를 확인하고 이에 따라 문제를 해결하기 위한 단계를 진행합니다.
########################## NPU COUNTERS ######################################
No errors increase found during monitoring period
######################## DATALINK COUNTERS ###################################
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
- Following increase in errors is seen on port 6/10:
RX OverSize frames:Frames: 404
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
- Following increase in errors is seen on port 5/15:
RX OverSize frames:Frames: 3
결과를 이해하는 방법
어떤 포트에도 관심이 있는 카운터에서 변형이 나타나지 않으면 스크립트는 아무 것도 반환하지 않습니다.
하나 이상의 관심 카운터가 있는 변형이 하나 이상 있는 경우, 적어도 하나의 포트에서는 스크립트가 경고를 생성하지 않습니다.
알림은 유형(NPU 또는 Datalink)별로 그룹화된 다음 포트별로 그룹화됩니다.
먼저, 모든 발견과 모니터링 기간을 요약하는 성명이 있을 것입니다.
Errors observed in the output of 'show port datalink counters' between Monday October 01 12:29:49 CDT 2018 and Monday October 01 13:03:24 CDT 2018 on the ports 6/10,6/16,5/15
위 날짜는 10월 1일 월요일 12시 29분 49초 CDT 2018에서 10월 1일 13시 3분 24초 CDT 2018의 월요일, 즉 30분입니다.
타임스탬프는 show port datalink 카운터의 출력에서 또는 각각 show port npu 카운터에서 가져옵니다.
그 후에는 포트별로 확인된 문제 카운터의 요약이 있습니다.
- Following increase in errors is seen on port 6/16:
RX OverSize frames:Frames: 402
앞에서 언급한 예에서 6/16 포트에서 수신되는 402개의 대용량 프레임이 모니터링 기간(약 30분) 동안 있었습니다.