소개
이 문서에서는 Cisco Nexus 7000 Series 스위치에서 UDLD(Uni-Directional Link Detection) 오류 메시지를 해결하는 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
Cisco에서는 다음 항목에 대한 기본 지식을 갖춘 것을 권장합니다.
- Cisco Nexus 운영 체제(Cisco NX-OS)
- 기본 UDLD 운영
사용되는 구성 요소
이 문서의 정보는 다음 소프트웨어 및 하드웨어 버전을 기반으로 합니다.
- Cisco Nexus 7000 Series Switch
- Cisco NX-OS 버전 6.2(10)
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
배경 정보
포트는 UDLD 탐지 프로세스가 실행될 때 UDLD 패킷을 교환합니다. 여기에는 발신자 스위치 ID 및 발신자 포트 ID가 포함됩니다. UDLD 패킷이 수신되면 스위치는 피어 스위치 ID 및 포트 ID를 다시 피어에 에코합니다. 스위치에서 에코 패킷을 교환하면 양방향 관계가 형성됩니다.
스위치가 UDLD 피어에서 필요한 정보를 수신하지 못할 경우 UDLD 오류 조건이 발생합니다.
이 문서에서는 이러한 UDLD 오류 상태 및 문제 해결 방법에 대해 설명합니다.
- 빈 에코
- Tx-Rx(Transmit-Receive) 루프
- 단방향
- 인접 디바이스 불일치
- UDLD 프레임의 갑작스러운 중단
UDLD 오류 조건
이 섹션에서는 다양한 유형의 UDLD 오류 조건 및 몇 가지 가능한 원인을 설명합니다.
빈 에코
이 조건은 Switch-A가 Switch-B로부터 UDLD 프레임을 Switch-A switch-ID 및 port-ID의 예상 에코 없이 수신할 때 발생합니다.
빈 에코가 감지되면 UDLD는 다음 작업을 수행합니다.
모드로 들어갑니다
|
작업
|
일반 모드 |
err-disable 포트 |
적극적인 모드 |
err-disable 포트 |
그런 다음 다음과 같은 syslog 메시지가 생성됩니다.
2015 Mar 19 11:57:56.155 N7kA ETHPORT-2-IF_DOWN_ERROR_DISABLED Interface Ethernet1/2
is down (Error disabled. Reason:UDLD empty echo)
2015 Mar 19 11:57:56.186 N7kA ETH_PORT_CHANNEL-5-PORT_INDIVIDUAL_DOWN individual port
Ethernet1/2 is down
2015 Mar 19 11:57:56.336 N7kA ETHPORT-2-IF_DOWN_ERROR_DISABLED Interface Ethernet1/2
is down (Error disabled. Reason:UDLD empty echo)
이 상태의 가능한 원인은 다음과 같습니다
- Switch-B에서 UDLD 양방향 관계가 시간 초과되었습니다. Switch-A에서 UDLD 프레임을 수신하지 않기 때문입니다.
- Switch-B는 Switch-A로부터 UDLD 프레임을 받았지만 처리하지 않았습니다.
- Switch-A가 UDLD 프레임을 Switch-B로 전송하지 않았습니다.
Tx-Rx 루프
이 조건은 UDLD 프레임이 전송된 포트와 동일한 포트에서 수신될 때 발생합니다.
Tx-Rx 루프가 탐지되면 UDLD는 다음 작업을 수행합니다.
모드로 들어갑니다
|
작업
|
일반 모드 |
err-disable 포트 |
적극적인 모드 |
err-disable 포트 |
그런 다음 다음과 같은 syslog 메시지가 생성됩니다.
2015 Mar 20 14:52:30 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet17/5
is down (Error disabled. Reason:UDLD Tx-Rx Loop)
2015 Mar 20 14:52:30 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet17/5
is down (Error disabled. Reason:UDLD Tx-Rx Loop)
이 상태에 대한 몇 가지 가능한 원인은 다음과 같습니다.
- 잘못된 배선이나 물리적 미디어 문제가 있을 수 있습니다.
- 중간 디바이스는 프레임을 다시 전송 포트로 반사합니다.
인접 디바이스 불일치
이 조건은 스위치 A의 포트 A가 이미 UDLD 양방향 관계를 형성한 포트가 아닌 다른 포트에서 프레임을 수신할 때 발생합니다.
인접 디바이스 불일치가 감지되면 UDLD는 다음 작업을 수행합니다.
모드로 들어갑니다
|
작업
|
일반 모드 |
err-disable 포트 |
적극적인 모드 |
err-disable 포트 |
그런 다음 다음과 같은 syslog 메시지가 생성됩니다.
2015 Mar 21 10:23:05.598 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet3/21
is down (Error disabled. Reason:UDLD Neighbor mismatch)
2015 Mar 21 10:24:07.065 N7kA %ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet3/21
is down (Error disabled. Reason:UDLD Neighbor mismatch)
이 상태에 대한 몇 가지 가능한 원인은 다음과 같습니다.
- 해당 UDLD 포트는 멤버 포트가 상태가 변경된 포트 채널의 멤버입니다.
- 양방향 관계를 형성한 두 포트 사이에는 중간 장치가 있습니다.
UDLD 프레임의 갑작스러운 중단
이 조건은 간격이 시간 초과될 때(기본적으로 50초) 양방향 관계를 형성한 포트에서 UDLD 프레임을 수신하지 못할 때 발생합니다.
이 조건이 탐지되면 UDLD는 다음 작업을 수행합니다.
모드로 들어갑니다
|
작업
|
일반 모드 |
UDLD는 포트를 Undetermined(미결정)로 표시하며, 포트가 스패닝 트리 포트 상태에 따라 계속 작동합니다 |
적극적인 모드 |
err-disable 포트 |
UDLD 오류 상태 트러블슈팅
이 섹션에서는 UDLD 포트가 있는 경우 문제를 해결하고 완료해야 하는 단계를 수행하는 방법에 대해 error-disabled 설명합니다.
UDLD 오류는 물리적 레이어의 결함을 나타내므로 물리적 레이어에서 트러블슈팅하는 것이 적절합니다. UDLD 오류 메시지가 나타나면 다음 질문을 고려하십시오.
- SFP(Small Form-Factor Pluggable Transceiver)를 교체해도 오류가 계속 발생합니까?
- 케이블을 교체해도 오류가 계속 발생합니까?
- 스위치의 다른 물리적 포트로 연결이 이동해도 오류가 계속 발생합니까?
유용한 명령
UDLD에 의해 모드로 전환된 모든 포트를 복원하려면error-disable 다음 명령을 사용합니다.
N7KA(config)# udld reset
양방향 관계를 확인하려면 다음 명령을 사용합니다.
N7KA-NORTH-AGG(config-if)# show udld eth 3/4
Interface Ethernet3/4
--------------------------------
Port enable administrative configuration setting: enabled
Port enable operational state: enabled
Current bidirectional state: bidirectional
Current operational state: advertisement - Single neighbor detected
Message interval: 7
Timeout interval: 5
Entry 1
----------------
Expiration time: 39
Cache Device index: 1
Current neighbor state: bidirectional
Device ID: JAF1620ABAB
Port ID: Ethernet3/12
Neighbor echo 1 devices: JAF1617BACD
Neighbor echo 1 port: Ethernet3/4
Message interval: 15
Timeout interval: 5
CDP Device name: N7KB-SOUTH-AGG(JAF1620ABAB)
Last pkt send on: 400096, Aug 6 13:58:52 2014
Probe pkt send on: 400096, Aug 6 13:58:52 2014
Echo pkt send on: 395799, Aug 6 13:58:43 2014
Flush pkt send on: None.
Last pkt recv on: 740333, Aug 6 13:58:52 2014
Probe pkt recv on: 740333, Aug 6 13:58:52 2014
Echo pkt recv on: 730454, Aug 6 13:58:43 2014
Flush pkt recv on: None.
Deep pkt inspections done: None.
Mismatched if index found: None.
Deep pkt inspection drops: None.
물리적 인터페이스의 오류 카운터를 확인하려면 이 명령을 사용합니다. 이 경우 물리적 레이어 하드웨어 결함으로 인해 UDLD 프레임이 삭제되는지 여부를 결정합니다.
RTP-Agg1# show interface ethernet 4/1 | i error|CRC|discard|drop
0 runts 0 giants 0 CRC/FCS 0 no buffer
0 input error 0 short frame 0 overrun 0 underrun 0 ignored
0 watchdog 0 bad etype drop 0 bad proto drop 0 if down drop
0 input with dribble 0 input discard
0 output error 0 collision 0 deferred 0 late collision
0 lost carrier 0 no carrier 0 babble 0 output discard
CPU 사용률이 높으면 UDLD 프레임에 대한 프로세스가 차단되는지 여부를 결정하는 CPU 사용률을 확인하려면 이 명령을 사용합니다.
N7K-A# show system resources
Load average: 1 minute: 0.17 5 minutes: 0.25 15 minutes: 0.20
Processes : 1993 total, 1 running
CPU states : 0.18% user, 0.81% kernel, 98.99% idle
유용한 TAC 정보
이 섹션에서는 링크를 복원하기 전에 수집해야 하는 출력(상황이 허용되는 경우)에 대해 설명합니다. 이는 Cisco TAC(Technical Assistance Center)에 UDLD에 의해 오류 비활성화 모드로 전환된 링크의 근본 원인을 진단할 수 있는 최상의 기회를 제공합니다.
show tech-support lacp all (실패한 인터페이스가 LACP(Link Aggregation Control Protocol) 포트 채널의 멤버인 경우)
show tech-support module <x> (x는 UDLD 오류가 탐지된 모듈입니다.)
show tech-support ethpm
show tech-support udld
show udld internal event-history errors
show udld internal event-history msgs | grep -a 3 -b 3 L2_RX_DATA
show udld internal event-history ethernet <x/y>
show log logfile | grep UDLD
show log logfile | grep Ethernet<x/y>
show processes cpu history
show interface ethernet <x/y>
show hardware internal errors module <x>
show interface counters errors module <x>
관련 정보