소개
이 문서에서는 고도로 집중된 기능인 TI(Topology Independent) - LFA(Loop-Free Alternative)와의 통합 개념을 설명합니다. XYZ Networks의 요구 사항을 기반으로 하는 토폴로지 다이어그램이 포함된 언더레이로서 TI-LFA 보호를 사용하여 SR(Segment Routing) - TE(Traffic Engineering) 정책 경로 통합 메커니즘에 대해 자세히 설명합니다.
링크 오류 감지
SR-TE 정책 경로 통합 및 TI-LFA 기능은 서로 독립적이며 개별적으로 작동합니다. 그러나 TI-LFA 기능이 추가되어 기본 SR-TE 정책 경로 장애를 신속하게 탐지하고 이상적인 네트워크 조건에서 미리 정의된 백업 경로로 50msec 미만의 트래픽 스위칭을 수행할 수 있습니다. SR-TE 정책은 TI-LFA가 없어도 완벽하게 작동합니다. 그러나 이 시나리오에서 컨버전스 수는 IGP(Interior Gateway Protocol)에만 의존하며 50 msec보다 훨씬 높습니다.
Link Failure(링크 오류) 시나리오에서는 링크 다운/플랩 이벤트 동안 패킷 손실을 최소화하는 컨버전스 시간을 최대한 낮게 유지하는 것이 목적입니다.
헤드엔드 노드에서 링크 다운 이벤트를 탐지하는 작업은 주로 다음 방법으로 수행할 수 있습니다.
1. 끊어진 인접 링크의 경우 물리적 레이어에서 탐지됩니다.
2. 고장난 원격링크의 경우 BFD over Bundle을 통한 탐지.
첫 번째 경우, 탐지가 구성된 BFD 간격/데드 타이머 및 링크가 다운된 정확한 네트워크 포인트에 따라 달라지는 두 번째 옵션보다 탐지 속도가 더 빠르고 수렴 시간이 더 짧습니다. 그러나 XYZ Org Network는 여러 홉을 포괄하는 엔드 투 엔드 서비스 트래픽이 포함된 멀티레이어 구조이므로 매우 빠른 탐지가 반드시 빠른 컨버전스를 의미하지는 않습니다.
XYZ 조직 네트워크는 단일 BGP AS 및 단일 IGP 도메인 내에 포함되므로, 여기서는 TI-LFA 사전 정의된 백업 경로가 모든 시나리오에서 링크 장애 발생 후 장애 조치 트래픽을 즉시 전달하며 토폴로지 상태에 관계없이 최소 패킷 손실과 완전한 접두사 커버리지를 보장합니다. SR-TE 정책 정의 프라이머리/세컨더리 경로는 IGP로 인해 통합되는 데 다소 시간이 걸릴 수 있으며, 궁극적으로 TI-LFA의 사전 정의된 경로와 일치하거나 일치하지 않는 코어를 통해 엔드 투 엔드 서비스 트래픽을 인수할 수 있습니다.
자세한 컨버전스 시나리오
자세한 내용은 SR-TE 정책 및 TI-LFA를 사용하는 트래픽 경로를 XYZ 조직 네트워크의 통합 메커니즘으로 설명하는 이 예제를 살펴보겠습니다.
토폴로지 다이어그램에 맞춘 샘플 SR 컨피그레이션:
segment-routing
traffic-eng
!
!
segment-list PrimaryPath1
index 10 mpls adjacency 10.1.11.0 --> First Hop (P1 node) of the explicit-path
index 20 mpls adjacency 10.1.3.1 --> Second Hop (P3 node) of the explicit-path
index 30 mpls adjacency 10.3.13.1 --> Third Hop (PE3 node) of the explicit-path
!
policy POL1
source-address ipv4 11.11.11.11 --> Source Node of the explicit-path
color 10 end-point ipv4 33.33.33.33 --> Destination Node of the explicit-path
candidate-paths
preference 100 --> Secondary Path taken care of dynamically by IGP TI-LFA
dynamic
metric
type igp
!
!
!
preference 200
explicit segment-list PrimaryPath1 --> Primary Explicit-Path of the SR-TE policy
!
!
일반 시나리오에서 트래픽은 가능한 두 개의 후보 경로 PE1 > P1 > P3 > PE3
및 SR-TE 정책PE1 > P2 > P4 > PE3
의 하나, 관리자가 Adjj(인접성) - SID(세그먼트 식별자) 목록을 사용하여 구성한 기본 명시적 경로 또는 관련 IGP에 의해 결정된 보조 동적 경로10.1.11.0, 10.1.3.1, 10.3.13.1
를 통해 PE1에서 PE3으로 트래버스해야 합니다. 관리자는 기본 후보 경로를 사용하고 기본 경로가 중단된 경우에만 보조 경로로 폴백하는 것을 선호합니다. 따라서 기본 경로를 나타내는 1차 후보 경로에는 더 높은 선호 값이 할당됩니다. 예를 들어, 1차 후보 경로는 의 선호도를 가질 수 200
있고, 2차 후보 경로는 의 선호도를 가질 수 100
있다.
그림 1: 일반 트래픽 시나리오 SR-TE 기본 후보 경로
모든 후보 경로는 유효할 때 사용되며, 해당 구성 SID의 도달 가능성에 따라 유효성 기준이 결정됩니다.
두 후보 경로가 모두 유효하고 사용 가능한 경우 헤드엔드 PE1은 더 높은 기본 설정 경로를 선택하고 이 경로의 SID 10.1.11.0, 10.1.3.1, 10.3.13.1
목록을 포워딩 테이블에 설치합니다. 이 SR 정책에 조정된 서비스 트래픽은 임의의 시점에서 선택한 경로에서만 전송되며, 다른 모든 동적 후보 경로는 비활성 상태입니다.
후보 경로는 SR 정책의 모든 유효 후보 경로들 중에서 가장 높은 선호도 값을 가질 때 선택된다. 선택한 경로를 SR 정책의 '활성 경로'라고도 합니다.
링크 오류 통합 - 기본 경로가 중단 상태로 전환됩니다.
어떤 시점에서는 네트워크에 링크 장애가 발생할 수 있습니다. 실패한 링크는 임의의 두 노드(예: P1 및 P3) 간의 링크일 수 있다. 이 절의 시작 부분에서 설명한 대로 어떤 방법으로도 장애가 탐지되는 즉시 TI-LFA 보호는 트래픽 흐름이 TI-LFA 보호 경로로, 이상적으로는 50 msec 이내에 신속하게 리디렉션되도록 해야 합니다.
이 시나리오에서는 그림 2와 같이 TI-LFA로 결정된 백업 경로가 그림 3의 IGP로 결정된 통합 백업 정책 경로와 다릅니다. Ti-LFA 백업 경로는 장애가 발생한 PLR(Point Of Local Repair) 노드에 의해 로컬로 결정되므로 이는 매우 정상적이지만, 최적화된 SR-TE 정책 백업 경로는 SR-TE 정책 결정을 보유한 헤드엔드 노드에 의한 IGP 통합에 의해 결정됩니다.
그림 2: TI-LFA 백업 경로를 통한 장애 조치 트래픽 시나리오
트래픽은 TI-LFA 보호 경로를 통해 계속 흐르다가 결국 헤드엔드 PE1이 IGP 플러딩을 통해 장애가 발생한 링크의 SID가 10.1.3.1
유효하지 않게 되었음을 알게 됩니다. 그런 다음 PE1은 경로 SID 목록의 유효성을 평가하고 10.1.11.0, 10.1.3.1, 10.3.13.1
잘못된 SID가 있기 때문에 경로를 무효화합니다10.1.3.1
. 동시에 후보 경로를 무효화하고 SR-TE 정책의 경로 선택 프로세스를 다시 실행합니다. 그런 다음 PE1은 다음으로 높은 기본 설정 값을 갖는 다른 유효한 후보 경로를 선택하고 포워딩 테이블에 새 보조 후보 경로10.2.11.0, 10.2.4.1, 10.4.13.1
의 SID 목록을 설치합니다. 그러나 이 보조 후보 경로는 IGP OSPF(Open Shortest Path First)에서 결정하는 동적 경로이며 관리 제어가 없습니다. 이 단계까지 트래픽은 보호된 TI-LFA 경로를 통해 이동하지만, 이 단계 이후에는 SR-TE 정책의 새로 선호하는 보조 경로로 이동됩니다.
그림 3: SR-TE 보조 후보 경로를 통한 장애 조치 트래픽 시나리오
요약 단계:
1. 고장 시
- Layer1/BFD는 기본 경로를 FIB로 하향 시그널링합니다.
- FIB는 TI-LFA로 설정된 백업 경로를 HW로 푸시
- 예상되는 트래픽 중단:
- 링크 다운: ~50ms
- BFD 피어 손실: BFD 데드 타임 + ~50ms
- OSPF Peering over Lost Link 작동 중단
2. 도메인의 모든 OSPF 라우터가 LSA(Link State Advertisement) 플러딩을 통해 SID 손실을 파악합니다.
3. SR-TE 헤드엔드 PE1에서:
- OSPF 통합
- SR-TE 정책 기본 경로 SID 목록이 무효화됩니다.
- 주 후보의 경로가 다운되었습니다.
- 보조 후보 경로 SID 목록이 검증되고 활성화됩니다
- 트래픽은 서비스 트래픽 손실 없이 보조 경로를 통해 전송됩니다
링크 오류 재통합 - 기본 경로 작동 상태로 돌아가기
한편, 기본 실패 링크가 복원되면 기본 설정(200)이 있는 원래 기본 경로가 다시 유효하게 되므로 헤드엔드 PE1은 SR-TE 정책 경로 선택 절차를 수행하고, 기본 설정이 가장 높은 유효한 명시적 후보 경로를 선택하고, 원래 기본 경로의 SID 목록으로 포워딩 테이블을 업데이트합니다. 이 SR 정책에 조정된 서비스 트래픽은 원래 경로에서 다시PE1 > P1 > P3 > PE3
전송됩니다.
그림 4: 리컨버지드 트래픽 시나리오
요약 단계:
1. Layer 1/BFD는 기본 경로를 백업하라는 신호를 보내고 OSPF에 알림을 보냅니다.
2. 트래픽은 여전히 SR-TE 정책 백업 후보 경로를 통해 전달됩니다.
3. 잠시 후 OSPF LSA 플러딩을 통해 SR-TE 정책 기본 후보 경로의 SID 목록이 유효해집니다.
4. 트래픽이 SR-TE 정책 백업 후보 경로에서 SR-TE 정책 기본 후보 경로로 전환되며 트래픽 손실이 전혀 없습니다.
결론적으로, 이러한 시나리오는 통합 프로세스와 이상적인 통합 숫자에 대한 이론적인 설명을 제공합니다. 그러나 실습에서 실제 통합 숫자를 테스트하여 프로덕션 네트워크와 구성을 가능한 한 가깝게 모방하고 네트워크에서 예상할 수 있는 서로 다른 장애 지점을 트리거해야 합니다.
주의: 정의된 명시적 경로가 중간 노드에 연결되는 경우 노드 보호가 SR-TE 명시적 경로와 작동하지 않으므로 이 문서에서는 링크 보호 시나리오만 설명합니다. 이는 TI-LFA가 구성된 각 중간 홉을 대상 노드로 사용하며 이 중 하나라도 실패하면 최종 대상을 확인할 수 없기 때문입니다. 이는 기술 제한이며 어떤 플랫폼 또는 이미지 버전에도 제한되지 않습니다. 이 제한에 대한 해결책은 관련 정보 섹션에서 설명한 대로 이 문서의 2부에서 다룹니다.
사용된 소프트웨어
솔루션을 테스트하고 검증하는 데 사용되는 소프트웨어는 Cisco IOS®XR 7.3.2입니다.
관련 정보