简介
本文档介绍具有拓扑独立(TI) -无环替代(LFA)的收敛概念,LFA是一个重点高度集中的功能。根据XYZ网络的要求,以拓扑图为基础,详细说明了分段路由(SR) -流量工程(TE)策略路径收敛的机制,以TI-LFA保护为底层。
链路故障检测
请注意,SR-TE策略路径融合和TI-LFA功能彼此独立并独立运行。但是,添加了TI-LFA功能可以快速检测主要SR-TE策略路径故障,以及在理想网络条件下向预定义备份路径切换的不到50毫秒的流量。SR-TE策略在没有TI-LFA的情况下可以完美运行,但是,在该场景中,收敛数量仅取决于内部网关协议(IGP),并且远远高于50毫秒。
在链路故障场景下,我们的目标是尽可能缩短收敛时间,从而最大程度地减少链路关闭/抖动事件期间的数据包丢失。
在前端节点检测链路断开事件主要通过以下方法实现:
1. 在相邻链路断开的情况下在物理层进行检测。
2. 在远程链路断开的情况下,通过捆绑包上的BFD进行检测。
在第一种情况下,检测速度更快,收敛时间比第二种情况更短,其中检测取决于配置的BFD间隔/Dead计时器和链路断开的确切网络点。但是,非常快速的检测并不一定意味着快速收敛,因为XYZ组织网络是一种多层结构,具有覆盖多个跳的端到端服务流量。
由于XYZ Org网络包含在一个BGP AS和单个IGP域中,因此,TI-LFA预定义的备份路径会在所有场景中的链路故障后立即传输故障切换流量,并确保最小数据包丢失和完整前缀覆盖,而不管拓扑状态如何。由于IGP,SR-TE策略定义的主路径/辅助路径可能需要一段时间才能收敛,并最终接管通过核心的端到端服务流量,这些流量可能匹配,也可能不匹配TI-LFA的预定义路径。
详细的收敛方案
有关更多详细信息,让我们了解此处详细介绍的示例,该示例使用SR-TE策略和TI-LFA作为XYZ Org网络的收敛机制。
与拓扑图一致的SR配置示例:
segment-routing
traffic-eng
!
!
segment-list PrimaryPath1
index 10 mpls adjacency 10.1.11.0 --> First Hop (P1 node) of the explicit-path
index 20 mpls adjacency 10.1.3.1 --> Second Hop (P3 node) of the explicit-path
index 30 mpls adjacency 10.3.13.1 --> Third Hop (PE3 node) of the explicit-path
!
policy POL1
source-address ipv4 11.11.11.11 --> Source Node of the explicit-path
color 10 end-point ipv4 33.33.33.33 --> Destination Node of the explicit-path
candidate-paths
preference 100 --> Secondary Path taken care of dynamically by IGP TI-LFA
dynamic
metric
type igp
!
!
!
preference 200
explicit segment-list PrimaryPath1 --> Primary Explicit-Path of the SR-TE policy
!
!
在正常情况下,流量必须经由两个可能的候选路径PE1 > P1 > P3 > PE3
和SR-TE策略PE1 > P2 > P4 > PE3
之一(管理员使用邻接(Adj) -网段标识符(SID)列表10.1.11.0, 10.1.3.1, 10.3.13.1
配置的主显式路径,或相关IGP确定的辅助动态路径)从PE1传输到PE3。管理员倾向于使用主候选路径,并且仅在主路径发生故障时回退到辅助路径。因此,较高的优先级值被分配给表示首选路径的主要候选路径。例如,主要候选路径可以具有200
的首选项,而辅助候选路径可以具有100
的首选项。
图1:正常流量场景SR-TE主要候选路径
任何候选路径在有效时使用,其组成SID的可达性决定了有效性标准。
当两个候选路径都有效且可用时,前端PE1会选择优先级较高的路径,并将此路径的SID列表安装在其转发表中 10.1.11.0, 10.1.3.1, 10.3.13.1
。在任何时间点,引导至此SR策略的服务流量都只通过选定路径发送,任何其他动态候选路径都处于非活动状态。
当候选路径在SR策略的所有有效候选路径中具有最高优先级值时,就会选择候选路径。所选路径也称为SR策略的“活动路径”。
链路故障融合-主路径进入关闭状态
在某一时刻,网络中可能发生链路故障。故障链路可以是任意两个节点(例如P1和P3)之间的链路。一旦通过本节开头所述的任何方法检测到故障,TI-LFA保护必须确保流量被快速重定向到TI-LFA保护路径,最好在50毫秒内。
请注意,在此场景中,TI-LFA确定的备份路径(如图2所示)与图3中IGP确定的最终融合备份策略路径不同。这是相当正常的,因为Ti-LFA备份路径由发生故障的本地修复点(PLR)节点本地确定,但是,优化的SR-TE策略备份路径由持有SR-TE策略决策的前端节点的IGP融合确定。
图2:通过TI-LFA备用路径的故障切换流量方案
流量继续流经TI-LFA保护路径,直到最后,前端PE1通过IGP泛洪得知故障链路的SID10.1.3.1
已变为无效。PE1然后评估路径的SID列表10.1.11.0, 10.1.3.1, 10.3.13.1
的有效性,并由于存在无效的SID 10.1.3.1
而将其无效。同时,它使候选路径失效,并重新执行SR-TE策略的路径选择过程。PE1随后选择优先级值第二高的另一个有效候选路径,并将新辅助候选路径10.2.11.0, 10.2.4.1, 10.4.13.1
的SID列表安装到转发表中。但是,此备用候选路径在本质上是动态的,由IGP开放最短路径优先(OSPF)确定,并且没有管理控制。在此步骤之前,流量流经受保护的TI-LFA路径;但在此之后,流量被引导到SR-TE策略的新首选辅助路径。
图3:通过SR-TE辅助候选路径的故障切换流量场景
摘要步骤:
1. 在故障点上:
- 第1层/BFD将主路径信号向下传输至FIB
- FIB将通过TI-LFA建立的备份路径推送至硬件
- 预期的流量中断:
- 链路关闭:约50毫秒
- BFD对等体丢失:BFD失效时间+ ―50ms
- 丢失链路上的OSPF对等断开
2. 域中的所有OSPF路由器通过链路状态通告(LSA)泛洪获知SID丢失
3. 在SR-TE头端PE1上:
- OSPF收敛
- SR-TE策略主路径SID列表无效
- 主要候选者的路径断开
- 辅助候选路径SID列表经过验证,并变为活动状态
- 流量通过辅助路径发送,不会丢失任何服务流量
链路故障重新收敛-主路径返回运行状态
同时,一旦主失效链路恢复,具有优先级的原始主路径(200)再次变为有效,因此头端PE1执行SR-TE策略路径选择过程,选择具有最高优先级的有效显式候选路径,并使用原始主路径的SID列表更新其转发表。引导至此SR策略的服务流量会再次通过原始路径发送PE1 > P1 > P3 > PE3
。
图4:重新融合的流量场景
摘要步骤:
1. 第1层/BFD发出主路径恢复信号,并通知OSPF。
2. 流量仍然通过SR-TE策略备用候选路径转发。
3. 一段时间后,SR-TE策略主候选路径的SID列表通过OSPF LSA泛洪获得有效性。
4. 流量从SR-TE策略备份候选路径切换到SR-TE策略主候选路径,流量损失为零。
总之,这些场景提供了收敛过程和理想收敛数字的理论解释;但是,您需要测试实验室中模拟生产网络和配置的实际收敛数字,尽可能接近实际,并触发网络中可以预见的不同故障点。
注意:请注意,本文档仅说明链路保护方案,因为如果定义的显式路径与中间节点接触,则节点保护不适用于SR-TE显式路径。这是因为TI-LFA将每个已配置的中间跳作为目标节点,并且如果其中任何一跳出现故障,它都无法解析最终目标。这是一项技术限制,并不限于任何平台或映像版本。此限制的解决方案已在本文档的第2部分中讨论,如相关信息部分中所述。
使用的软件
用于测试和验证解决方案的软件是Cisco IOS®XR 7.3.2。
相关信息