本文档介绍Cisco 12000系列互联网路由器的一些硬件组件,即背板、交换矩阵、时钟和调度程序卡(CSC)、交换矩阵卡(SFC)和思科信元。
本文档没有任何特定的要求。
本文档中的信息基于Cisco 12000系列Internet路由器。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
在查看Cisco 12000交换矩阵之前,我们先看看背板。
千兆路由处理器(GRP)和线卡(LC)从机箱正面安装并插入被动背板。此背板包含将所有线卡互连到交换矩阵卡的串行线路,以及用于电源和维护功能的其他连接。在120xx型号上,每个2.5 Gbps机箱插槽最多有四个1.25 Gbps串行线路连接,每个连接到交换矩阵卡,可提供每插槽5 Gbps的总容量或2.5 Gbps全双工。在124xx型号上,每个10 Gbps机箱插槽使用四组四条串行线路连接,为每个插槽提供20 Gbps全双工交换容量。
所有型号的线卡还具有第五条串行线路,该线路可连接到冗余时钟和调度程序卡(CSC)。
Cisco 12000系列互联网路由器的核心是经过优化的多千兆交叉开关交换矩阵,以千兆速率提供高容量交换。交叉开关交换机实现高性能的原因有二:
从线卡到集中式交换矩阵的连接是点对点链路,可以以极高的速度运行
可同时支持多个总线事务,从而增加系统的聚合带宽。交换矩阵卡(SFC)从时钟调度程序卡(CSC)接收调度信息和时钟参考,并执行交换功能。您可以将SFC想象为NxN矩阵,其中N是插槽数。
此架构允许多个线卡同时发送和接收数据。CSC负责选择在任何给定交换矩阵周期中传输的线卡和接收数据的线卡。
交换矩阵为以下流量提供物理路径:
从路由处理器(RP)到线路卡启动的初始交换矩阵下载程序
思科快速转发更新
线路卡的统计信息
流量交换
下面将详细介绍这些功能。
交换矩阵是NxN无阻塞交叉开关交换矩阵,其中N表示机箱中可支持的最大LC数(包括GRP)。 这允许每个插槽通过交换矩阵同时发送和接收流量。为了具有允许多个线卡同时发送到其他线卡的无阻塞架构,每个LC具有N+1虚拟输出队列(VOQ)(一个用于每个可能的线卡目标,一个用于组播)。
当数据包进入接口时,会执行查找(这可能在硬件或软件中,具体取决于LC和配置的功能)。 查找确定输出LC、接口和适当的介质访问控制(MAC)层重写信息。在通过交换矩阵将数据包发送到输出LC之前,数据包被切割到Cisco信元中。然后向时钟调度器发出请求,以便允许将Cisco信元传输到给定输出LC。E0 LC每个交换矩阵时钟周期传输一个信元,E1和更高LC每四个交换矩阵时钟周期传输一个信元。然后,输出LC将这些Cisco信元重组到数据包中,使用与数据包一起发送的MAC重写信息执行MAC层重写,并将数据包排入相应接口进行传输。
请记住,即使数据包到达LC上的接口,并应从同一LC上的另一个接口(或子接口时位于同一接口)发出,它仍会分段到思科信元,并通过交换矩阵发送回自身。
CSC接受来自线卡的传输请求,发出访问交换矩阵的授权,并为系统中的所有卡提供参考时钟,以同步跨交叉开关的数据传输。任何时候只有一个CSC处于活动状态。
只有在系统中安装了第二个(冗余)CSC时,才可移除和更换CSC,而不会中断正常的系统操作。一个CSC必须始终存在并运行,才能保持正常的系统运行。第二CSC提供数据路径、调度程序和参考时钟冗余。线卡和交换矩阵之间的接口会持续受到监控。如果系统检测到同步丢失(LoS),它会自动激活冗余CSC的数据路径,并且数据流经冗余路径。到冗余CSC的交换机通常以秒为单位(实际交换时间取决于您的配置及其规模),在此期间,某些/所有LC上可能会丢失数据。
在Cisco 12008、12012和12016上,可随时在路由器中安装一组可选的三个SFC,为路由器提供额外的交换矩阵容量。此配置称为全带宽。SFC卡可增加路由器的数据处理能力。任何一个或所有SFC都可以随时移除和更换,而不会中断系统操作或关闭路由器电源。在任何SFC无法正常工作的时间长度内,其数据承载能力会作为路由器数据处理和交换功能的潜在数据路径丢失给路由器。
交换矩阵卡(SFC)和时钟调度程序卡(CSC)为系统提供物理交换矩阵,并为在线卡和路由处理器之间传送数据和控制数据包的思科信元提供时钟。
在12008、12012和12016上,您必须至少有一个CSC卡才能运行路由器。只有一个CSC卡和没有SFC卡称为季度带宽,仅适用于引擎0线卡。如果系统中有其他线卡,它们将自动关闭。如果需要除引擎0之外的线卡,则必须在路由器中安装全带宽(三个SFC和一个CSC)。如果需要冗余,则必须另加一个 CSC。这个冗余的 CSC 仅在 SFC 或其他 CSC 发生故障时起作用。它既可充当 CSC,也可充当 SFC。
12416、12406、12410 和 12404 要求使用全带宽。
有关交换矩阵冗余和带宽的其他重要详细信息包括:
所有12000系列路由器最多有三个SFC和两个CSC,12410系列除外,它有五个专用SFC和两个专用CSC,12404有一个包含所有CSC/SFC功能的主板。12404 中不存在冗余配置。
在12008、12012、12016、12406和12416中,CSC卡还用作交换矩阵卡。因此,要获得全带宽冗余配置,只需要 3 个 SFC 和 2 个 CSC。在12410中,有专用的时钟调度程序卡和交换矩阵卡。要获得全带宽冗余配置,需要 2 个 CSC 和 5 个 SFC。
在机箱中只有引擎 0 LC 的情况下,只能在 12008、12012 和 12016 中采用四分之一带宽配置。CSC192 和 SFC192 位于 12400 系列机箱中,因此不支持四分之一带宽配置。
以下是适用于所有平台的一些与交换矩阵相关的有趣链路:
CSC安装在上卡盒中,SFC安装在下卡盒中,下卡盒位于空气过滤器组件的正后方(请参见图1-22:产品概述文档下下方卡匣中的组件)。
更多详情请参阅以下文档:
CSC和SFC都安装在5插槽的下卡盒中。请参见前视图和下卡盒。
更多详细信息请参阅以下文档:
Cisco 12016目前有两个交换矩阵选项:
2.5 Gbps交换矩阵(80 Gbps交换系统带宽) — 这包括GSR16/80-CSC和GSR16/80-SFC交换矩阵集。每个SFC或CSC卡为系统中的每个线卡提供2.5 Gbps全双工连接。对于具有16个线卡的Cisco 12016,每个线卡具有2 x 2.5 Gbps容量(全双工),系统交换带宽为16 x 5 Gbps = 80 Gbps。(旧交换矩阵有时称为80 Gbps交换矩阵)。
10 Gbps交换矩阵(320 Gbps交换系统带宽) — 这包括GSR16/320-CSC和GSR16/320-SFC交换矩阵集。每个SFC或CSC卡都为系统中的每个线卡提供10 Gbps全双工连接。对于具有16个线卡的Cisco 12016,每个线卡具有2 x 10 Gbps容量(全双工),系统交换带宽为16 x 20 Gbps = 320 Gbps。(较新的交换矩阵有时称为320 Gbps交换矩阵)。
当Cisco 12016路由器包含320 Gbps交换矩阵时,它称为Cisco 12416互联网路由器。
CSC和SFC安装在五插槽交换矩阵卡盒中。
有关详细信息,请参阅以下文档:
Cisco 12404有一个称为整合交换矩阵(CSF)的板,为线卡和RP提供同步速度互连。CSF电路包含在一个卡上,并包含时钟调度器和交换矩阵功能。CSF卡位于Cisco 12404 Internet路由器机箱中标有FABRIC ALARM的底部插槽中。
有关详细信息,请参阅:
Cisco 12410的交换矩阵由两个时钟和调度程序卡(CSC)和五个安装在交换矩阵和报警卡盒中的交换矩阵卡(SFC)组成。活动交换矩阵需要一个CSC和四个SFC;第二个CSC和第五个SFC提供冗余。也位于交换矩阵中的两个报警卡和报警卡盒不属于交换矩阵。
与Cisco 12000系列中的其他系统不同,Cisco 12410仅支持最新的10 Gbps交换矩阵。每个SFC或CSC卡都为系统中的每个线卡提供10 Gbps全双工连接。因此,对于具有10个线卡的Cisco 12410,每个线卡具有2 x 10 Gbps容量(全双工),系统交换带宽为10 x 20 Gbps = 200 Gbps。
有关详细信息,请参阅以下文档:
请参阅Cisco 12016 Internet路由器。
12016和12416中的交换矩阵卡不易插入,可能需要一点力。如果其中一个CSC未正确安装,您可能会看到以下错误消息:
%MBUS-0-NOCSC: Must have at least 1 CSC card in slot 16 or 17 %MBUS-0-FABINIT: Failed to initialize switch fabric infrastructure
如果只有足够的CSC和SFC用于四分之一带宽配置,您也可能会收到此错误消息。在这种情况下,E1或更高LC都不会启动。
要确定卡是否正确就位,一个确切的方法是,在CSC/SFC上,您应看到四个指示灯“亮起”。 如果不是这样,则卡未正确就位。
在处理与交换矩阵和LC未启动相关的问题时,必须验证所有必需的CSC和SFC是否已正确安装并通电。例如,12016上需要三个SFC和两个CSC才能获得全带宽冗余系统。需要三个SFC和仅一个CSC才能获得全带宽非冗余系统。
show version和show controller fia命令的输出告诉您,机箱中当前运行的硬件配置。
Thunder#show version Cisco Internetwork Operating System Software IOS (tm) GS Software (GSR-P-M), Experimental Version 12.0(20010505:112551) [tmcclure-15S2plus-FT 118] Copyright (c) 1986-2001 by cisco Systems, Inc. Compiled Mon 14-May-01 19:25 by tmcclure Image text-base: 0x60010950, data-base: 0x61BE6000 ROM: System Bootstrap, Version 11.2(17)GS2, [htseng 180] EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) BOOTFLASH: GS Software (GSR-BOOT-M), Version 12.0(15.6)S, EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE Thunder uptime is 17 hours, 53 minutes System returned to ROM by reload at 23:59:40 MET Mon Jul 2 2001 System restarted at 00:01:30 MET Tue Jul 3 2001 System image file is "tftp://172.17.247.195/gsr-p-mz.15S2plus-FT-14-May-2001" cisco 12012/GRP (R5000) processor (revision 0x01) with 262144K bytes of memory. R5000 CPU at 200Mhz, Implementation 35, Rev 2.1, 512KB L2 Cache Last reset from power-on 2 Route Processor Cards 1 Clock Scheduler Card 3 Switch Fabric Cards 1 8-port OC3 POS controller (8 POs). 1 OC12 POs controller (1 POs). 1 OC48 POs E.D. controller (1 POs). 7 OC48 POs controllers (7 POs). 1 Ethernet/IEEE 802.3 interface(s) 17 Packet over SONET network interface(s) 507K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). Thunder#show controller fia Fabric configuration: Full bandwidth nonredundant Master Scheduler: Slot 17
我们建议您阅读如何读取show controller fia命令的输出,以了解更多详细信息。
12000交换机交换矩阵设计包括创新方法,可实现高效系统。交换矩阵使用以下关键组件提供高效的运营商级和可扩展设计:
每个线卡的虚拟输出队列可消除线头阻塞。
一种高效的调度算法取代传统的轮询调度方法,提高交换矩阵的效率。
组播流量的基于硬件的复制;支持部分实施,为组播流量提供高效的平台。
流水线化,提高交换矩阵性能。
线路阻塞头(HoLB)是在输出端口出现拥塞的任何系统中都会出现的问题(请参阅下图)。 当发往多个目的地的多个数据包共享一个队列时,会发生HoLB。发往特定位置的数据包必须等待,直到其前面的所有数据包都经过处理后才能通过交换矩阵。例如,多条多车道高速公路合并为一条单车道高速公路。要解决这个问题,最好的方法是将多条多车道高速公路合并成一个多车道高速公路。
Cisco 12000系列互联网路由器使用独特的多队列实施来消除线路头阻塞。当数据包到达线卡时,它们被安排到按插槽、端口和服务类别(CoS)分类的多个输出队列中的一个。 这些队列称为虚拟输出队列(VOQ)。
在上图中,虚拟输出队列(A)代表线卡A,VOQ B代表线卡B,依此类推。每个数据包都排序并放入正确的VOQ中。VOQ中的排序和放置基于思科快速转发(CEF)表中包含的转发信息。
下图显示VOQ方法如何避免HoLB问题。如图所示,数据包放置可最大限度地减少HoLB问题。即使将一系列数据包发送到一个线卡,不同VOQ中的其他数据包也可以通过交换矩阵发送,从而避免了传统HoLB问题。
SFC/CSC具有嵌入式调度算法。该调度算法由思科系统公司和斯坦福大学联合开发,最多接收13个Cisco 12008和Cisco 12012(12个插槽和1个组播)输入请求和17个Cisco 12016(16个插槽和1个组播)输入请求。 所有请求都在给定的时钟间隔内完成。该算法计算该间隔内可用的最佳输入到输出匹配。这种高速算法与VOQ创新相结合,使交换矩阵能够实现非常高的交换效率。这意味着交换矩阵的吞吐量可达理论最大吞吐量的99%,而之前交换矩阵设计(基于斯坦福大学的研究数据)所实现的吞吐量可达53%。
交换矩阵还专为使用IP组播的下一代应用而设计。交换矩阵通过以下方式克服了与IP组播相关的传统问题:
使用特殊硬件,在分布式基础上执行IP数据包的密集复制(在交换矩阵和线卡中)
为组播流量指定单独的队列(VOQ),以便不影响其他单播流量
允许创建部分组播段
接口可以向交换矩阵发送组播和单播请求。发送组播请求时,它指定数据的所有目的地和请求的优先级。CSC将组播和单播请求一起处理,优先处理最高优先级的请求,无论是单播还是组播。
收到组播请求时,会向时钟调度程序卡发送请求。从CSC收到授权后,数据包将转发到交换矩阵。交换矩阵制作数据包的副本,并同时(在同一信元时钟周期期间)将副本发送到所有目的线卡。 如果必须将数据包发送到多个端口,则每个接收线卡都会制作数据包的其他副本。
为了减少阻塞,交换矩阵支持组播传输的部分分配。这意味着交换矩阵对所有可用卡执行组播操作。如果目的卡从另一个源接收数据包,则在后续的分配周期中继续组播过程。
这些新的增强功能可避免第一代交叉开关交换矩阵固有的带宽浪费障碍,并使思科系统公司能够提供交换矩阵,该交换矩阵在不牺牲可靠性的情况下实现非常高的交换效率。
交换矩阵支持全双工操作,辅以高级流水线技术。流水线允许交换矩阵在完成之前周期的数据传输之前开始为未来周期分配交换机资源。通过消除死时间(浪费的时钟周期),流水线操作可显着提高交换矩阵的整体效率。流水线在交换矩阵中实现高性能,使其达到理论上的最大吞吐量。
交叉开关交换矩阵中的传输单元始终是固定大小的数据包,也称为Cisco信元,比可变大小的数据包更容易调度。数据包在放置到交换矩阵之前会分成信元,并在传输之前由出站LC重组。思科信元长度为64字节,具有8字节报头、48字节负载和8字节循环冗余校验(CRC)。