本文档说明如何监控Cisco ONS 15454上的同步性能和排除计时警报故障。
Cisco 建议您了解以下主题:
Cisco ONS 15454
抖动、漂移和滑落
有关详细信息,请参阅抖动、漂移和滑动部分。
本文档中的信息基于以下软件和硬件版本:
思科ONS 15454 NEBS/ANSI(软件2.X最小计时提升、3.X、4.X - 5.X最新计时提升)
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
本节提供ONS 15454中显示的有关计时的相关背景信息。
ONS 15454支持符合SONET标准的计时和同步。ONS 15454符合的标准包括:
Telecordia GR-253,SONET传输系统,通用标准
Telecordia GR-436,数字网络同步计划
ONS 15454平台在TCC计时控制卡中实现计时和同步功能。冗余架构可防止一个通用控制卡的故障或拆除。为保证计时可靠性,TCC卡能够在以下三个计时参考之一上同步:
主计时参考
辅助计时参考
第三同步参考
您可以从以下计时源中选择三个计时参照:
两个楼宇综合定时供应(BITS)时钟输入(外部模式)
所有同步光纤接口(线路模式)
内部、可自由运行的第3层增强时钟
慢参考跟踪环路允许公共控制卡跟踪所选定时参考,并在所有参考失败时提供“保持”定时(或定时参考存储器)。在故障切换场景中,下一个最佳计时参考(或时钟质量)的可用性控制下一个计时参考的选择。Stratum层次结构定义下一个最佳计时引用。总之,以下是ONS 15454中可用的计时模式列表:
外部(BITS)计时
线路(光纤)定时
内部/保留(当所有引用失败时自动可用)
内部/自由运行
美国国家标准学会(ANSI)标题为“数字网络的同步接口标准”的标准发布为ANSI/T1.101-1998,它定义了层级和最低性能标准。下表提供摘要:
层 | 精度、调整范围 | 拉入范围 | 稳定性 | 到第一个帧滑移的时间* |
---|---|---|---|---|
1 | 1 x 10-11 | 不适用 | 不适用 | 72 天 |
2 | 1.6 x 10-8 | 必须能够同步到时钟,精度为+/-1.6 x 10-8 | 1 x 10-10/天 | 7 天 |
3E | 4.6 x 10-6 | 必须能够同步到时钟,精度为+/-4.6 x 10-6 | 1 x 10-8/天 | 17 小时 |
3 | 4.6 x 10-6 | 必须能够同步到时钟,精度为+/-4.6 x 10-6 | 3.7 x 10-7/天 | 23分钟 |
SONET最小时钟 | 20 x 10-6 | 必须能够同步到时钟,精度必须为+/-20 x 10-6 | 尚未指定 | 尚未指定 |
4E | 32 x 10-6 | 必须能够同步到时钟,精度必须为+/-32 x 10-6 | 与准确性相同 | 尚未指定 |
4 | 32 x 10-6 | 必须能够同步到时钟,精度必须为+/-32 x 10-6 | 与准确性相同 | 不适用 |
*为了计算漂移产生的滑移率,请假设24小时内的频率偏移等于漂移,这会累积比特漂移,直到193位(帧)累积。各种原子和晶体振荡器的漂移速率是众所周知的。然而,漂移率通常既不是线性的,也不是持续的上升。
抖动是数字信号(频率)与标称值(即参考时钟)的瞬时偏差。 当数字信号通过在传输协议中使用填充位的网络元素时,通常会发生抖动。删除这些填充位可能会导致抖动。您可以用单位间隔(UI)表示抖动。UI是一位的标称周期。以一个UI的一小部分表示抖动。例如,以155.52 Mb/s的数据速率,一个UI相当于6.4 ns。
漂移是非常慢的抖动(频率小于10 Hz)。 为网络设计同步分发子系统时,同步性能的目标必须是正常情况下的零滑动和零指针调整。您可以用TIE(时间间隔错误)表示漂移。TIE表示被测时钟信号和参考源之间的相位差。
减少使用菊花链和线路定时的节点数,以便在线路定时网络中最小化漂移。为了通过多节点SONET环分配定时,从在东方和西方都使用BITS定时的节点分配定时,而不是在单个方向上使用菊花链。这样做时,可以尽量减少漂移。
根据设计,SONET设备在同步网络中工作非常理想。当网络不同步时,使用指针处理和位填充等机制。否则,抖动和漂移会增加。
某些DS-1源使用滑移缓冲区,可以执行DS-1信号的受控滑移。ONS 15454不支持同步输入上的受控滑移。
使用指针来补偿频率和相位变化。指针调整计数表示SONET网络上的计时错误。当网络失去同步时,传输的信号会出现抖动和漂移。过度的漂移会导致终端设备滑动。
滑移在服务中造成不同的影响。例如,间歇性的音频点击会中断语音服务。同样,压缩语音技术面临传输错误短或呼叫掉线的问题;传真机丢失扫描线路或遭遇掉线;数字视频传输显示失真的图像或冻结帧;加密服务丢失加密密钥,并导致数据重新传输。
指针提供了调整STS和VT负载中相位变化的方法。您可以在线路开销的H1和H2字节中找到STS负载指针。可以通过从指针到STS同步负载信封(SPE)的第一个字节(称为J1字节)的偏移量(以字节为单位)来测量时钟差异。超过正常范围0到782的时钟差会导致数据丢失。
您必须了解正指针调整计数(PPJC)参数和负指针调整计数(NPJC)参数。PPJC是路径检测(PPJC-PDET-P)或路径生成(PPJC-PGEN-P)正指针理由的计数。NPJC是基于特定PM名称的路径检测(NPJC-PDET-P)或路径生成(NPJC-PGEN-P)负指针理由的计数。PJCDIFF是检测到的指针调整计数总数与生成的指针调整计数总数之差的绝对值。PJCS-PDET-P是包含一个或多个PPJC-PDET或NPJC-PDET的一秒间隔的计数。PJCS-PGEN-P是包含一个或多个PPJC-PGEN或NPJC-PGEN的一秒间隔的计数。
一致的指针调整计数表示节点之间的时钟同步问题。计数之间的差异表示发送原始指针调整的节点与检测并发送该计数的节点具有定时变化。当SPE的帧速率相对于STS-1的速率太慢时,会进行正指针调整。
指针调整计数(PJC)记录同步传输信号级别1(STS-1)和虚拟支路级别1.5(VT1.5)的指针活动。 您可以使用PJC检测同步问题。PJC还帮助您排除负载抖动和漂移降级故障。当网络不同步时,传输的信号会发生抖动和漂移。
ONS 15454定义了以下两个PJC:
PJC-Det — 传入指针调整数。
PJC-Gen — 传出指针调整数。
由于内部缓冲区可能不匹配,因此使用两个数字。内部缓冲区吸收一定数量的指针调整。缓冲区会衰减网络中的漂移。
以下是解释这些数字的一些指导原则:
如果PJ-Det为非零且PJ-Gen为0或低于PJ-Det,则可推断出漂移衰减的发生。
如果PJ-Det为非零且PJ-Gen为非零且大致等于PJ-Det,则可以确定网络上游是否存在同步问题。此问题不是本地问题。
如果PJ-Gen显着大于PJ-Det,则可以确定此节点与直接上游节点之间发生的同步问题。
为PJC定义了多个阈值。超过阈值时,生成阈值交叉警报(TCA)。下表列出了以下TCA:
TCA | 描述 |
---|---|
T-PJ-DET | 检测到指针调整 |
T-PJ-DIFF | 指针对齐差异 |
T-PJ-GEN | 指针调整已生成 |
T-PJNEG | 负指针对齐 |
T-PJNEG-GEN | 生成负指针对齐 |
T-PJPOS | 正指针对齐 |
T-PJPOS-GEN | 已生成正指针对齐 |
本节中的表定义了与同步相关的事件、警报或条件,这些事件、警报或条件可帮助您监控同步问题并排除同步问题故障。有些警报比其他警报更重要。警报或情况的反复出现需要进一步调查。
警报 | 描述 | 严重级别 | 警报信息 |
---|---|---|---|
EQPT故障 | 设备故障 | CR、SA | 此警报表示指示插槽的设备故障。有关详细信息,请参阅“EQPT FAIL警报”部分。 |
FRNGSYNC | 自由运行同步模式 | 北美、美国国家安全局 | 此警报中的参考是内部第3层时钟。有关详细信息,请参阅“内部(自由运行)同步”部分。 |
FSTSYNC | 快速启动同步模式 | 北美、美国国家安全局 | TCC选择新的计时引用来替换之前失败的引用。FSTSYNC警报通常在大约30秒后清除。有关详细信息,请参阅快速启动同步(FSTSYNC)警报部分。 |
HLDOVRSYNC | 保留同步模式 | MJ,SA,版本4.5 NA,NSA,版本4.1 | 此警报表示主计时参考或辅助计时参考丢失。TCC使用之前获取的参考。有关详细信息,请参阅Holdover(HLDOVRSYNC)警报部分。 |
LOF(位) | 帧丢失(BITS) | MJ、SA | 此警报表示TCC在来自BITS的传入数据中丢失帧描述。 |
LOS(位) | 信号丢失(BITS) | MJ、SA | 当BITS时钟或与BITS时钟的连接失败时,会发生此警报。 |
曼斯文特 | 手动切换到内部时钟 | 北美、美国国家安全局 | 如果手动将NE定时源切换到内部定时源,则会发生此情况。 |
MANSWTOPRI | 手动切换到主要参考 | 北美、美国国家安全局 | 如果手动将NE计时源切换到主计时源,则会发生此情况。 |
MANSWTOSEC | 手动切换到第二个参考 | 北美、美国国家安全局 | 如果手动将NE计时源切换到辅助计时源,则会出现此情况。 |
曼斯沃托特 | 手动切换到第三个参考 | 北美、美国国家安全局 | 如果手动将NE计时源切换到第三个计时源,则会出现此情况 |
SWTOPRI | 同步切换到主参考 | 北美、美国国家安全局 | 当TCC切换到主定时源时,会出现这种情况。 |
SWTOSEC | 同步切换到辅助参考 | 北美、美国国家安全局 | 当TCC切换到辅助计时源时,会出现这种情况。 |
SWTOTHIRD | 同步切换到第三参考 | 北美、美国国家安全局 | 当TCC切换到第三定时源时,会出现这种情况。 |
SYNC-FREQ | 同步参考频率超出界限 | 北美、美国国家安全局 | 根据超出有效参照界限的任何参照报告该条件。 |
SYNCPRI | 主参考计时丢失 | MN、NSA | 当主计时源发生故障,并且计时切换到辅助计时源时,会发生此警报。交换机到辅助计时源还会触发SWTOSEC警报 |
SYNCSEC | 次参考计时丢失 | MN、NSA | 当辅助计时源发生故障,并且计时切换到第三个计时源时,会发生此警报。切换到第三个计时源还会触发SWTOTHIRD警报 |
SYNCTHIRD | 第三次参考时间的丢失 | MN、NSA | 当第三个计时源发生故障时,会发生此警报。如果内部引用是源时发生SYNCTHIRD,请检查TCC卡是否发生故障。随后报告FRNGSYNC或HLDOVRSYNC。 |
注意:CR — 严重,MJ — 重要,MN — 次要,SA — 影响服务,北美 — 未警告,NSA — 影响服务
下一节将更详细地介绍表2中提及的两个警报。
软件版本3.2及更高版本包含用于监控备用TCC的新功能。此功能可帮助您确定是否存在硬件问题。活动TCC从备用TCC收集频率数据,并每40秒评估一次结果。如果一个TCC报告同步信号,而另一个TCC报告OOS信号,则活动TCC将此解释为TCC硬件故障。在这种情况下,活动TCC发出EQPT FAIL警报。如果活动TCC检测到OOS信号,则TCC自动重置。
当时钟丢失外部引用,但继续使用在正常操作期间获取的引用信息时,就会保留。Holdover是指系统时钟连续锁定并同步到更准确的参考140秒以上后的故障转移状态。换句话说,时钟“保存”预定义时间段的原始操作参数。保留频率开始随时间而漂移,特别是当“保留期”到期时。当出现以下情况时,保留:
外部BITS计时引用失败。
光线定时参考失败。
保留频率是指处于保留模式时时钟性能的度量。第3层的保留频率偏移最初为50 x 10-9(第一分钟),在接下来的24小时内为40 x 10-9。
保留模式将无限期地继续,直到有更好的参考可用。如果系统在系统失去参考之前跟踪活动参考时间少于140秒,则系统进入自由运行模式。通常,具有第3层增强锁相环路电路的TCC在发生第一次滑动之前将时钟基准保持超过17小时。如果保留频率值损坏,ONS 15454/327将切换到自由运行模式。
ONS 15454在TCC中具有内部时钟,该内部时钟跟踪较高质量的参考,或在节点隔离的情况下,提供保持定时或自由运行的时钟源。内部时钟是经过认证的第3层时钟,具有与第3层E规范相匹配的增强功能,用于:
自由运行准确性
保持频率漂移
漂移容限
漫游生成
拉入和保持
参考锁定/结算时间
相位瞬变(容差和生成)
当TCC进入快速启动同步模式并尝试使用新参考锁定时,会发生此警报。此问题通常由于先前的计时引用失败而发生。大约30秒后,FSTSYNC警报消失。系统时钟锁定到新参考。如果警报未清除或警报持续重复,则必须检查传入引用的信号损坏。
在制造过程中,TCC被校准到Stratum 1时钟源。校准信息存储在TCC闪存上。首次通电时,TCC加载校准数据库。然后,TCC收集30秒的传入参考数据,并将该数据与本地TCC数据库进行比较。如果差值超过4 ppm,TCC会自动进入“快速启动同步模式”。 在快速启动同步模式下,TCC尝试将系统时钟快速同步到传入时钟。
当TCC实现同步时,TCC收集30秒的资格后数据。根据时钟变化的程度,同步可能需要几分钟。TCC使用资格审批后数据验证同步是否成功。此后,TCC继续正常操作。当接收到失真的输入信号时,TCC报告时钟数据中连续的不匹配。这些报告在快速启动同步模式内产生无限循环。