简介
本文档介绍用于故障和性能管理的CX分析解决方案。
目标
本文档主要旨在展示Cisco CX网络级可视性解决方案(Matrix)在处理与数据包核心相关的故障和性能管理方面的功能。它向寻求优化、可定制的分析网络监控解决方案、目前正在使用Cisco Prime并正在寻找替代方案以监控其移动数据包核心网络的内部和外部利益相关方提供了有价值的见解。
概述
每个企业都依赖网络作为基础支持系统。由于相互依赖的技术层、各种域、多供应商环境、不同数据量和格式、虚拟化、基于动态工作负载的扩展以及微服务架构的持续发展,网络正变得越来越复杂。这种复杂性给管理服务提供商/企业网络带来了挑战。
导致工作效率降低的网络故障可能导致重大损失。随之而来的停机时间可能会影响关键业务运营、中断服务、影响客户满意度,并可能损害组织的声誉。因此,维护强大而可靠的网络基础设施对于确保不间断的工作效率和减轻对业务的潜在不利影响至关重要。
网络可视性可增强安全性、性能和规划,同时减少网络运营专业人员的工作负载。组织可以利用整体的集中化视图来映射整个网络、尽早检测威胁、确定警报的优先级、识别异常情况并规划未来的网络投资。Cisco Prime性能管理器和Prime网络通过主动监控SP网络,在这些领域发挥了广泛作用。
根据Sirkin Research的调查,网络运营专业人员在努力满足战略性计划时遇到了几个挑战,其中最显著的是时间紧缺,2019年主要网络挑战调查中近43%的受访者如此表示。由于不同的传统架构,约42%的公司在排除整个网络故障时遇到困难。网络专业人员还努力识别跨多个网络域的网络性能问题(38%),并且由于各种网络交换矩阵的性能可视性不足(35%)而受到阻碍。这些网络性能盲点导致无法提高整体网络性能质量,最终阻碍网络转型计划的成功执行。
“来源:2019年主要网络性能挑战调查- https://www.liveaction.com/2019-top-network-performance-challenges/”
总之,已经确定的网络运营挑战强调了实施全面的网络监控解决方案的重要性。由于故障排除、时间限制和性能可视性差距都非常复杂,因此必须采用稳健的网络监控方法。它不仅能够解决这些问题,而且通过提供全面的洞察力和主动管理,在确保网络转型计划取得成功方面发挥着关键作用。
Cisco Prime性能管理器和Prime网络在主动监控SP网络方面发挥了重要作用。它在世界各地都有业务。与任何其他产品一样,Prime的寿命已由于多种原因而终止,包括市场需求、技术创新和开发驱动的变更,或者产品成熟度和更换功能更丰富的技术。那么,接下来做什么?要过渡至哪种产品?Cisco Prime BU建议将数据包核心设备的性能监控迁移到Matrix。因此,本文档旨在详细介绍Matrix在促进数据包核心性能和故障监控使用案例方面的作用。
Prime EOL日期
“来源:
什么是PN、PPM和Matrix?
思科Prime
Prime分层架构
Cisco Prime网络是一个网络管理系统,允许您操作、管理和管理网络元素。它提供自动配置和变更管理、故障监控和关联,以实现主动服务保证,确保出色的服务可用性。
Cisco Prime Performance Manager是一种性能管理解决方案,可为复杂的运营商网络提供即时、可实施的信息。
集成的Cisco Prime网络和Prime性能管理器可提供完整的网络保证管理解决方案。此组合可提供故障管理和趋势信息,以主动避免未来服务中断。
Cisco CX矩阵
Cisco CX Matrix是一个高级分析解决方案,提供跨域管理和操作网络、服务、基础设施和应用的分析功能。作为一种分析和保证解决方案,Matrix支持多个跨领域架构,并且灵活且可扩展,以满足客户需求。此解决方案促进了多种开箱即用功能,包括开箱即用数据适配器、KPI、机器学习算法、自动库存发现、警报和事件驱动的自动化。
该解决方案高度可扩展,使用户能够无缝地载入网络数据、建立用于深入数据分析的分析逻辑,并通过集成商业智能(BI)层创建自定义控制面板。如下图所示,用户可配置数据管道和控制面板,以准确满足客户需求。一旦摄入数据,用户就可以利用Matrix的更大功能集,如审计和报告框架以及机器学习管道。
矩阵分层体系结构
该平台配备开箱即用的功能,提供预构建的使用案例,可全面解决服务提供商和企业环境中的关键架构域问题。这些功能包扩展为最终用户提供开箱即用的使用案例,可以在应用设置过程中启用。
该解决方案扩展了对服务提供商空间内的移动核心(4G/5G)、传输、光纤和数据中心域的支持。在企业细分市场中,该平台适用于各种域,例如园区无线、WAN/SDWAN和数据中心。它提供跨领域可视性,确保采用全方位、全面的方法来满足各种组织需求。
矩阵功能:
- 用于监控网络、服务和用户的单一管理平台。
- 关联的多域可视性。
- 服务和用户体验分析。
- 网络容量利用率分析。
- 使用AI/ML的智能警报。
- 多域突发事件管理。
- 实时主动警报,而不是手动报告。
- 按需网络审计。
- 整合的库存管理。
使用案例-数据包核心网络监控
移动数据包核心(MPC)是服务提供商网络中的关键组件,特别是在移动通信系统中。它在实现无缝移动性和提供多种基本功能(无缝移动性、数据包交换、服务质量、策略实施、安全、计费和计费以及网络管理)方面发挥着关键作用。它构成了现代移动通信系统的主干,为数百万用户提供了高效可靠的连接。
多年来,借助软件定义网络(SDN)和网络功能虚拟化(NFV)功能,MPC已经发展了很多,能够带来灵活性和智能网络架构。为了实现最佳的资源利用率和缓解潜在的瓶颈和其它网络问题,现代网络必须集成监控工具。
性能监控
Cisco CX Matrix提供一套强大的功能,包括广泛的知识库、计数器、架构类型、默认控制面板和超过6,000个关键绩效指标(KPI)库,以有效地监督数据包核心网络运营。它主动监控整个数据包核心(包括3G、4G和5G)以及基础设施层的性能,及时检测到任何实时性能下降。矩阵为客户提供灵活性,允许创建新的控制面板、KPI和不同级别的各种聚合以满足特定需求。
性能监控功能列表:
功能 |
PPM |
矩阵 |
批量统计数据处理 |
✓ |
✓ |
StarOS All计数器报告 |
✓ |
✓ |
KPI报表 |
✓ |
✓ |
控制面板中的KPI和原始数据可视化 |
✓ |
✓ |
KPI和原始数据聚合 |
✓ |
✓ |
阈值超限警报 |
✓ |
✓ |
警报丰富 |
|
✓ |
警报关联 |
|
✓ |
自定义报告 |
✓ |
✓ |
电子邮件通知 |
✓ |
✓ |
北向集成 |
✓ |
✓ |
网络/区域范围的聚合 |
|
✓ |
可自定义的控制面板 |
|
✓ |
根据前N个或前N个节点分析KPI |
|
✓ |
基于AI/ML的高级预测 |
|
✓ |
高级数据收集机制(Webhook、DB连接器) |
|
✓ |
批量统计数据收集和处理
除了高级数据收集技术之外,Matrix还支持批量统计数据的收集和处理。采用批量统计数据进行性能监控是一种高效、全面的系统性能监控技术。它涉及批量收集和分析性能数据,而不是单独检索各个数据点。批量统计数据批量聚合和处理绩效指标,可减少与数据检索、处理和传输相关的开销。这样可以提高监控效率并减少网络拥塞。
使用批量统计数据,可以实时分析性能趋势。它可识别瓶颈并主动优化系统资源。通过批量分析性能数据,Matrix使用户能够做出明智的决策并迅速采取行动,从而提高性能并提供更好的用户体验。
矩阵增值和竞争优势:
- Matrix还支持下列多种不同的数据收集机制:
- SNMP
- CLI
- API
- 数据库连接
- Webhook
- Netflow
- gNMI/MDT
- 一种灵活的用户界面,用于为数据收集设置不同的采样间隔。
原始计数器报告
这是跨SP广泛看到的必要使用案例之一,因为其现有生态系统的OSS依赖于定制原始信息来进行进一步处理。借助KPI报表矩阵还支持生成原始数据,以支持客户在环境中的现有操作。
矩阵增值和竞争优势:
- 在引入新计数器和架构更新时,用户可免除手动配置负担。Matrix可以轻松检测并自动合并SSD中的任何更改。
- 对行、列或大小没有限制;除非Excel施加限制,否则可以在单个文件中访问所有计数器详细信息。这消除了OSS或任何涉及检查多个文件以供分析的手动过程的开销。
KPI报表
Matrix在处理批量统计数据文件期间根据抽样间隔集处理和计算定义的KPI。这些计算值存储在数据库中以供历史分析。Matrix提供了一个灵活的用户界面,可在任何KPI不符合用途的情况下配置相关的KPI。它还允许用户向定义的KPI添加阈值,以便发出警报通知并选择以下聚合方法。
- 平均值 -网络中一个或多个节点的所有样本的平均值
- 峰值 -仅考虑网络中一个或多个节点的所有样本的峰值(最大值)
- Sum -累加网络中一个或多个节点的所有示例
矩阵增值和竞争优势:
- 灵活的用户界面,可添加任何计数器、方案和KPI。
- 整个网络的节点聚合。
- 用户界面用于配置阈值并将超过阈值的警报转发到NBI。
- 用于生成任何自定义报告的报告框架。
- 电子邮件通知/报告。
- 性能KPI警报可在超过用户可定义的阈值或基于ML的学习中生成。
- 警报可以转发到北向系统(例如BPA、Netcool、Prometheus、ServiceNow等),可通过REST API或SNMP陷阱(v3)推送到Kafka主题,消费者可以从该主题中消费它以进行进一步处理。
可视化和控制面板
可视化和仪表板在KPI监控中起着至关重要的作用。矩阵提供各种图表和图表,可将原始KPI数据转换为直观且易于理解的表示法。此期间的历史趋势可让您深入了解长期性能,从而做出明智的决策,并相应地规划网络增强或优化。
矩阵增值和竞争优势:
矩阵自定义仪表板面板
- 可创建具有不同视图的控制面板数量,并可向任何控制面板授予基于角色的视图。例如,Executive dashboard(执行控制面板)仅对执行团队可用。
矩阵RBAC面板
- 任何控制面板中的过滤器选项都将帮助您对不同网络元素、区域或时间段中的KPI进行比较分析。通过并排比较KPI,网络操作员可以识别性能不佳的区域、查明瓶颈并有效分配资源。
- KPI工作台:开箱即用的矩阵功能通常提供向下钻取功能,允许用户探索不同粒度和汇聚级别的KPI数据。此功能使网络操作员能够更深入地了解特定的KPI或网络分段,确定性能问题的根本原因,并采取适当的措施。
- 使用控制面板上的默认KPI绘图功能,用户可以轻松地绘制和查看“前N/最差N”节点视图。
|
|
矩阵KPI工作台 |
数据汇聚
KPI数据聚合使企业能够获得性能的整体视图,确定需要改进的领域,并做出数据驱动的决策。它全面了解关键指标如何演变,并帮助跟踪实现组织目标的进度。Cisco CX矩阵提供不同级别的数据聚合。
矩阵增值和竞争优势:
- 支持不同的聚合逻辑,例如平均值(avg)、最小值(min)和最大值(max)。
- 在节点、网络和区域级别启用聚合。
- 根据不同的时间段(包括每小时、每天和自定义时间间隔)灵活进行聚合。
南向集成
Matrix提供多种数据收集机制,包括批量统计数据和SSD文件。对于MPC,批量统计数据和SSD文件起着至关重要的作用。南向设备会定期将SSD和批量统计数据文件传输到Matrix。但是,推送SSD文件的频率低于批量统计数据,因为它仅在网络设备配置发生修改时才会更改。因此,SSD文件会在发生更改时或按计划的时间间隔(如每月或每周)发送到Matrix。通过成功分析此SSD文件,可实现设备集成或自注册。
矩阵增值和竞争优势:
- 提供多种数据适配器。
- 支持传统技术和新技术。
- 包括用于Webhook集成的适配器。
- 提供用于遥测数据集成的适配器。
基于当前实施的设备支持列表:
- ASR5500
- vePDG
- MME
- SGSN
- SGW
- PGW
- UPF
- CP
- SAEGW
- AMF
- SMF
- PCF
- NRF
- CPS (PCRF)
- UCS
- ESC
- ACI
- APIC
- NXOS
- CVIM
北向集成
Matrix旨在与环境中的现有OSS应用无缝集成。它提供了必要的接口、协议和API,以实现Matrix和其他OSS系统之间的顺利通信和数据交换。它提供了用于添加北向应用的用户友好界面。Matrix和北向应用(NBA)之间的通信通过标准REST API和SNMP调用建立。通过将Matrix与其他OSS应用程序集成,组织可以利用多个系统的功能提高效率和生产力。
矩阵增值和竞争优势:
- 用于NBI配置的灵活用户界面。
- 用于排除不需要为其转发警报的节点的选项。
- ITSM/票证工具支持。
- 警报丰富,关联。
- 提供多个接口以与北向系统(REST、SFTP、SNMP v3)集成。
- 警报可以推送到Kafka,以便消费者可以进一步消费。
支持的NBI列表:
接口 |
PPM |
PN |
矩阵 |
Rest |
✓ |
✓ |
✓ |
SFTP |
✓ |
✓ |
✓ |
SNMP (v3) |
|
|
✓ |
卡夫卡 |
|
|
✓ |
故障监控
通过SNMP陷阱进行故障监控是主动检测和响应网络和系统故障的方法。SNMP陷阱是网络设备或系统在发生预定义的事件或情况(例如硬件故障、网络中断或配置问题)时发送的异步通知。通过配置SNMP陷阱接收器,管理员可以实时捕获和分析这些陷阱,从而立即发出警报并进行故障排除。通过SNMP陷阱进行故障监控有助于快速识别和解决问题,从而最大限度地减少停机时间,并确保网络基础设施的可靠性和可用性。
矩阵增值和竞争优势:
- 它还通过Webhook支持事件驱动的警报。
- 过滤多个数据源的丰富性和关联性选项。
- 用于排除不需要为其转发警报的节点的选项。
- ITSM/票证工具支持。
故障监控功能列表:
功能 |
PN |
矩阵 |
警报消耗snmpv2和snmpv3 |
✓ |
✓ |
通过API的警报消耗 |
|
✓ |
通过Webhook的警报消耗 |
|
✓ |
警报过滤 |
✓ |
✓ |
警报重复数据删除 |
✓ |
✓ |
警报转发 |
✓ |
✓ |
警报重新同步选项 |
|
✓ |
电子邮件通知 |
✓ |
✓ |
北向集成 |
✓ |
✓ |
警报丰富 |
|
✓ |
关联 |
基本 |
高级 |
自我健康监控和通知 |
|
✓ |
通过REST转发警报 |
|
✓ |
通过SNMP陷阱(v3)转发警报 |
|
✓ |
警报转发到Kafka |
|
✓ |
故障单或事件 |
✓ |
✓ |
架构
Cisco Prime包括托管VNE的单元服务器、网关服务器、嵌入式数据库或外部Oracle数据库,以及基于Windows的客户端。根据网络规模,Cisco Prime设备和网关服务器软件可以部署在单个服务器上,也可以跨多个服务器部署为分布式架构。裸机或虚拟服务器支持Cisco Prime部署。系统还可以配置为各种备用/本地/地理高可用性模式,以帮助确保业务连续性。
Prime部署架构
Cisco Matrix遵循微服务架构,该架构由相互通信的小型独立服务组成,以提供最终成果。每项服务都侧重于特定的业务能力,可以独立开发、部署和扩展。此架构可提高模块性、可扩展性和恢复能力,实现高效开发、更轻松的维护以及适应不断变化的需求的能力。它还带来了灵活性,使团队能够根据需要为每个服务选择最合适的技术堆栈。Matrix支持Kubernetes、基于虚拟服务器和云的基于docker的部署。可以定制多种部署配置,以满足每个客户环境的需求。
矩阵部署架构
虽然Cisco CX Matrix比Prime具有更高的虚拟机(VM)和数据库规模要求,但是它利用功能、尖端技术、卓越的扩展功能、卓越的性能和高级可视化功能方面的独特优势来补偿这些要求。
来源:
Prime: https://www.cisco.com/c/en/us/td/docs/net_mgmt/prime/network/5-2/installation/guide/CiscoPrimeNetwork52InstallationGuide/installation_overview.html
矩阵:https://cisco.sharepoint.com/sites/Cross-DomainAnalytics/SitePages/Matrix-Analytics-Release.aspx
注意:上面显示的矩阵架构采用本地HA模式下的docker,在云和K8环境中,此架构会有所不同。
部署促进功能列表:
功能 |
PPM/PN |
矩阵 |
VMware |
✓ |
✓ |
物理服务器 |
✓ |
✓ |
基于Docker的部署 |
|
✓ |
基于K8的部署 |
|
✓ |
本地HA |
✓ |
✓ |
Geo HA |
✓ |
✓ |
IPv4和IPv6支持 |
✓ |
✓ |
备份和恢复 |
✓ |
✓ |
保留 |
|
✓ |
平台功能列表:
功能 |
PPM |
PN |
矩阵 |
网络监控 |
✓ |
|
✓ |
基础设施监控 |
基本 |
|
高级 |
运行状况检查 |
|
|
✓ |
故障警报 |
|
✓ |
✓ |
基于阈值的警报 |
|
|
✓ |
风险通告生命周期管理 |
|
✓ |
✓ |
基于ML的警报 |
|
✓ |
✓ |
库存管理 |
|
✓ |
✓ |
网络拓扑 |
|
✓ |
✓ |
KPI管理 |
✓ |
|
✓ |
审计 |
|
✓ |
✓ |
报告 |
✓ |
|
✓ |
电子邮件通知 |
✓ |
|
✓ |
用户管理 |
✓ |
✓ |
✓ |
租户集成和管理 |
✓ |
|
✓ |
系统日志管理 |
|
✓ |
✓ |
预测 |
|
|
✓ |
用户分析 |
|
|
✓ |
闭环自动化 |
|
|
✓ |
多供应商支持 |
|
|
✓ |
SSO |
|
|
✓ |
结论
Cisco CX Matrix的功能集可提供全网可视性,并具有一系列创新功能,可显著增强用户体验、简化操作并将我们的产品定位在行业标准的前沿。
对迁移感兴趣/需要更多有关产品的详细信息,请联系这些联系人,