簡介
本文檔介紹用於故障和效能管理的CX分析解決方案。
目標
本文檔主要旨在展示Cisco CX網路級可視性解決方案(Matrix)在處理有關資料包核心的故障和效能管理方面的功能。它向內部和外部利益相關方提供了有價值的見解,這些利益相關方正在搜尋最佳化的可定製分析網路監控解決方案,並且目前正在使用Cisco Prime並尋找替代方案來監控其移動資料包核心網路。
概觀
每個企業都依賴網路作為基本的支援系統。由於相互依賴的技術層、各種域、多供應商環境、各種資料量和格式、虛擬化、基於動態工作負載的擴展以及微服務體系結構的不斷演變,網路變得越來越複雜。這種複雜性給管理SP/企業網路帶來了挑戰。
導致工作效率損失的網路中斷可能導致重大損失。隨之而來的停機時間可能會影響關鍵業務運營,中斷服務,影響客戶滿意度,並可能損害組織的聲譽。因此,維護強大且可靠的網路基礎設施對於確保不間斷工作效率和減輕對業務的潛在不利影響至關重要。
網路可視性增強了安全性、效能和規劃,同時減少了網路運營專業人員的工作量。一個全面的集中式檢視讓組織能夠對映整個網路、及早檢測威脅、確定警報優先順序、辨識異常情況並規劃未來網路投資。Cisco Prime Performance Manager和Prime Network透過主動監控SP網路在這些領域發揮了廣泛作用。
根據Sirkin Research,網路運營專業人員在努力滿足戰略計畫時遇到了多個挑戰,最顯著的是時間短缺,2019年網路挑戰調查中近43%的受訪者指出。大約有42%的網路因為不同的舊式架構而難以排除整個網路的問題。網路專業人員還設法找出跨多個網路域的網路效能問題(38%),並且由於各種網路交換矩陣的效能可視性不佳(35%)而受阻。網路效能的這些盲點導致無法提高整體網路效能品質,最終阻礙網路轉換計畫的成功執行。
「來源:2019年主要網路效能挑戰調查- https://www.liveaction.com/2019-top-network-performance-challenges/」
總之,網路運營中發現的挑戰強調了實施全面網路監控解決方案的重要性。由於故障排除、時間限制以及效能可視性方面的差距都非常複雜,因此必須採用強大的網路監控方法。它不僅解決了這些問題,而且透過提供全面的見解和主動管理,在確保網路轉型計畫取得成功方面發揮著關鍵作用。
Cisco Prime Performance Manager和Prime Network在主動監控SP網路方面發揮了重要作用。它遍佈全球。Prime像其他任何產品一樣,由於多種原因(市場需求、技術創新和開發驅動的變化,或者產品成熟度和用功能更豐富的技術替換),已停產。接下來做什麼?要轉換到哪個產品?Cisco Prime BU建議將資料包核心裝置的效能監控遷移至Matrix。因此,本文檔旨在詳細介紹Matrix在幫助實現資料包核心的效能和故障監控使用情形方面的作用。
Prime EOL日期
「來源:
什麼是PN、PPM和Matrix?
Cisco Prime
Prime分層體系結構
Cisco Prime Network是一種網路管理系統,可用於操作、管理和管理網路元素。它提供自動配置和變更管理、故障監控和關聯,以實現主動式服務保證,實現卓越的服務可用性。
Cisco Prime Performance Manager是一種效能管理解決方案,可為複雜的業者網路提供即時、可行的資訊。
整合的Cisco Prime Network和Prime Performance Manager提供完整的網路保證管理解決方案。此組合可提供故障管理和趨勢資訊,從而主動避免未來服務中斷。
Cisco CX矩陣
Cisco CX Matrix是一個高級分析解決方案,提供跨域管理和操作網路、服務、基礎設施和應用的分析功能。作為分析和保證解決方案,Matrix支援多個跨域架構,並且靈活且可擴展,以滿足客戶需求。此解決方案可提升多種開箱即用功能,包括開箱即用資料介面卡、KPI、機器學習演算法、自動庫存發現、警報和事件驅動的自動化。
該解決方案具有高度可擴充性,使使用者能夠無縫地嵌入網路資料,建立用於深入資料分析的分析邏輯,並透過整合業務智慧(BI)層建立自定義控制台。如下圖所示,使用者可配置資料管道和控制台,以精確符合客戶要求。一旦資料被接收,使用者就可以利用Matrix的更大功能集,如稽核和報告架構以及機器學習管道。
矩陣分層體系結構
該平台配備了開箱即用的功能,提供了預構建的使用案例,可全面解決服務提供商和企業環境中的關鍵架構域問題。這些功能包擴展為終端使用者提供了開箱即用的使用案例,可以在應用程式設定過程中啟用這些使用案例。
該解決方案擴展了對服務提供商空間內的移動核心(4G/5G)、傳輸、光纖和資料中心域的支援。在企業市場中,該平台適用於各種域,例如園區無線、WAN/SDWAN和資料中心。它提供跨領域可視性,確保採用靈活和全面的方法來滿足各種組織需求。
矩陣功能:
- 用於監控網路、服務和使用者的單一管理平台。
- 關聯的多域可視性。
- 服務和使用者體驗分析。
- 網路容量利用率分析。
- 使用AI/ML的智慧警報。
- 多域事件管理。
- 即時主動警報,而不是手動報告。
- 按需網路審計。
- 整合的庫存管理。
使用案例-資料包核心網路監控
移動分組核心(MPC)是服務提供商網路中的關鍵元件,特別是在行動通訊系統環境中。它在實現無縫移動性並提供各種基本功能(無縫移動性、資料包交換、服務品質、策略實施、安全、計費和計費以及網路管理)方面起著至關重要的作用。它構成現代行動通訊系統的主幹,為數百萬使用者提供了高效和可靠的連線。
多年來,藉助軟體定義網路(SDN)和網路功能虛擬化(NFV)功能,MPC已經發展了很多,以引入靈活性和智慧網路架構。為了達到最佳的資源利用率並緩解潛在的瓶頸和其他網路問題,現代網路必須整合監控工具。
效能監控
Cisco CX Matrix提供一套強大的功能,包括廣泛的知識庫、計數器、架構型別、預設控制台和包含6,000多項關鍵效能指標(KPI)的庫,以有效地監督資料包核心網路的運行。它主動監控整個資料包核心(包括3G、4G和5G)以及基礎架構層的效能,及時檢測任何即時效能降級。Matrix為客戶提供了靈活性,允許在不同級別建立新的控制台、KPI和各種彙總,以滿足特定需求。
效能監控功能清單:
功能 |
PPM |
矩陣 |
批次統計資料處理 |
✓ |
✓ |
StarOS All計數器報告 |
✓ |
✓ |
KPI報表 |
✓ |
✓ |
儀表板中的KPI和原始資料視覺化 |
✓ |
✓ |
KPI和原始資料聚合 |
✓ |
✓ |
超過警示臨界值 |
✓ |
✓ |
警報內容豐富 |
|
✓ |
警示相互關聯 |
|
✓ |
自定義報告 |
✓ |
✓ |
電子郵件通知 |
✓ |
✓ |
北向整合 |
✓ |
✓ |
網路/區域範圍的聚合 |
|
✓ |
可定製的控制台 |
|
✓ |
根據Top-N或Worst-N節點分析KPI |
|
✓ |
基於AI/ML的高級預測 |
|
✓ |
進階資料收集機制(Webhook、DB聯結器) |
|
✓ |
批次統計資料收集和處理
Matrix除了支援高級資料收集技術外,還支援批次統計資料收集和處理。使用批次統計資料進行效能監控是一種用於監控系統效能的高效綜合技術。它涉及批次收集和分析效能資料,而不是單獨檢索單個資料點。批次統計資料透過批次聚合和處理效能指標,減少了與資料檢索、處理和傳輸相關的開銷。這可以提高監控效率和減少網路擁塞。
使用批次統計資料可以即時分析效能趨勢。它可以辨識瓶頸並主動最佳化系統資源。透過批次分析效能資料,Matrix使使用者能夠做出明智的決策並迅速採取行動,以提高效能並提供更好的使用者體驗。
矩陣值增加和差異點:
- Matrix還支援下列多種不同的資料收集機制:
- SNMP
- CLI
- API
- 資料庫連線
- Webhook
- Netflow
- gNMI/MDT
- 一種靈活的使用者介面,用於為資料收集設定不同的取樣間隔。
原始計數器報告
這是跨SP廣泛看到的必要使用案例之一,因為其現有生態系統具有OSS,這依賴於定製原始資訊以進行進一步處理。使用KPI報表矩陣還支援生成原始資料,以支援客戶在環境中的現有操作。
矩陣值增加和差異點:
- 在引入新的計數器和架構更新方面,使用者無需手動配置。Matrix可以輕鬆檢測並自動合併SSD中的任何更改。
- 列、欄或大小沒有限制;所有計數器詳細資料都可以在單一檔案中存取,除非Excel施加限制。這消除了OSS或任何涉及檢查多個檔案進行分析的手動過程的開銷。
KPI報表
Matrix會根據抽樣間隔集處理並計算批次統計資料檔案處理期間定義的KPI。這些計算值會儲存在資料庫中,供歷史分析使用。Matrix提供了一個靈活的使用者介面,可在重要績效指標不滿足目的的情況下配置任何感興趣的重要績效指標。它也可讓使用者將臨界值新增至已定義的KPI,以進行警示通知並選擇下列聚總方法。
- Average -平均網路中一個或多個節點的所有樣本
- Peak -僅考慮網路中一個或多個節點的所有樣本的峰值(最大值)
- Sum -加總網路中一個或多個節點的所有示例
矩陣值增加和差異點:
- 靈活的使用者介面,可增加任何計數器、架構和KPI。
- 整個網路、節點式的彙總。
- 用於配置閾值並將閾值轉發到NBI警報的使用者介面。
- 產生任何自訂報表的報表架構。
- 電子郵件通知/報告。
- 當超過使用者可定義的臨界值或以ML為基礎的學習專案時,即可產生效能KPI警示。
- 警報可以轉發到北向系統(例如BPA、Netcool、Prometheus、ServiceNow等),可透過REST API或SNMP設陷(v3),並可移至Kafka主題,讓消費者可以使用該主題進行進一步處理。
視覺化與儀表板
視覺化與儀表板在KPI監控中扮演著重要角色。Matrix提供各種圖表和圖表,將原始KPI資料轉換為直觀且易於理解的表示法。此期間的歷史趨勢可讓您深入瞭解長期績效,以做出明智的決策,並相應地規劃網路增強或最佳化。
矩陣值增加和差異點:
- 一種靈活的使用者介面,用於建立KPI資料的自定義圖形檢視。
矩陣自訂儀表板面板
- 可以建立N個具有不同檢視的儀表板,並且可以將基於角色的檢視授予任一儀表板。例如,「執行儀表板」僅提供給執行團隊。
矩陣RBAC面板
- 任何資料面板中的篩選選項都可以協助您針對不同網路要素、區域或時間週期的KPI進行比較分析。透過並排比較KPI,網路操作員可以辨識效能不佳的區域、查明瓶頸並有效地分配資源。
- KPI工作台:開箱即用的矩陣功能通常提供向下鑽取功能,使使用者可以在不同的粒度和聚合級別瀏覽KPI資料。此功能使網路操作員能夠更深入地瞭解特定的KPI或網路分段,確定效能問題的根本原因並採取適當的措施。
- 使用儀表板上的預設KPI繪圖功能,使用者可以輕鬆繪製及視覺化「前N/最差N」節點檢視。
|
|
矩陣KPI維護作業 |
資料聚總
KPI資料聚合使企業能夠全面瞭解效能、確定需要改進的領域並做出資料驅動的決策。它全面瞭解關鍵指標如何演變,並有助於跟蹤實現組織目標的進展情況。Cisco CX矩陣提供不同級別的資料聚合。
矩陣值增加和差異點:
- 支援不同的聚合邏輯,如平均值(avg)、最小值(min)和最大值(max)。
- 在節點、網路和區域層級啟用彙總。
- 根據不同的時間段(包括每小時、每天和自定義的時間間隔)提供聚合的靈活性。
南向整合
Matrix提供多種資料收集機制,包括批次統計資料和SSD檔案。對於MPC,批次統計資料和SSD檔案起著至關重要的作用。南向裝置會定期將SSD和批次統計資料檔案傳輸到Matrix。但是,推送SSD檔案的頻率低於批次統計資料推送,因為只有網路裝置配置發生修改時,它才會發生更改。因此,SSD檔案將在發生更改時或在計畫的時間間隔(如每月或每週)傳送至Matrix。透過成功分析此SSD檔案,可實現裝置整合或自註冊。
矩陣值增加和差異點:
- 提供各式各樣的資料介面卡。
- 支援傳統技術和新技術。
- 包括用於Webhook整合的介面卡。
- 提供用於遙測資料整合的介面卡。
基於當前實施的裝置支援清單:
- ASR5500
- vePDG
- MME
- SGSN
- SGW
- PGW
- UPF
- CP
- SAEGW
- AMF
- SMF(單一模式光纖)
- PCF
- NRF
- CPS (PCRF)
- UCS
- ESC
- ACI
- APIC
- NXOS
- CVIM
北向整合
Matrix旨在與環境中的現有OSS應用程式無縫整合。它提供了必要的介面、協定和API,以實現Matrix和其他OSS系統之間的順利通訊和資料交換。它提供了一個使用者友好的介面,用於增加北向應用。Matrix和Northbound應用程式(NBA)之間的通訊是透過標準REST API和SNMP呼叫建立的。透過將Matrix與其他OSS應用程式整合,組織可以利用多個系統的功能提高效率和工作效率。
矩陣值增加和差異點:
- NBI配置的靈活使用者介面。
- 排除不需要轉發警報的節點的選項。
- ITSM/票證工具支援。
- 警報增加,關聯。
- 提供多個介面以與北向系統(REST、SFTP、SNMP v3)整合。
- 警報可以推到Kafka,這樣消費者就可以進一步消費。
支援的NBI清單:
介面 |
PPM |
PN |
矩陣 |
休息 |
✓ |
✓ |
✓ |
SFTP |
✓ |
✓ |
✓ |
SNMP (v3) |
|
|
✓ |
卡夫卡 |
|
|
✓ |
故障監控
透過SNMP陷阱進行故障監控是一種主動檢測和響應網路和系統故障的方法。SNMP陷阱是網路裝置或系統在發生預定義的事件或情況(如硬體故障、網路中斷或配置問題)時傳送的非同步通知。透過配置SNMP陷阱接收器,管理員可以即時捕獲和分析這些陷阱,從而立即發出警報並進行故障排除。透過SNMP陷阱進行故障監控可以快速辨識和解決問題,最大限度地減少停機時間,並確保網路基礎設施的可靠性和可用性。
矩陣值增加和差異點:
- 它還透過Webhook支援事件驅動的警報。
- 過濾多個資料來源的豐富和關聯選項。
- 排除不需要轉發警報的節點的選項。
- ITSM/票證工具支援。
故障監控功能清單:
功能 |
PN |
矩陣 |
警報消耗snmpv2和snmpv3 |
✓ |
✓ |
透過API的警報消耗 |
|
✓ |
透過Webhook的警報消耗 |
|
✓ |
警報過濾 |
✓ |
✓ |
警報重複刪除 |
✓ |
✓ |
警報轉發 |
✓ |
✓ |
警報重新同步選項 |
|
✓ |
電子郵件通知 |
✓ |
✓ |
北向整合 |
✓ |
✓ |
警報增加 |
|
✓ |
相互關聯 |
基本 |
進階 |
自我健康監控和通知 |
|
✓ |
透過REST轉發警報 |
|
✓ |
透過SNMP陷阱(v3)轉發警報 |
|
✓ |
警報轉發到Kafka |
|
✓ |
票證或事件 |
✓ |
✓ |
架構
Cisco Prime由託管VNE的單元伺服器、網關伺服器、嵌入式資料庫或外部Oracle資料庫以及基於Windows的客戶端組成。根據網路的規模,Cisco Prime裝置和網關伺服器軟體可以部署在單個伺服器上,也可以跨分散式架構的多個伺服器部署。裸機或虛擬伺服器支援Cisco Prime部署。系統還可以以各種備用/本地/異地高可用性模式進行配置,以幫助確保業務連續性。
Prime部署架構
Cisco Matrix遵循由相互通訊的小型獨立服務組成的微服務架構,提供最終成果。每項服務都側重於特定的業務能力,可以獨立開發、部署和擴展。此架構提高了模組性、可擴充性和可復原性,可實現高效的開發、更簡單的維護和適應不斷變化的需求的能力。它還帶來了靈活性,使團隊能夠根據要求為每項服務選擇最合適的技術堆疊。Matrix支援Kubernetes、基於虛擬伺服器和雲的基於docker的部署。您可以量身定製各種部署配置,以滿足每個客戶環境的需求。
矩陣部署架構
雖然Cisco CX Matrix的虛擬機器(VM)和資料庫規模要求高於Prime,但它用功能、尖端技術、卓越擴展功能、卓越效能和高級視覺化功能方面的獨特優勢來補償這些要求。
來源:
Prime: https://www.cisco.com/c/en/us/td/docs/net_mgmt/prime/network/5-2/installation/guide/CiscoPrimeNetwork52InstallationGuide/installation_overview.html
矩陣:https://cisco.sharepoint.com/sites/Cross-DomainAnalytics/SitePages/Matrix-Analytics-Release.aspx
注意:上面顯示的矩陣體系結構與本地HA模式下的docker不同,在雲和K8環境中,情況會有所不同。
部署促進功能清單:
功能 |
PPM/PN |
矩陣 |
VMware |
✓ |
✓ |
實體伺服器 |
✓ |
✓ |
基於Docker的部署 |
|
✓ |
K8型部署 |
|
✓ |
本地HA |
✓ |
✓ |
Geo HA |
✓ |
✓ |
IPv4和IPv6支援 |
✓ |
✓ |
備份與還原 |
✓ |
✓ |
保留 |
|
✓ |
平台功能清單:
功能 |
PPM |
PN |
矩陣 |
網路監控 |
✓ |
|
✓ |
基礎架構監控 |
基本 |
|
進階 |
狀況檢查 |
|
|
✓ |
故障警報 |
|
✓ |
✓ |
基於閾值的警報 |
|
|
✓ |
警示生命週期管理 |
|
✓ |
✓ |
基於ML的警報 |
|
✓ |
✓ |
庫存管理 |
|
✓ |
✓ |
網路拓撲 |
|
✓ |
✓ |
KPI管理 |
✓ |
|
✓ |
稽核 |
|
✓ |
✓ |
報告 |
✓ |
|
✓ |
電子郵件通知 |
✓ |
|
✓ |
使用者管理 |
✓ |
✓ |
✓ |
租戶整合和管理 |
✓ |
|
✓ |
系統日誌管理 |
|
✓ |
✓ |
預測 |
|
|
✓ |
使用者分析 |
|
|
✓ |
閉環自動化 |
|
|
✓ |
多供應商支援 |
|
|
✓ |
SSO |
|
|
✓ |
結論
這表明Cisco CX Matrix的功能集可提供網路範圍的可視性,並提供一系列創新功能,顯著增強使用者體驗、簡化運營,並使我們的產品處於行業標準的前沿。
有意移轉/需要更多產品相關詳細資訊,請連絡這些連絡人、