La documentazione per questo prodotto è stata redatta cercando di utilizzare un linguaggio senza pregiudizi. Ai fini di questa documentazione, per linguaggio senza di pregiudizi si intende un linguaggio che non implica discriminazioni basate su età, disabilità, genere, identità razziale, identità etnica, orientamento sessuale, status socioeconomico e intersezionalità. Le eventuali eccezioni possono dipendere dal linguaggio codificato nelle interfacce utente del software del prodotto, dal linguaggio utilizzato nella documentazione RFP o dal linguaggio utilizzato in prodotti di terze parti a cui si fa riferimento. Scopri di più sul modo in cui Cisco utilizza il linguaggio inclusivo.
Cisco ha tradotto questo documento utilizzando una combinazione di tecnologie automatiche e umane per offrire ai nostri utenti in tutto il mondo contenuti di supporto nella propria lingua. Si noti che anche la migliore traduzione automatica non sarà mai accurata come quella fornita da un traduttore professionista. Cisco Systems, Inc. non si assume alcuna responsabilità per l’accuratezza di queste traduzioni e consiglia di consultare sempre il documento originale in inglese (disponibile al link fornito).
In questo documento viene descritto il funzionamento dell'automazione a ciclo chiuso nelle reti basate su software basate su cloud in uno scenario di installazione 5G.
Il cloud sta rivoluzionando il modo in cui la tecnologia funziona nel mondo tradizionale. Con l'avvento del 5G, il paradigma è cambiato negli ambienti dei provider di servizi. La maggior parte dei metodi manuali e legacy di operare su una rete stanno aprendo la strada all'automazione completa, che fornisce un vantaggio proattivo alle reti, portandole su un percorso di riparazione automatica. Il documento fornisce un costrutto di automazione a circuito chiuso basato su SDN che combina diversi prodotti dell'ecosistema Cisco al fine di fornire un'analisi, una visualizzazione e un risanamento in tempo reale, il tutto con le soluzioni stesse distribuite sul cloud.
Il 5G non solo sta trasformando la tecnologia mobile, ma sta anche creando straordinarie opportunità per numerosi settori e ponendo le basi per interruzioni su larga scala.
Il 5G migliora notevolmente il lavoro quotidiano e l'esperienza con velocità più elevate, maggiore larghezza di banda e latenza ultrabassa.
Non solo nel mondo della mobilità, il 5G si estende oltre la comunicazione mobile per affrontare tutte le forme di servizi di comunicazione; infatti, sta davvero supportando il futuro del mondo digitale consentendo tutti i tipi di servizi, promuovendo il cambiamento economico in tutti i settori e utilizzando diverse tecnologie (Wi-Fi, 4G e tecnologie radio).
Il documento non si concentra sulle fasi di distribuzione. L'obiettivo è l'architettura di automazione e orchestrazione 5G in termini di funzionalità e osservabilità end-to-end.
In questa fase, il 5G si trova principalmente nella fase iniziale di test e installazione, ma è necessario comprendere le sfide associate. Il numero di elementi di rete necessari per eseguire una rete 5G in tutti i domini è enorme. L'installazione della maggior parte delle reti 5G richiede l'automazione per garantire un'implementazione efficiente ed economicamente vantaggiosa con il funzionamento senza interruzioni di tutti i componenti coinvolti.
In uno scenario di installazione automatizzata, è possibile eliminare gran parte del lavoro manuale di pre-pianificazione.
I sistemi di intelligenza artificiale, basati sull'apprendimento automatico (ML), possono modellare il funzionamento delle funzioni di rete in condizioni normali e con carichi elevati.
Utilizzando i dati sulle prestazioni in fase di esecuzione, il sistema può garantire la distribuzione automatica dei nuovi elementi in base alle esigenze. Per garantire l'ottimizzazione e il servizio, il sistema è in grado di raccogliere e analizzare tutti i tipi di feed delle apparecchiature ed esaminarne le prestazioni, determinando se corrispondono ai parametri richiesti e previsti dai provider di servizi.
Sono tre i componenti critici per un'automazione efficace.
Il fondamentale è avere la garanzia e il prossimo è l'apprendimento automatico che può prevedere ciò che la rete sta cercando di ottenere e che porta alla base dell'automazione del ciclo chiuso.
La soluzione proposta è una soluzione software che offre le migliori funzionalità di automazione e garanzia del settore, tra cui:
Sebbene Vitria sia in grado di gestire le prestazioni anche per la migliore soluzione, sia Matrix che Vitria fanno parte della soluzione proposta, dove Matrix è lo strumento migliore per la gestione delle prestazioni e Vitria è la soluzione migliore per la sua capacità di gestione degli errori.
Matrix è un framework di analisi generico sviluppato da Cisco che consente un facile adattamento a diversi tipi di origini dati e consente funzioni di analisi delle applicazioni integrate nella soluzione. Matrix dispone di queste funzionalità chiave che consentono di creare o personalizzare i casi di utilizzo in base ai requisiti.
Con la rete complessa di sistemi interconnessi composta da infrastrutture virtuali e fisiche, reti interne e pubbliche e applicazioni interdipendenti, la gestione dei guasti è una sfida costante.
La tradizionale gestione degli errori si basa su strumenti di monitoraggio isolati che si rivolgono a un livello separato all'interno dello stack di tecnologia. Ogni sistema di monitoraggio genera un numero elevato di allarmi. I tecnici SRE (Service Reliability Engineers) esaminano gli allarmi e determinano se è necessario aprire un ticket.
I problemi correlati tra i sistemi determinano l'apertura di più ticket e l'esecuzione di azioni separate da parte dei team che potrebbero non risolvere la causa principale, sprecando tempo e risorse. Quando si stabilisce finalmente che i problemi apparentemente indipendenti possono essere correlati, viene formato un team interfunzionale per determinare la vera causa principale e coinvolgere l'agente di correzione o l'attività appropriata per risolvere il problema. Mentre si svolge questo tradizionale processo di gestione degli errori, la frustrazione del cliente aumenta. Questo processo lento e laborioso non è più efficace. E' un'operazione che richiede troppo tempo e denaro.
Per ridurre i tempi di rilevamento dei problemi, accelerare la risoluzione e ridurre i costi, è necessario acquisire, correlare e analizzare i segnali nell'ambiente operativo, dagli elementi IT alla rete e all'applicazione. Una gestione efficace degli errori richiede la riduzione del rumore tra i livelli di servizio, l'automazione per ridurre il livello di intervento umano e l'integrazione con i processi e i sistemi di gestione esistenti.
Una nuova svolta nel mondo delle reti è stata l'avvento del routing dei segmenti, che ha semplificato le operazioni sostituendo i metodi tradizionali come MPLS (Multi-Protocol Label Switching). Il routing dei segmenti ha ridotto la complessità delle operazioni eliminando una serie di protocolli e ha determinato una significativa riduzione delle spese operative complessive.
La nuova linea di soluzioni di Cisco chiamata CNC è un controller SDN per le reti di routing dei segmenti. Una volta che una rete è abilitata SR, il CNC entra in gioco con una serie di soluzioni che aiutano una persona a visualizzare la rete, distribuire servizi, politiche, e una serie di altre funzionalità.
Cisco CNC consente ai clienti di semplificare e automatizzare il provisioning, il monitoraggio e l'ottimizzazione dei servizi di rete basati sulle finalità in un ambiente di rete multi-vendor con una GUI e un'API comuni.
La soluzione combina l'automazione della rete basata su intent per fornire funzionalità critiche per l'orchestrazione e l'implementazione dei servizi, tra cui l'ottimizzazione della rete, il calcolo del percorso dei servizi, l'installazione e la gestione dei dispositivi e il rilevamento delle anomalie con la risoluzione automatica dei problemi.
La soluzione completamente integrata combina le funzionalità principali di diversi prodotti innovativi leader del settore, tra cui Cisco Network Services Orchestrator (NSO), Cisco Segment Routing Path Computation Element (SR-PCE), Cisco Crosswork Data Gateway (CDG), l'infrastruttura di Cisco Crosswork e una suite di applicazioni. L'interfaccia utente unificata consente la visualizzazione in tempo reale della topologia e dei servizi di rete, nonché il provisioning dei servizi e dei trasporti, tramite un'unica console.
I principi di Crosswork possono essere riassunti in tre principi di automazione:
Il CNC, con la sua potente suite di soluzioni, fornisce un meccanismo completo per il controllo complessivo della rete. Le soluzioni variano a seconda degli spettri e forniscono funzionalità ad ampio raggio, che soddisfano i tre principi menzionati in precedenza.
1. Topologia attiva
Le reti tradizionali non dispongono di componenti che consentono la visualizzazione delle reti una volta installate. Gli operatori dovevano eseguire fisicamente il login ai router per controllare varie cose. Con la topologia attiva del Crosswork, gli operatori ottengono una visualizzazione in tempo reale dell'intera rete insieme a link, utilizzo, velocità del traffico, nodi e collegamenti, stato di salute, Segment Routing (SR) e RSVP, oltre alla visualizzazione dei percorsi. Tutto ciò che l'operatore deve fare ora è collegarsi a un'interfaccia grafica intuitiva e avere a portata di mano la rete.
2. Crosswork Optimization Engine (COE)
Una soluzione per ottimizzare in tempo reale la rete e consentire agli operatori di gestirne l'utilizzo in modo efficiente. L'obiettivo finale del COE è consentire la riparazione automatica delle reti senza un intervento manuale.
3. Crosswork Data Gateway (CDG)
Immaginate di avere enormi reti con migliaia di dispositivi che generano una tonnellata di dati. Poiché i dati rappresentano il nuovo petrolio, il CDG fornisce un meccanismo per raccogliere tutti questi dati dai dispositivi che possono essere utilizzati da Crosswork stesso o possono anche essere inviati a molte altre applicazioni di terze parti per l'analisi e altre trasformazioni. CDG supporta la raccolta dei dati tramite più protocolli, ad esempio SNMP, CLI, gRPC Network Management Interface (GNMI), MDT, syslog e così via.
4. Crosswork Health Insights (IH)
Con la rete in funzione, la modalità tradizionale consisteva nell'eseguire azioni in modo reattivo una volta trascorso un particolare evento di rete. Questo spesso comporta un costo enorme per i clienti. HI consente di eseguire automaticamente il monitoraggio degli indicatori KPI in tempo reale, la generazione di avvisi e la risoluzione dei problemi. L'utente può definire la propria logica e quindi HI genera avvisi in base al monitoraggio. In questo modo è possibile ottenere un'analisi automatizzata dello stato della rete.
5. Crosswork Change Automation
Le operazioni manuali di routine, come l'applicazione delle modifiche alla configurazione, l'installazione di nuove versioni del software, gli aggiornamenti e altre ancora, possono essere automatizzate e velocizzate con l'utilizzo dell'automazione delle modifiche. Questo fa uso dei playbook Ansible che sono incorporati all'interno, e le modifiche della configurazione vengono quindi applicate ai dispositivi utilizzando Cisco NSO.
6. Crosswork Zero Touch Provisioning (ZTP)
I clienti sono sempre a favore di una riduzione dei tempi di installazione e delle operazioni. Quando si hanno decine o migliaia di nuovi dispositivi da installare nella rete, invece del solito processo manuale che potrebbe essere pieno di errori e richiedere molto tempo, Crosswork ZTP potenzia l'intero processo con una soluzione completamente automatizzata per il provisioning e per integrare i nuovi dispositivi Cisco IOS® XR. I dispositivi possono essere portati su con una configurazione giorno-0 e poi rapidamente aggiunto all'inventario dei dispositivi CNC dopo che il monitoraggio, così come la gestione di questi dispositivi diventa più facile.
Ci sono alcune altre manciate di prodotti che funzionano in tandem con il CNC per raggiungere gli obiettivi. La principale è l'elemento SR-PCE (Segment Routing Path Computation Element), un Cisco IOS XR PCE che supporta sia SR che RSVP. Infatti, è la SR-PCE che facilita la raccolta di topologie attraverso il protocollo BGP-LS e calcola il percorso per consentire al CNC di funzionare come controller.
Il CNC può anche interfacciarsi con l'NSO che aiuta a tradurre un intento di rete in configurazioni specifiche di un dispositivo. Il CNC, quando utilizzato in combinazione con l'NSO diventa un moltiplicatore di forza.
Il monitoraggio Kafka viene attivato con l'aiuto dello strumento Burrow. Burrow è un compagno di monitoraggio di Apache Kafka che fornisce il controllo del ritardo dei consumatori come un servizio senza la necessità di specificare le soglie.
Controlla gli offset impegnati per tutti i consumatori e calcola lo stato di tali consumatori su richiesta. Viene fornito un endpoint HTTP per richiedere lo stato su richiesta e fornire altre informazioni sul cluster Kafka. Queste API vengono sottoposte a polling dallo strumento di monitoraggio delle prestazioni (PM, Performance Monitoring) per generare il monitoraggio del ritardo dei consumatori e fornire informazioni sui cluster Kafka.
L'utilizzo della CPU, dello storage e della memoria dei nodi Kafka è disponibile anche in Matrix, che invia allarmi se le soglie vengono superate o se vengono rilevate anomalie.
Si tratta del processo di attivazione automatizzata dei nuovi dispositivi, generazione della configurazione e provisioning della rete.
Il framework TAF (Advanced Test Automation Framework) consente di eseguire gruppi di test contemporaneamente su migliaia di dispositivi, eliminando così la necessità di convalida manuale. Un'installazione di grandi dimensioni di una rete non può mai essere scalata con una sola convalida manuale e un framework automatizzato come questo aiuta a convalidare le configurazioni dei dispositivi e altri controlli nel modo più efficiente e con limiti di tempo.
Un operatore può iniziare centinaia di test su migliaia di dispositivi con un semplice clic del mouse. Il gruppo di test esegue tutti i test configurati, convalida i dati e quindi visualizza tutti i risultati con i criteri PASS/FAIL in un rapporto dettagliato basato sul Web. In base al report, l'operatore può adottare ulteriori misure per ridurre tali errori nei dispositivi con l'aiuto di altre soluzioni automatizzate.
Si tratta di un'interfaccia utente aperta per tutte le applicazioni che offre la flessibilità necessaria per aggiungere, rimuovere e modificare applicazioni e icone senza necessità di sviluppo.
Fornisce il supporto per l'autenticazione LDAP e l'accesso alla documentazione del prodotto.
Per raggiungere gli obiettivi dell'automazione 5G, è necessaria un'orchestrazione tra domini per collegare le parti tra domini diversi che compongono la rete.
Una volta configurati i dispositivi di trasporto nella rete, invece di perseguire la modalità tradizionale o legacy di gestione manuale dei dispositivi, l'orchestrazione tra domini può essere capitalizzata per guidare con semplicità, agilità ed efficienza.
I dispositivi attivi di rete possono essere integrati nel CNC con la specifica dei protocolli attraverso i quali il CDG può raccogliere i dati dai dispositivi. Una volta che i dispositivi sono stati integrati nel CNC, la visualizzazione in tempo reale dell'intera rete L2 e L3 diventa semplice. Il monitoraggio dei dispositivi facilita la visualizzazione sulla GUI in relazione a molti aspetti dello stato del dispositivo. La raccolta dei dati dai dispositivi inizia a intervalli predeterminati e questi dati hanno un ricco valore analitico. I dati vengono raccolti tramite SNMP, SSH, MDT, telemetria e varie altre modalità descritte in precedenza.
Questi dati possono quindi essere trasmessi alle altre applicazioni all'interno dell'ecosistema. Il CNC consente di inviare i dati raccolti al sistema Matrix attraverso un bus Kafka. La raccolta è sottoscritta a un argomento Kafka e il CDG continua a distribuire i dati raccolti a questo argomento, il cui endpoint è Matrix.
Matrix dispone di diversi dashboard intuitivi da cui è possibile visualizzare questi dati e possono essere eseguite diverse operazioni di analisi. Questi dati possono quindi essere uniti dalla soluzione Cisco Vitria AIOps per il monitoraggio degli errori. Ogni volta che vengono rilevati guasti o anomalie, lo strumento Vitria genera allarmi in modo proattivo in modo da poter adottare le misure correttive necessarie, evitando così guasti gravi.
All'interno di crosswork suite, alcune applicazioni possono coordinare in modo proattivo il traffico in una rete di trasporto, riducendo così i tempi di inattività significativi nei periodi di carico massimo. Feature Pack di COE come Local Congestion Mitigation (LCM) e BWoD (Bandwidth on Demand) sono in grado di risolvere qualsiasi problema in scenari di questo tipo.
LCM è uno strumento molto utile per ridurre la congestione all'interno di una rete e per gestire le policy che utilizzano percorsi alternativi, liberando l'interfaccia sovraccarica. Tutto questo avviene automaticamente senza che un utente tenti di rilevare la congestione dopo che è già avvenuta. Gestione configurazione locale utilizza una soglia configurabile oltre la quale viene considerata congestionata.
Quando l'utilizzo di un'interfaccia supera questa soglia, LCM fornisce suggerimenti per ridurre la congestione a livello di interfaccia locale. La soluzione permette di deviare solo la quantità di traffico richiesta e di portare la congestione al di sotto della soglia. Il vantaggio è che l'intero traffico nell'interfaccia non viene deviato. L'utente può analizzare la serie di suggerimenti e quindi scegliere quello più adatto. In questo modo, le policy tattiche di gestione del traffico vengono avviate da LCM con l'aiuto del componente SR-PCE che aiuta a cancellare automaticamente la congestione in tempo reale.
La soluzione BWoD può essere utilizzata insieme a LCM. Se esiste un'interfaccia ad alta priorità per il traffico voce o video, l'operatore desidera assicurarsi che il percorso abbia sempre una determinata quantità di larghezza di banda disponibile. COE consente all'utente di creare un percorso di criteri BWoD e, quando anche il BWoD è configurato con una soglia, il monitoraggio inizia ogni secondo. Non appena viene superata la soglia dell'interfaccia, BWoD interviene per creare nuove policy SR o per ottimizzare il percorso esistente che si impegna a mantenere la larghezza di banda assegnata.
Questi sono un paio di scenari che ottimizzano il percorso di trasporto e facilitano l'automazione del trasporto. Mentre il CNC può essere utilizzato insieme ad altre soluzioni per elaborare e analizzare i dati, i componenti interni del CNC possono anche svolgere un ruolo importante nello sviluppo della rete di trasporto con l'automazione high-end che aumenta la disponibilità e l'affidabilità della rete.
In qualsiasi caso di utilizzo di CLA, le fasi di base comprendono:
Di seguito è riportata una descrizione del flusso in questa soluzione Cisco:
Un esempio reale di come l'automazione a ciclo chiuso può funzionare sfruttando i componenti Cisco di più domini è meglio illustrato in caso di perdite di memoria dei dispositivi. Il comando show processes memory detail fornisce i dettagli dell'utilizzo di memoria da parte di tutti i processi nel router.
È possibile creare un processo di raccolta nel CNC per consentire al CDG di accedere al router alle cadenze specificate dall'utente ed eseguire il comando
show processes memory detail. Il CDG ottiene l'output di questo comando e inoltra i dati al bus Kafka. Matrix legge questi dati dal bus Kafka, li analizza e li trasforma per visualizzare le informazioni sulla memoria nei relativi dashboard.
Ogni volta che il consumo di memoria supera una determinata soglia per i router, Matrix genera un allarme e inoltra l'anomalia al bus Kafka. Vitria AIOps genera quindi un incidente sul suo cruscotto leggendo l'anomalia dal bus Kafka. Questo può essere visualizzato nel dashboard AIOps che visualizza il nome host del dispositivo in cui l'utilizzo della memoria ha superato i limiti di sicurezza.
Dalla GUI di AIOps, è possibile intervenire su questo allarme integrando un'API di ripristino del dispositivo Network Service Orchestrator (NSO) - un sistema di gestione della configurazione che reimposta il dispositivo.
C'è anche un periodo di raffreddamento in Vitria dove l'incidente è ancora tenuto aperto per un certo periodo di tempo. Entro tale periodo, se Matrix non segnala di nuovo alcuna perdita sullo stesso dispositivo, l'incidente viene chiuso automaticamente. In caso contrario, viene ripetuta la stessa procedura di ripristino del dispositivo. Nel processo, non è necessario un unico intervento manuale e l'intera riparazione viene gestita dagli stessi componenti di più domini che fungono da prova di come l'intero loop sia automatizzato e risolto proattivamente nel modo più coerente, in tempo reale.
Sfide
1. Passaggio al cloud
L'hosting dell'applicazione nel cloud comporta alcune sfide:
- Sono necessarie nuove soluzioni di sicurezza e gestione delle operazioni
- Individuazione di casi di utilizzo e modelli aziendali dietro il limite del cloud
- I cloud devono supportare l'elevato throughput richiesto
- Operazioni, processi, sicurezza e disponibilità devono soddisfare le aspettative degli SP e dei loro clienti
- I fornitori di cloud offrono le loro soluzioni per facilitare la progettazione del trasferimento dei servizi nel cloud, che a volte è difficile da adattare
2. Esitazione per l'automazione
- Impossibilità di prevedere la necessità dell'automazione
- Complessità delle reti di provider
Riepilogo
L'automazione e l'orchestrazione di una rete 5G è un'attività complessa che deve essere adeguatamente pianificata e implementata fin dall'inizio della progettazione di una rete.
La complessità delle reti 5G richiede automazione e orchestrazione per semplificare le attività e ridurre al minimo la probabilità di errore durante la pianificazione, l'implementazione e il funzionamento.
Informazioni correlate
- https://www.cisco.com/c/dam/m/en_us/customer-experience/collateral/5G-automation-architecture-white-paper.pdf
- https://www.cisco.com/c/dam/en/us/td/docs/cloud-systems-management/crosswork-network-controller/3-0/Solution-Workflow-Guide/CNC-3-0-Solution-workflow-guide.pdf
- Supporto tecnico Cisco e download
Revisione | Data di pubblicazione | Commenti |
---|---|---|
2.0 |
01-Apr-2024 |
1. Componente mappato: funzionalità/capacità nelle intestazioni della sezione 3.
2. Caso d'uso: aggiunta dell'introduzione sul caso d'uso da identificare e codificare. |
1.0 |
15-Mar-2024 |
Versione iniziale |