Introduzione
Questo documento descrive la connettività di rete supportata per diverse reti coinvolte nell'installazione di cluster a 3 nodi Cisco DNA Center.
Prerequisiti
Acquisire familiarità con le informazioni di base sul cluster Cisco DNA Center a 3 nodi e l'alta disponibilità (HA, High Availability) con questi articoli:
Descrizione
Per Cisco DNA Center versione 1.2.8, il cluster HA a 3 nodi è supportato per l'automazione di base e l'automazione dell'accesso SD. In 1.2.8/1.2.10, HA è ancora in versione beta per Assurance.
La disponibilità elevata di Cisco DNA Center offre maggiore resilienza e riduce i tempi di inattività quando un nodo, un servizio o un collegamento di rete non funziona. In caso di guasto, il framework consente di ripristinare lo stato operativo precedente della rete. Se ciò non è possibile, Cisco DNA Center indica che è presente un problema che richiede la tua attenzione.
Ogni volta che il framework HA di Cisco DNA Center determina che è stata eseguita una modifica su un nodo cluster, sincronizza tale modifica con gli altri nodi. I tipi di sincronizzazione supportati includono:
-
Modifiche al database, ad esempio aggiornamenti relativi alla configurazione, alle prestazioni e alla supervisione dei dati
-
Modifiche ai file, ad esempio configurazioni dei report, modelli di configurazione, directory radice TFTP, impostazioni di amministrazione, file di licenza e archivio chiavi
L'attuale software Cisco DNA Center supporta un cluster minimo a 3 nodi per consentire il funzionamento di HA. Una volta configurato, il cluster è in grado di gestire gli errori a nodo singolo. Per impostare il quorum è necessario almeno due nodi. Senza un quorum a 2 nodi, il cluster viene dichiarato inattivo. Se si utilizza SD-Access Fabric, l'errore del cluster comporta solo l'impossibilità di effettuare il provisioning dell'automazione, ma il traffico di rete degli utenti del fabric SD-Access continua ad avanzare in quanto Cisco DNA Center non è responsabile di alcun traffico di dati o di controllo.
In questo documento vengono esaminati vari punti di errore e viene illustrato come il cluster riduca i tempi di inattività per mantenere Cisco DNA Center sempre operativo. L'attenzione si concentra principalmente sugli aspetti di connettività di rete di un cluster a 3 nodi. Per i servizi e tutte le altre informazioni, consultare la guida all'installazione e all'amministrazione.
Connettività di rete
Cisco DNA Center utilizza questi tipi di connettività di rete:
1. Collegamento cluster a 10 Gb/s
2. Interfaccia grafica utente/collegamento di gestione a 1 Gbps
3. Cloud Link a 1 Gbps (opzionale)
4. Collegamento Enterprise a 10 Gb/s
5. Collegamento CIMC a 1 Gbps
Si presuppone che si verifichi la corretta risoluzione IP-ARP all'interno del cluster e che sia garantita la connettività tra tutti e tre i nodi. È inoltre consigliabile impostare una velocità RTT di <10 ms tra i collegamenti del cluster per tutti gli scenari.
Scenari di errore e comportamento del cluster
In generale, la ridistribuzione dei servizi cluster avviene nelle seguenti condizioni:
1. Il nodo singolo non è attivo: i servizi vengono distribuiti agli altri due nodi e il cluster è ancora operativo.
2. Collegamento di rete aziendale non attivo per nodo singolo: nessuna ridistribuzione del servizio. Solo la raggiungibilità alla rete aziendale dal nodo danneggiato non funziona.
3. Il collegamento alla rete del cluster non è attivo: i servizi vengono ridistribuiti agli altri due nodi e il cluster è ancora operativo.
4. Tutti gli altri collegamenti di rete si interrompono, ad eccezione del collegamento cluster per un singolo nodo: un nodo non è in grado di servire le funzioni previste, ma tutti i servizi e i cluster funzionano normalmente.
5. Errore del servizio su un singolo nodo: il servizio tenta di riavviarsi. Nella maggior parte degli scenari, viene eseguito un tentativo di riavvio sullo stesso nodo, ma attualmente non esiste alcuna affinità con il nodo in modo che possa essere avviato su qualsiasi nodo.
6. Switch di rete inattivo: in base ai diversi tipi di topologia, il cluster funziona normalmente, il servizio viene ridistribuito o tutto è inattivo.
Opzione 1 topologia fisica
Inizialmente, la connettività alla rete era consigliata dal tecnico. Sia l'immagine 1 che l'immagine 2 forniscono connettività in cui ogni tipo di collegamento di rete da tutti i nodi è connesso allo stesso switch fisico. Ad esempio, il collegamento alla rete aziendale di tutti e tre i nodi è collegato allo stesso switch fisico.
Immagine 1
Immagine 2
In questa topologia sono disponibili i seguenti tipi di scenari di errore in cui il cluster è ancora operativo:
1. Guasto a un singolo nodo
2. Errore di collegamento alla rete aziendale
3. Errore collegamento cluster
4. Errore del servizio
Questa topologia non è in grado di gestire uno switch completamente inattivo per alcun collegamento di rete.
Condizione di errore |
Impatto/Stato cluster |
Nodo singolo inattivo |
Il cluster è ancora operativo con gli altri due nodi. |
Collegamento singolo non attivo per qualsiasi collegamento di rete |
Il cluster continua a funzionare normalmente. I servizi vengono distribuiti solo se il collegamento al cluster non è attivo. |
Interruttore non attivo |
Il cluster non è utilizzabile per l'automazione. |
Opzione 2 per la topologia fisica (scelta più consigliata)
L'immagine 3 fornisce la connettività in cui tutti i collegamenti di rete dallo stesso nodo sono collegati allo stesso switch fisico. Tutti i collegamenti da un nodo sono collegati allo stesso switch fisico con separazione tramite VLAN, oppure possono essere connessi a switch diversi. Ad esempio, il collegamento dal nodo 1 è collegato allo switch 1, il collegamento dal nodo 2 allo switch 2 e così via.
Immagine 3
In questa topologia sono disponibili i seguenti tipi di scenari di errore in cui il cluster è ancora operativo:
1. Guasto a un singolo nodo
2. Errore di collegamento alla rete aziendale per un singolo nodo
3. Errore collegamento cluster per nodo singolo
4. Errore del servizio per nodo singolo
5. Errore di uno switch di rete singolo per un nodo singolo
Condizione di errore |
Impatto/Stato cluster |
Nodo singolo inattivo |
Il cluster è ancora operativo con gli altri due nodi. |
Collegamento singolo non attivo per qualsiasi collegamento di rete |
Il cluster continua a funzionare normalmente. I servizi vengono distribuiti solo se il collegamento al cluster non è attivo. |
Interruttore singolo non attivo |
Il cluster è ancora operativo con gli altri due nodi. |
Opzione 3 Per La Topologia Fisica (Per Ambienti Di Tipo Centro Dati)
Questa topologia è simile all'opzione 2, con la differenza che è possibile disporre di tre switch di layer 2 che si connettono al gateway. Tutte le informazioni sono simili all'opzione 2.
Immagine 4
Opzione 4 per la topologia fisica (scelta non consigliata)
L'immagine 4 fornisce la connettività in cui due nodi sono connessi allo stesso switch mentre l'altro nodo è connesso a uno switch diverso. Questa topologia è la meno consigliata in quanto uno switch con più collegamenti connessi può causare l'arresto del cluster.
Questa topologia fornisce questi tipi di scenari di errore in cui il cluster è ancora operativo.
1. Guasto a un singolo nodo
2. Errore di collegamento alla rete aziendale per un singolo nodo
3. Errore collegamento cluster per nodo singolo
4. Errore del servizio per nodo singolo
Questa topologia non è in grado di gestire uno switch completamente inattivo per alcun collegamento di rete.
Condizione di errore |
Impatto/Stato cluster |
Nodo singolo inattivo |
Il cluster è ancora operativo con gli altri due nodi. |
Collegamento singolo non attivo per tutti i collegamenti di rete ad eccezione del collegamento al cluster |
Il cluster continua a funzionare normalmente. |
Collegamento a cluster singolo non attivo |
I servizi vengono distribuiti agli altri due nodi e il funzionamento continua. |
Interruttore singolo non attivo |
Il cluster può diventare inattivo se uno switch con più collegamenti diventa inattivo. |
Per ulteriori scenari e stati di errore, consultare la Guida dell'amministratore di Cisco DNA Center 1.2.10.