Introduction
Ce document décrit la connectivité réseau prise en charge pour divers réseaux impliqués dans le déploiement de clusters Cisco DNA Center à 3 noeuds.
Conditions préalables
Familiarisez-vous avec les informations de base sur le cluster Cisco DNA Center à 3 noeuds et la haute disponibilité (HA) avec les articles suivants :
Description
Pour la version 1.2.8 de Cisco DNA Center, le cluster HA 3 noeuds est pris en charge pour l'automatisation de base et l'automatisation d'accès SD. Dans 1.2.8/1.2.10, HA est toujours en version bêta pour Assurance.
La haute disponibilité de Cisco DNA Center offre plus de résilience et réduit les temps d'arrêt en cas de panne d'un noeud, d'un service ou d'une liaison réseau. En cas de panne, ce cadre permet de restaurer votre réseau à son état opérationnel précédent. Si cela n'est pas possible, Cisco DNA Center indique qu'il y a un problème qui nécessite votre attention.
Chaque fois que le cadre de haute disponibilité de Cisco DNA Center détermine qu'une modification a eu lieu sur un noeud de cluster, il synchronise cette modification avec les autres noeuds. Les types de synchronisation pris en charge sont les suivants :
-
Modifications de la base de données, telles que les mises à jour liées à la configuration, aux performances et à la surveillance des données
-
Les modifications de fichiers, telles que les configurations de rapports, les modèles de configuration, le répertoire racine TFTP, les paramètres d'administration, les fichiers de licence et le magasin de clés
Le logiciel Cisco DNA Center actuel prend en charge un cluster de 3 noeuds minimum pour que la haute disponibilité fonctionne. Une fois le cluster configuré, il peut gérer les défaillances d'un seul noeud. Un minimum de deux noeuds est requis pour définir le quorum. Sans quorum de 2 noeuds, le cluster est déclaré inactif. Si vous utilisez le fabric SD-Access, la défaillance du cluster entraîne uniquement l'échec du provisionnement de l'automatisation. Cependant, le trafic réseau des utilisateurs du fabric SD-Access continue à transiter car Cisco DNA Center n'est pas responsable du trafic de contrôle ou de données.
Dans ce document, vous examinerez différents points de défaillance et comment le cluster atténue les temps d'arrêt afin de maintenir Cisco DNA Center opérationnel à tout moment. Vous vous concentrez principalement sur les aspects de connectivité réseau d'un cluster à 3 noeuds. Pour les services et toutes les autres informations, reportez-vous au guide d'installation et d'administration.
Connectivité réseau
Cisco DNA Center utilise les types de connectivité réseau suivants :
1. Liaison de cluster 10 Gbit/s
2. Interface graphique utilisateur/liaison de gestion 1 Gbit/s
3. Liaison cloud 1 Gbit/s (facultatif)
4. Liaison d’entreprise 10 Gbit/s
5. Liaison CIMC 1 Gbit/s
Il est supposé que la résolution IP-ARP intra-cluster est correcte et que la connectivité est assurée entre les trois noeuds. En outre, il est recommandé d'avoir un RTT <10ms entre les liaisons de cluster pour tous les scénarios.
Scénarios de défaillance et comportement des clusters
En général, la redistribution des services de cluster se produit dans les conditions suivantes :
1. Un seul noeud tombe en panne : les services sont distribués aux deux autres noeuds et le cluster est toujours opérationnel.
2. La liaison du réseau d’entreprise tombe en panne pour un noeud unique : aucune redistribution de service. Seule l'accessibilité au réseau d'entreprise à partir du noeud défaillant ne fonctionne pas.
3. La liaison réseau du cluster est interrompue : les services sont redistribués aux deux autres noeuds et le cluster est toujours opérationnel.
4. Toutes les autres liaisons réseau sont désactivées, à l’exception de la liaison de cluster pour un noeud unique : un noeud ne peut pas assurer les fonctions attendues, mais tous les services et clusters fonctionnent normalement.
5. Échec du service sur un noeud unique : le service tente de redémarrer. Dans la plupart des scénarios, il tente de redémarrer sur le même noeud, mais actuellement, il n'y a aucune affinité avec le noeud pour qu'il puisse démarrer sur n'importe quel noeud.
6. Panne du commutateur réseau : en fonction des différents types de topologie, le cluster fonctionne normalement ou le service est redistribué ou tout est hors service.
Topologie physique Option 1
Au départ, la connectivité au réseau était recommandée par l'ingénieur. L’image 1 et l’image 2 fournissent une connectivité où chaque type de liaison réseau de tous les noeuds est connecté au même commutateur physique. Par exemple, la liaison réseau d’entreprise des trois noeuds est connectée au même commutateur physique.
Image 1
Image 2
Cette topologie fournit les types de scénarios de défaillance suivants lorsque le cluster est toujours opérationnel :
1. Défaillance d'un noeud unique
2. Défaillance de la liaison réseau d’entreprise
3. Défaillance de la liaison de cluster
4. Défaillance du service
Cette topologie n'est pas en mesure de gérer un commutateur complet hors service pour aucune des liaisons réseau.
Condition de panne |
Impact/état du cluster |
Noeud unique désactivé |
Le cluster est toujours opérationnel avec les deux autres noeuds. |
Liaison unique désactivée pour l'une des liaisons du réseau |
Le cluster continue à fonctionner normalement. Les services sont distribués uniquement si la liaison de cluster est interrompue. |
Le commutateur tombe en panne |
Le cluster est inutilisable pour l'automatisation. |
Option 2 de la topologie physique (la plus recommandée)
L'image 3 fournit la connectivité où toutes les liaisons réseau du même noeud sont connectées au même commutateur physique. Toutes les liaisons d’un noeud sont connectées au même commutateur physique avec séparation à l’aide de VLAN, ou elles peuvent être connectées à des commutateurs différents. Par exemple, la liaison du noeud 1 est connectée au commutateur 1, la liaison du noeud 2 est connectée au commutateur 2, etc.
Image 3
Cette topologie fournit les types de scénarios de défaillance suivants lorsque le cluster est toujours opérationnel :
1. Défaillance d'un noeud unique
2. Défaillance de la liaison réseau d’entreprise pour un noeud unique
3. Défaillance de la liaison de cluster pour un noeud unique
4. Échec du service pour un noeud unique
5. Défaillance d'un commutateur réseau unique pour un noeud unique
Condition de panne |
Impact/état du cluster |
Noeud unique désactivé |
Le cluster est toujours opérationnel avec les deux autres noeuds. |
Liaison unique désactivée pour l'une des liaisons du réseau |
Le cluster continue à fonctionner normalement. Les services sont distribués uniquement si la liaison de cluster est interrompue. |
Un seul commutateur tombe en panne |
Le cluster est toujours opérationnel avec les deux autres noeuds. |
Topologie Physique Option 3 (Pour Un Environnement De Type Data Center)
Cette topologie est similaire à l'option 2, à ceci près que vous pouvez avoir trois commutateurs de couche 2 qui se connectent à la passerelle. Toutes les informations sont similaires à l'option 2.
Image 4
Option 4 de la topologie physique (non recommandée)
L'image 4 présente la connectivité lorsque deux noeuds sont connectés au même commutateur tandis que l'autre noeud est connecté à un autre commutateur. Cette topologie est la moins recommandée, car une panne de commutation avec plusieurs liaisons connectées peut entraîner l'arrêt du cluster.
Cette topologie fournit ces types de scénarios de défaillance dans lesquels le cluster est toujours opérationnel.
1. Défaillance d'un noeud unique
2. Défaillance de la liaison réseau d’entreprise pour un noeud unique
3. Défaillance de la liaison de cluster pour un noeud unique
4. Échec du service pour un noeud unique
Cette topologie n'est pas en mesure de gérer un commutateur complet hors service pour aucune des liaisons réseau.
Condition de panne |
Impact / État du cluster |
Noeud unique désactivé |
Le cluster est toujours opérationnel avec les deux autres noeuds. |
Liaison unique désactivée pour toutes les liaisons réseau, à l'exception de la liaison de cluster |
Le cluster continue à fonctionner normalement. |
Liaison de cluster unique désactivée |
Les services sont distribués aux deux autres noeuds et continuent à fonctionner. |
Un seul commutateur tombe en panne |
Le cluster peut s'arrêter si un commutateur qui a plusieurs liaisons tombe en panne. |
D'autres scénarios et états de défaillance sont décrits dans le Guide de l'administrateur de Cisco DNA Center 1.2.10.