Introducción
Este documento describe la conectividad de red soportada para varias redes involucradas en la implementación de clústeres de 3 nodos de Cisco DNA Center.
Prerequisites
Familiarícese con la información básica sobre el clúster de Cisco DNA Center de 3 nodos y High Availability (HA) con estos artículos:
Descripción
Para la versión Cisco DNA Center 1.2.8, el clúster de HA de 3 nodos es compatible con la automatización básica y la automatización de acceso SD. En 1.2.8/1.2.10, HA aún se encuentra en la versión beta para Assurance.
El HA de Cisco DNA Center ofrece más resistencia y reduce el tiempo de inactividad cuando un nodo, servicio o enlace de red deja de funcionar. Cuando se produce un error, esta estructura ayuda a restaurar la red a su estado operativo anterior. Si esto no es posible, Cisco DNA Center indica que hay un problema que requiere su atención.
Cada vez que el marco de HA de Cisco DNA Center determina que se ha producido un cambio en un nodo de clúster, sincroniza este cambio con los otros nodos. Los tipos de sincronización admitidos incluyen:
-
Cambios en la base de datos, como actualizaciones relacionadas con la configuración, el rendimiento y la supervisión de datos
-
Cambios de archivo, como configuraciones de informe, plantillas de configuración, directorio raíz de TFTP, configuración de administración, archivos de licencia y almacén de claves
El software Cisco DNA Center actual admite un clúster de 3 nodos como mínimo para que funcione HA. Una vez configurado el clúster, puede administrar el error de nodo único. Se requiere un mínimo de dos nodos para establecer el quórum. Sin un quórum de 2 nodos, el clúster se declara inactivo. Si utiliza SD-Access Fabric, el fallo del clúster solo se traduce en un fallo al aprovisionar la automatización, pero, aun así, el tráfico de red de usuario del fabric de SD-Access continúa reenviándose, ya que Cisco DNA Center no es responsable de ningún tráfico de datos o control.
En este documento se analizan varios puntos de fallo y cómo el clúster mitiga el tiempo de inactividad para mantener Cisco DNA Center operativo en todo momento. Se centra principalmente en los aspectos de conectividad de red de un clúster de 3 nodos. Para obtener información sobre los servicios y cualquier otra información, consulte la guía de instalación y administración.
Conectividad de red
Cisco DNA Center utiliza estos tipos de conectividad de red:
1. Enlace de clúster de 10 Gbps
2. Interfaz gráfica de usuario/enlace de gestión de 1 Gbps
3. Enlace a la nube de 1 Gbps (opcional)
4. Enlace empresarial de 10 Gbps
5. Enlace CIMC de 1 Gbps
Se supone que se produce una resolución adecuada dentro del clúster-IP-ARP y que se garantiza la conectividad entre los tres nodos. Además, se recomienda tener <10 ms de RTT entre los links del clúster para todos los escenarios.
Escenarios de fallos y comportamiento del clúster
En general, la redistribución de los servicios de clúster se realiza en las siguientes condiciones:
1. Un solo nodo deja de funcionar: los servicios se distribuyen a los otros dos nodos y el clúster sigue funcionando.
2. El enlace de red empresarial deja de funcionar para un solo nodo: no hay redistribución de servicios. Sólo no funciona la accesibilidad a la red de la empresa desde el nodo con error.
3. El link de la Red del Cluster deja de funcionar: los servicios se redistribuyen a los otros dos nodos y el cluster aún está operativo.
4. Todos los demás enlaces de red se desactivan, excepto el enlace de clúster para un único nodo: un nodo no puede realizar las funciones esperadas, pero todos los servicios y clústeres funcionan normalmente.
5. Error del servicio en un solo nodo: el servicio intenta reiniciarse. En la mayoría de los escenarios, intenta reiniciarse en el mismo nodo pero, actualmente, no hay afinidad con el nodo para que pueda iniciarse en cualquier nodo.
6. El switch de red se desactiva: según los diferentes tipos de topología, el clúster funciona normalmente o el servicio se redistribuye o todo está inactivo.
Opción 1 de topología física
Inicialmente, la ingeniería recomendó la conectividad a la red. Tanto la imagen 1 como la imagen 2 proporcionan conectividad en la que cada tipo de enlace de red de todos los nodos está conectado al mismo switch físico. Por ejemplo, el enlace de red empresarial de los tres nodos está conectado al mismo switch físico.
Imagen 1
Imagen 2
Esta topología proporciona estos tipos de escenarios de error en los que el clúster sigue funcionando:
1. Fallo de nodo único
2. Fallo de enlace de red empresarial
3. Falla del link del clúster
4. Fallo del servicio
Esta topología no puede administrar un switch inactivo completo para ninguno de los enlaces de red.
Condición de falla |
Impacto/Estado del clúster |
Un nodo caído |
El clúster sigue funcionando con los otros dos nodos. |
Enlace único desactivado para cualquiera de los enlaces de red |
El clúster sigue funcionando normalmente. Los servicios se distribuyen solamente si el link del clúster deja de funcionar. |
El switch se desactiva |
El clúster no se puede utilizar para la automatización. |
Opción 2 de topología física (la más recomendada)
La imagen 3 proporciona la conectividad en la que todos los enlaces de red del mismo nodo están conectados al mismo switch físico. Todos los links de un nodo están conectados al mismo switch físico con separación mediante el uso de VLAN, o se pueden conectar a switches diferentes. Por ejemplo, Link from Node-1 está conectado al Switch-1, Link from Node-2 está conectado al Switch-2, y así sucesivamente.
Imagen 3
Esta topología proporciona estos tipos de escenarios de error en los que el clúster sigue funcionando:
1. Fallo de nodo único
2. Fallo de enlace de red empresarial para nodo único
3. Falla de link de clúster para nodo único
4. Error de servicio para nodo único
5. Falla de switch de red único para nodo único
Condición de falla |
Impacto/Estado del clúster |
Un nodo caído |
El clúster sigue funcionando con los otros dos nodos. |
Enlace único desactivado para cualquiera de los enlaces de red |
El clúster sigue funcionando normalmente. Los servicios se distribuyen solamente si el link del clúster deja de funcionar. |
Un solo switch se desactiva |
El clúster sigue funcionando con los otros dos nodos. |
Opción 3 De Topología Física (Para Entorno De Tipo Data Center)
Esta topología es similar a la opción 2, pero puede tener tres switches de capa 2 que se conecten al gateway. Toda la información es similar a la opción 2.
Imagen 4
Opción 4 De Topología Física (No Recomendada)
La imagen 4 proporciona la conectividad en la que dos nodos están conectados al mismo switch mientras que el otro nodo está conectado a un switch diferente. Esta topología es la menos recomendada, ya que un fallo en el switch que tiene varios links conectados puede provocar la caída del clúster.
Esta topología proporciona estos tipos de escenarios de error en los que el clúster sigue funcionando.
1. Fallo de nodo único
2. Fallo de enlace de red empresarial para nodo único
3. Falla de link de clúster para nodo único
4. Error de servicio para nodo único
Esta topología no puede administrar un switch inactivo completo para ninguno de los enlaces de red.
Condición de falla |
Impacto/Estado del clúster |
Un nodo caído |
El clúster sigue funcionando con los otros dos nodos. |
Enlace único inactivo para cualquiera de los enlaces de red excepto el enlace de clúster |
El clúster sigue funcionando normalmente. |
Enlace de clúster único inactivo |
Los servicios se distribuyen a los otros dos nodos y continúan funcionando. |
Un solo switch se desactiva |
El clúster puede desactivarse si un switch que tiene varios links se desactiva. |
Algunos escenarios y estados de falla adicionales se tratan en la Guía del administrador para Cisco DNA Center 1.2.10.