Introducción
Este documento describe los pasos necesarios para sustituir las dos unidades HDD defectuosas en un servidor en una configuración Ultra-M que aloja las funciones de red virtual (VNF) de StarOS.
Antecedentes
Ultra-M es una solución de núcleo de paquetes móviles virtualizada validada y empaquetada previamente diseñada para simplificar la implementación de VNF. OpenStack es el Virtualized Infrastructure Manager (VIM) para Ultra-M y consta de estos tipos de nodos:
- Informática
- Disco de almacenamiento de objetos - Compute (OSD - Compute)
- Controlador
- Plataforma OpenStack: Director (OSPD)
La arquitectura de alto nivel de Ultra-M y los componentes involucrados se ilustran en esta imagen:
Arquitectura UltraM
Este documento está dirigido al personal de Cisco familiarizado con la plataforma Cisco Ultra-M y detalla los pasos necesarios para llevarse a cabo en el nivel de VNF de OpenStack y CPS en el momento del reemplazo del servidor controlador.
Nota: Se considera la versión Ultra M 5.1.x para definir los procedimientos en este documento.
Abreviaturas
VNF |
Función de red virtual |
CF |
Función de control |
SF |
Función de servicio |
ESC |
Controlador de servicio elástico |
MOP |
Método de procedimiento |
OSD |
Discos de almacenamiento de objetos |
HDD |
Unidad de disco duro |
SSD |
Unidad de estado sólido |
VIM |
Administrador de infraestructura virtual |
VM |
Máquina virtual |
EM |
Administrador de elementos |
UAS |
Servicios de ultra automatización |
UUID |
Identificador único universal |
Ambos fallos de HDD
1. Cada servidor de Baremetal se aprovisionará con dos unidades HDD para actuar como DISCO BOOT en la configuración Raid 1. En caso de fallo único del disco duro, ya que hay redundancia de nivel RAID 1, la unidad de disco duro defectuosa puede intercambiarse en caliente. Sin embargo, cuando ambas unidades HDD fallan, el servidor se desactivará y se perderá el acceso al servidor. Por lo tanto, para restaurar el acceso al servidor y a los servicios, es necesario sustituir ambas unidades HDD y agregar el servidor a la pila de nube superpuesta existente.
2. El procedimiento para sustituir un componente defectuoso en el servidor UCS C240 M4 puede derivarse de: Sustitución de los componentes del servidor
3. En caso de que ambas HDD fallen, reemplace sólo estas dos HDD defectuosas en el mismo servidor UCS 240M4. El procedimiento de actualización del BIOS no es necesario después de reemplazar nuevos discos.
4. En la solución basada en OpenStack (Ultra-M), el servidor Bartemetal UCS 240M4 puede asumir una de estas funciones: Compute, OSD-Compute, Controller y OSPD. En estas secciones se mencionan los pasos necesarios para manejar ambos fallos de HDD en cada una de estas funciones de servidor.
Nota: En los casos en los que ambos discos duros estén en buen estado pero algún otro hardware sea defectuoso en el servidor UCS 240M4, sustituya el UCS 240M4 por otro nuevo hardware, pero vuelva a utilizar las mismas unidades HDD. Sin embargo, en este caso, si sólo las unidades HDD son defectuosas, vuelva a utilizar el mismo UCS 240M4 y sustituya las unidades HDD defectuosas por nuevas unidades HDD.
Fallo de ambos HDD en el servidor informático
Si se observa la falla de ambas unidades de disco duro en UCS 240M4, que actúa como nodo de cómputo, siga el procedimiento de reemplazo en el siguiente enlace: PCRF-Replacement-of-Compute-Server-UCS-C240-M4
Ambos fallos de HDD en el servidor controlador
Si se observa la falla de ambas unidades HDD en UCS 240M4, que actúa como nodo de controlador, siga el procedimiento de reemplazo de: PCRF-Replacement-of-Controller-Server-UCS-C240-M4
Dado que el servidor controlador que observa ambas fallas del disco duro no será accesible a través de SSH, inicie sesión en otro nodo del controlador para realizar el procedimiento de apagado correcto enumerado en el link anterior.
Ambos fallos de disco duro en el servidor OSD-Compute
Si se observa la falla de ambas unidades de disco duro en UCS 240M4, que actúa como nodo OSD-Compute, siga el procedimiento de reemplazo de: PCRF-Replacement-of-OSD-Compute-UCS-240M4
En el procedimiento mencionado en este enlace, el cierre de graceful del almacenamiento Ceph no se puede realizar ya que ambos fallos dan como resultado la inaccesibilidad del servidor. Por lo tanto, ignore esos pasos.
Ambos fallos de HDD en el servidor OSPD
Si se observa la falla de ambas unidades HDD en UCS 240M4, que actúa como nodo OSPD, siga el procedimiento de reemplazo de: Sustitución de OSPD-Servidor-UCS-240M4-CPS
En este caso, no necesita una copia de seguridad OSPD previamente almacenada para la restauración después de la sustitución del disco duro; de lo contrario, será como una reimplementación completa de la pila.