Introduction
Este documento descreve as etapas necessárias para substituir as duas unidades de disco rígido com defeito em um servidor em uma configuração Ultra-M que hospeda as VNFs (Virtual Network Functions, funções de rede virtual) do StarOS.
Informações de Apoio
O Ultra-M é uma solução de núcleo de pacotes móveis virtualizados, pré-embalada e validada, projetada para simplificar a implantação de VNFs. O OpenStack é o Virtualized Infrastructure Manager (VIM) para Ultra-M e consiste nos seguintes tipos de nó:
- Computação
- Disco de Armazenamento de Objeto - Computação (OSD - Compute)
- Controlador
- Plataforma OpenStack - Diretor (OSPD)
A arquitetura de alto nível da Ultra-M e os componentes envolvidos estão descritos nesta imagem:
Arquitetura UltraM
Este documento destina-se ao pessoal da Cisco familiarizado com a plataforma Ultra-M da Cisco e detalha as etapas necessárias para serem executadas no nível de VNF do OpenStack e CPS no momento da substituição do servidor do controlador.
Note: A versão Ultra M 5.1.x é considerada para definir os procedimentos neste documento.
Abreviaturas
VNF |
Função de rede virtual |
CF |
Função de controle |
SF |
Função de serviço |
ESC |
Controlador de serviço elástico |
MOP |
Método de Procedimento |
OSD |
Discos de Armazenamento de Objeto |
HDD |
Unidade de disco rígido |
SSD |
Unidade de estado sólido |
VIM |
Virtual Infrastructure Manager |
VM |
Máquina virtual |
EM |
Gestor de Elementos |
UAS |
Ultra Automation Services |
UUID |
Identificador de ID universal exclusivo |
Falha em ambos os HDD
1. Cada servidor Baremetal será equipado com duas unidades de disco rígido para atuar como DISCO BOOT na configuração do Raid 1. Em caso de falha de um disco rígido, como há redundância de nível RAID 1, a unidade de disco rígido defeituosa pode ser trocada e removida em operação. Mas quando ambas as unidades de disco rígido falharem, o servidor ficará inoperante e o acesso ao servidor será perdido. Assim, para restaurar o acesso ao servidor e aos serviços, é necessário substituir as unidades de disco rígido e adicionar o servidor à pilha de nuvem existente.
2. O procedimento para substituir um componente defeituoso no servidor UCS C240 M4 pode ser chamado de: Substituindo os componentes do servidor
3. No caso de ambas as falhas de HDD, substitua apenas essas duas HDDs defeituosas no mesmo servidor UCS 240M4. O procedimento de atualização do BIOS não é necessário após a substituição de novos discos.
4. Na solução baseada em OpenStack (Ultra-M), o servidor Baremetal UCS 240M4 pode assumir uma das seguintes funções: Computação, OSD-Compute, Controlador e OSPD. As etapas necessárias para lidar com ambas as falhas de HDD em cada uma dessas funções de servidor são mencionadas nessas seções.
Note: Nos cenários em que os dois discos HDD estão saudáveis, mas algum outro hardware está com defeito no servidor UCS 240M4, substitua o UCS 240M4 por um novo hardware, mas reutilize os mesmos discos rígidos. Entretanto, nesse caso, se apenas as unidades de disco rígido estiverem com defeito, reutilize o mesmo UCS 240M4 e substitua as unidades de disco rígido com defeito por novas unidades de disco rígido.
Falha de HDD em servidor de computação
Se a falha de ambas as unidades de disco rígido for observada no UCS 240M4, que está atuando como nó de computação, siga o procedimento de substituição no link abaixo: PCRF-Replacement-of-Compute-Server-UCS-C240-M4
Falha de HDD no servidor controlador
Se a falha de ambas as unidades de disco rígido for observada no UCS 240M4, que atua como um nó de controlador, siga o procedimento de substituição de: PCRF-Replacement-of-Controller-Server-UCS-C240-M4
Como o servidor controlador que observa ambas as falhas de HDD não poderá ser acessado via SSH, faça login em outro nó de controlador para executar o procedimento de desligamento correto listado no link acima.
Falha em ambos os HDD no OSD-Computing Server
Se a falha de ambas as unidades de disco rígido for observada no UCS 240M4, que atua como nó OSD-Compute, siga o procedimento de substituição de: PCRF-Replacement-of-OSD-Compute-UCS-240M4
No procedimento mencionado neste link, o desligamento correto do armazenamento Ceph não pode ser executado porque a falha resulta em inalcançabilidade do servidor. Portanto, ignore essas etapas.
Falha de HDD em ambos os servidores OSPD
Se a falha de ambas as unidades de disco rígido for observada no UCS 240M4, que atua como um nó OSPD, siga o procedimento de substituição de: Replacement-of-OSPD-Server-UCS-240M4-CPS
Nesse caso, você não precisa de backup OSPD armazenado anteriormente para restauração após a substituição do disco rígido, caso contrário, será como uma reimplantação completa da pilha.