In questo documento vengono descritti i passaggi necessari per sostituire entrambe le unità HDD difettose nel server in una configurazione Ultra-M. Questa procedura è valida per un ambiente OpenStack con la versione NEWTON in cui ESC non gestisce Cisco Prime Access Registrar (CPAR) e CPAR viene installato direttamente sulla macchina virtuale distribuita in OpenStack.
Contributo di Karthikeyan Dachanamoorthy e Harshita Bhardwaj, Cisco Advanced Services.
Premesse
Ultra-M è una soluzione di base di pacchetti mobili preconfezionata e convalidata, progettata per semplificare l'installazione di VNF. OpenStack è Virtualized Infrastructure Manager (VIM) per Ultra-M ed è costituito dai seguenti tipi di nodi:
- Calcola
- Disco Object Storage - Compute (OSD - Compute)
- Controller
- Piattaforma OpenStack - Director (OSPD)
L'architettura di alto livello di Ultra-M e i componenti coinvolti sono illustrati in questa immagine:
Questo documento è destinato al personale Cisco che ha familiarità con la piattaforma Cisco Ultra-M e descrive i passaggi richiesti da eseguire in OpenStack e Redhat OS.
Nota: Per definire le procedure descritte in questo documento, viene presa in considerazione la release di Ultra M 5.1.x.
Abbreviazioni
MOP |
Metodo |
OSD |
Dischi Object Storage |
OSPD |
OpenStack Platform Director |
HDD |
Unità hard disk |
SSD |
Unità a stato solido |
VIM |
Virtual Infrastructure Manager |
VM |
Macchina virtuale |
EM |
Gestione elementi |
UAS |
Ultra Automation Services |
UUID |
Identificatore univoco universale |
Errore di entrambi i dischi rigidi
Ogni server bare-metal è dotato di due unità HDD che fungono da DISCO DI AVVIO nella configurazione Raid 1. In caso di guasto di un singolo disco rigido, poiché è presente la ridondanza di livello RAID 1, l'unità disco rigido guasta può essere sostituita a caldo. Tuttavia, se entrambe le unità disco rigido si guastano, il server non sarà attivo e si perderà l'accesso al server. Per ripristinare l'accesso al server e ai servizi, è necessario per sostituire entrambe le unità HDD e aggiungere il server allo stack di overcloud già esistente.
La procedura per la sostituzione di un componente guasto su un server UCS C240 M4 è disponibile all'indirizzo: Sostituzione dei componenti server.
In caso di guasto di entrambi i dischi rigidi, sostituire solo questi due dischi rigidi difettosi nello stesso server UCS 240M4, pertanto non è necessaria una procedura di aggiornamento del BIOS dopo la sostituzione dei nuovi dischi.
Nella soluzione Ultra-M basata su OpenStack, il server bare metal UCS 240M4 può assumere uno dei seguenti ruoli: Compute, OSD-Compute, Controller e OSPD. In queste sezioni vengono illustrati i passaggi necessari per gestire entrambi i guasti del disco rigido in ciascuno di questi ruoli server.
Nota: Negli scenari in cui entrambi i dischi rigidi sono sani ma un altro hardware è difettoso nel server UCS 240M4, sostituire UCS 240M4 con nuovo hardware ma riutilizzare le stesse unità disco rigido. Tuttavia, in questo caso, solo le unità HDD sono difettose, quindi è possibile riutilizzare la stessa UCS 240M4 e sostituire le unità HDD difettose con nuove unità HDD.
Errore di entrambi i dischi rigidi sul server di elaborazione
Se il guasto di entrambe le unità HDD viene rilevato in UCS 240M4 che funge da nodo di calcolo, seguire la procedura di sostituzione descritta in .
Errore di entrambi i dischi rigidi sul server controller
Se il guasto di entrambe le unità HDD viene rilevato in UCS 240M4 che funge da nodo di controller, seguire la procedura di sostituzione descritta in . Poiché il server del controller che rileva entrambi gli errori dei dischi rigidi non sarà raggiungibile tramite Secure Shell (SSH), è possibile accedere a un altro nodo del controller per eseguire la procedura di arresto normale descritta nel collegamento sopra.
Errore di entrambi i dischi rigidi sul server di elaborazione OSD
Se il guasto di entrambe le unità HDD viene rilevato in UCS 240M4 che funge da nodo di calcolo OSD, seguire la procedura di sostituzione descritta in . Nella procedura qui descritta, non è possibile eseguire lo spegnimento regolare dello storage di Ceph, in quanto entrambi gli errori determinano l'irraggiungibilità del server. Ignorare questi passaggi.
Errore di entrambi i dischi rigidi sul server OSPD
Se il guasto di entrambe le unità HDD viene rilevato in UCS 240M4 che funge da nodo OSPD, seguire la procedura di sostituzione descritta in . In questo caso, il backup OSPD precedentemente archiviato è necessario per il ripristino dopo la sostituzione del disco rigido, altrimenti sarà come una completa ridistribuzione dello stack.
Fare riferimento a questo .