Introduzione
In questo documento vengono descritti gli scenari di risoluzione dei problemi più comuni per la distribuzione di cluster Hyperflex tramite Intersight.
Prerequisiti
Requisiti
Cisco raccomanda la conoscenza dei seguenti argomenti:
- Intersight
- Distribuzione cluster Hyperflex
Componenti usati
Il documento può essere consultato per tutte le versioni software o hardware.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Premesse
Il flusso di lavoro del programma di installazione di Intersight segue l'attività illustrata nel grafico per la distribuzione di un cluster hyperflex:
Nome attività |
Definizione |
PreparaPreClusterInfoAttività |
Genera file di configurazione contenenti le informazioni necessarie per distribuire il cluster, ad esempio il percorso del file di configurazione, il file YAML del software. |
AttivitàConvalidaConfigurazioneServer |
Convalida la configurazione del server UCS per assicurarsi che disponga della configurazione hardware e firmware richiesta (ad esempio, convalida delle dimensioni del disco/del PID, correzione delle schede NIC e così via). |
AttivitàConvalidaPreconfigurazione |
Convalida la configurazione di rete prima dell'avvio della configurazione del server (ad esempio, DNS, NTP, raggiungibilità vCenter, controllo IP duplicato) |
AttivitàPreparaImmagineLocale |
Scarica le immagini software (OAV VM controller, pacchetti hxdp) nell'archivio immagini locale. Questa attività è inclusa nel flusso di lavoro solo se viene eseguita nell'ambiente dell'accessorio connesso. |
AttivitàConfigurazioneServer |
Esegue la configurazione richiesta sui server UCS. Per le distribuzioni FI-attached, questo comporta la creazione e l'associazione dei profili del servizio. |
AttivitàConfigurazioneEsxHypervisor |
Configura la parte di rete sull'hypervisor. Ciò include l'uso di Serial Over Lan per aggiungere gli uplink alla vSwitch di gestione e configurare l'indirizzo IP, il nome host e la configurazione DNS/NTP. |
AttivitàConvalidaPreDistribuzione |
Esegue convalide prima dell'avvio della distribuzione cluster. Le convalide includono i controlli di raggiungibilità di rete e la verifica che i nodi non facciano già parte di un altro cluster. |
AttivitàDistribuzionePreparazioneHypervisor |
prepara l'hypervisor per la configurazione della macchina virtuale del controller. Ottiene informazioni sull'host da ESXi e garantisce l'impostazione di parametri corretti per il sistema operativo. |
AttivitàReteHypervisor |
Configura la parte di rete sull'host ESXi. Include la configurazione dei diversi vSwitch/gruppi di porte sull'host necessari per il funzionamento del cluster. |
AttivitàAggiornamentoSoftwareHypervisor |
Aggiorna il software sull'hypervisor, costituito dai VIB richiesti sull'host, se necessario. |
AttivitàArchivioDatiHypervisor |
Se necessario, crea l'archivio dati per la macchina virtuale del controller. |
DistribuisciControllerIperflexVm |
Se necessario, distribuisce gli OAV del controller di storage sull'hypervisor. |
ConfigVmTask |
Configura la parte di rete sulla VM del controller, che include la configurazione dei parametri richiesti e delle reti di dati/gestione. |
DistribuisciSoftwareAttivitàVM |
Installa i pacchetti HXDP sulle VM del controller. |
AttivitàRaccoltaInformazioniNodo |
Raccoglie informazioni sui nodi quali UUID e IP. |
AttivitàRaccoltaDatiInventario |
Invia i dati di inventario alle macchine virtuali del controller. |
CreaAttivitàConvalidaCluster |
Esegue convalide per verificare che la VM del controller sia pronta per l'aggiunta al cluster. Include i controlli MTU e verifica che i servizi di archiviazione siano pronti. |
CreaAttivitàCluster |
Crea il cluster di memoria e consente alla VM del controller di unire tutti i nodi nel cluster. |
ConfigurazioneHostPostInstallazione |
Configura l'host dopo la distribuzione del cluster. Include la modifica della password ESXi alla nuova password fornita in Hyperflex Cluster Profile. |
ConfigurazioneVmControllerArchiviazionePostInstallazione |
Configura le VM del controller dopo la distribuzione del cluster. Includere la modifica della password della VM del controller nella nuova password fornita nel profilo cluster Hyperflex. |
AttivitàAttestazioneAutomaticaCluster |
Richiede il cluster HyperFlex all'account utente di Intersight. |
Problema
Di seguito sono riportati gli errori più comuni che è possibile trovare nella distribuzione del cluster:
Errori/avvisi di convalida:
- IP duplicati (errore sulla stessa interconnessione fabric, avviso se si sovrappongono globalmente)
- Creazione cluster a 2 nodi
- 2 per il fattore di replica scelto (si consiglia un fattore di replica dei dati pari a 3)
Convalida runtime:
- DNS, NTP non raggiungibile
- vCenter non è raggiungibile o le credenziali non sono corrette
- Indirizzi IP di gestione già in uso
Errori di distribuzione:
- Stesse VLAN dati per due cluster diversi nello stesso dominio L2 (switch uplink)
- Collegamento incrociato
- Errore di configurazione IP ESXi (a causa di credenziali ESXi errate)
Soluzione
In base al task non riuscito e all'errore riscontrato, è possibile eseguire le azioni suggerite:
DNS/NTP non raggiungibile
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list
Azione: controllare l'indirizzo IP, se non è corretto modificare il criterio e riavviare il flusso di lavoro.
vCenter non raggiungibile
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."
Azione: controllare le credenziali IP/ di vCenter, se non sono corrette, modificare il criterio e riavviare il flusso di lavoro.
IP duplicato
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”
Azione: verificare se l'indirizzo IP è già in uso. In tal caso, modificare il criterio e riavviare il flusso di lavoro.
Connessione all'host non riuscita
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'
Azione: controllare la VLAN/IP/Gateway, se non è corretto modificare il criterio e riavviare il flusso di lavoro.
Attestazione automatica non riuscita
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "
Azione: richiedere il cluster HyperFlex descritto nella procedura di richiesta di rimborso del dispositivo e riavviare il flusso di lavoro.
Impossibile configurare l'associazione del profilo del server
failed in Task: 'Failed to Configure Server Profile Association
Azione:
La configurazione IP di ESXi viene eseguita tramite l'accesso alla console tramite CIMC Serial Over LAN. A volte il SoL CIMC non riesce a ottenere la console nel prompt di accesso. Controllare la console CIMC su ESXi tramite KVM, ripristinare CIMC e riavviare il workflow.
Operazione non riuscita: monitoraggio avvio sistema operativo
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'
Azione:
- Verificare che la password della directory principale ESXi sia corretta
- Per la prima installazione, verificare la password predefinita di fabbrica.
- Per reinstallare, assicurarsi di deselezionare la password predefinita di fabbrica.
- Verificare la presenza di errori di accesso SoL.
- Verificare se il connettore del dispositivo si è disconnesso durante l'avvio del sistema operativo.
Se si tratta di una nuova installazione, accertarsi che la password fornita non sia quella predefinita (Cisco123), anche dopo aver selezionato il pulsante di opzione password predefinita di fabbrica.
Il risultato di questa operazione è che l'installatore è in grado di accedere a ESXi ma non di impostare la password poiché la complessità della password predefinita è scarsa
Errore nell'attività: verifica di OVA rispetto a Sha1
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"
Azione:
- Verificare che il DNS non sia configurato per ESXi.
- Verificare se la subnet IP di gestione ESXi è bloccata per l'accesso Intersight.
Errore nell'attività: aggiunta dell'host al cluster vCenter
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts
Azione:
La versione di vCenter deve essere successiva o uguale a tutti gli host nel cluster. Aggiornare vCenter a una versione superiore o uguale a ESXi oppure eseguire il downgrade di ESXi a una versione stabile inferiore.
Errore nell'attività: configurazione della macchina virtuale del controller di archiviazione di rete non riuscita
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'
Azione:
Il server API EXSI non risponde in tempo.
- Verificare che lo stato del servizio host sia in esecuzione.
- Riavviare ESXi e riprovare l'installazione.
Flusso di lavoro non riuscito a causa di problemi MTU
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
Azione:
Il frame Jumbo non è abilitato in tutti i percorsi. Quando il frame Jumbo è abilitato, il valore MTU 9216 deve essere configurato nello switch uplink. Verificare che l'MTU sia impostata sui frame jumbo in tutti i percorsi e riavviare il flusso di lavoro
Errore nell'attività: copia dei pacchetti software nella macchina virtuale del controller di archiviazione
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.
Azione:
- Accertarsi che esista una connettività di rete da SCVM a Intersight.
- Verificare che la porta richiesta sia consentita nella rete.
- Fare riferimento ai collegamenti per il controllo della preinstallazione per i requisiti di rete.
Informazioni correlate