Introduction
Ce document décrit les scénarios de dépannage courants pour le déploiement de clusters Hyperflex via Intersight.
Conditions préalables
Exigences
Cisco vous recommande de prendre connaissance des rubriques suivantes :
- Intersight
- Déploiement de cluster Hyperflex
Composants utilisés
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
Informations générales
Le workflow du programme d'installation d'Intersight suit la tâche présentée dans le tableau pour déployer une grappe hyperflex :
Nom de tâche |
Définition |
PréparerInfoPréClusterTâche |
Génère des fichiers de configuration qui contiennent les informations requises pour déployer le cluster (par exemple, chemin d'accès du fichier de configuration, fichier YAML logiciel). |
TâcheValidationConfigurationServeur |
Valide la configuration du serveur UCS pour s'assurer qu'il dispose de la configuration matérielle et microprogrammée requise (par exemple, la validation de la taille du disque/du PID, les cartes réseau correctes, etc.). |
TâcheValidationPréConfiguration |
Valide la configuration du réseau avant le démarrage de la configuration du serveur (par exemple, DNS, NTP, accessibilité vCenter, vérification des adresses IP en double) |
PréparerTâcheRépImageLocale |
Télécharge les images logicielles (contrôleurs VM OVA, packages hxdp) vers le magasin d'images local. Cette tâche n'est incluse dans le workflow que si elle est exécutée dans l'environnement de l'appliance connectée. |
TâcheConfigurationServeur |
Effectue la configuration requise sur les serveurs UCS. Pour les déploiements FI-attached, cela implique la création et l'association des profils de service. |
HypervisorEsxConfigurationTask |
Configure la partie réseau de l'hyperviseur. Ceci inclut l'utilisation de Serial Over Lan pour ajouter les liaisons ascendantes au commutateur virtuel de gestion et configure l'adresse IP, le nom d'hôte et la configuration DNS/NTP. |
TâcheValidationPréDéploiement |
Effectue des validations avant le démarrage du déploiement du cluster. Les validations incluent des contrôles d'accessibilité du réseau et la vérification que les noeuds ne font pas déjà partie d'un autre cluster. |
PréparerTâcheDéploiementHyperviseur |
prépare l'hyperviseur à la configuration de la machine virtuelle (VM) du contrôleur. Obtient des informations sur l'hôte d'ESXi et s'assure que les paramètres du système d'exploitation sont définis. |
HypervisorNetworkingTask |
Configure la partie réseau sur l'hôte ESXi. Inclut la configuration des différents commutateurs virtuels/groupes de ports sur l'hôte qui sont nécessaires au fonctionnement du cluster. |
HypervisorSoftwareUpdateTask |
Met à jour le logiciel sur l'hyperviseur, qui comprend les VIB nécessaires sur l'hôte si nécessaire. |
HypervisorDatastoreTask |
Crée le data store pour la machine virtuelle du contrôleur, si nécessaire. |
DéployerHyperflexControllerVm |
Déploie le contrôleur de stockage OVA sur l'hyperviseur, si nécessaire. |
TâcheConfigVm |
Configure la partie réseau sur la machine virtuelle du contrôleur, ce qui inclut la configuration des paramètres requis et des réseaux de données/gestion. |
TâcheVmDéployerLogiciel |
Installe les packages HXDP sur les machines virtuelles du contrôleur. |
CollecterInfoNoeudTâche |
Collecte les informations de noeud telles que les UUID et les IP. |
CollecterTâcheDonnéesInventaire |
Envoie les données d'inventaire aux machines virtuelles du contrôleur. |
CréerTâcheValidationCluster |
Effectue des validations pour s'assurer que la machine virtuelle du contrôleur est prête à rejoindre le cluster. Inclut les vérifications MTU et vérifie que les services de stockage sont prêts. |
CréerTâcheCluster |
Crée le cluster de stockage et prend la machine virtuelle du contrôleur pour joindre tous les noeuds dans le cluster. |
PostInstallHostConfig |
Configure l'hôte après le déploiement du cluster. Inclut la modification du mot de passe ESXi en nouveau mot de passe fourni dans le profil de cluster Hyperflex. |
ConfigurationVmContrôleurPostInstall |
Configure les machines virtuelles du contrôleur après le déploiement du cluster, en incluant le changement de mot de passe de la machine virtuelle du contrôleur dans le nouveau mot de passe fourni dans le profil de cluster Hyperflex |
TâcheRevendicationAutomatiqueCluster |
Revendique le cluster HyperFlex au compte utilisateur Intersight. |
Problème
Voici les erreurs courantes que vous pouvez trouver dans le déploiement de cluster :
Erreurs/avertissement de validation :
- IP dupliquées (erreur sur la même interconnexion de fabric, avertissement en cas de chevauchement global)
- Création du cluster de 2 noeuds
- 2 pour le facteur de réplication choisi (facteur de réplication des données de 3 recommandé)
Validation du runtime :
- DNS, NTP inaccessible
- vCenter est inaccessible ou informations d'identification incorrectes
- Adresses IP de gestion déjà utilisées
Erreurs de déploiement :
- Mêmes VLAN de données pour deux clusters différents dans le même domaine L2 (commutateur de liaison ascendante)
- liaison de réserve
- Échec de la configuration IP ESXi (en raison d'informations d'identification ESXi incorrectes)
Solution
En fonction de la tâche qui échoue et de l'erreur rencontrée, vous pouvez effectuer les actions suggérées :
DNS/NTP inaccessible
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list
Action : vérifiez l'adresse IP, si elle est incorrecte, modifiez la stratégie et redémarrez le workflow.
vCenter inaccessible
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."
Action : vérifiez les informations d'identification IP/IP vCenter, si elles sont incorrectes, modifiez la stratégie et redémarrez le workflow.
IP dupliquée
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”
Action : vérifiez si l'adresse IP est déjà utilisée, si c'est le cas, modifiez la stratégie et redémarrez le workflow.
Échec de la connexion à l'hôte
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'
Action : vérifiez le VLAN/ IP/ Gateway, si ce n'est pas le cas, modifiez la stratégie et redémarrez le workflow.
Échec de la demande automatique
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "
Action : revendiquez le cluster HyperFlex décrit dans la procédure de revendication de périphérique et redémarrez le workflow.
Échec de la configuration de l'association des profils de serveur
failed in Task: 'Failed to Configure Server Profile Association
Action :
La configuration IP ESXi s'effectue via l'accès à la console via CIMC Serial Over LAN. Parfois, CIMC SoL ne parvient pas à insérer la console dans l'invite de connexion. Vérifiez la console CIMC sur ESXi via KVM, réinitialisez CIMC et redémarrez le workflow.
Échec de la tâche : Surveiller le démarrage du système d'exploitation
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'
Action :
- Vérifiez que le mot de passe racine ESXi est correct
- Pour la première installation, vérifiez le mot de passe par défaut.
- Pour la réinstallation, veillez à désélectionner le mot de passe par défaut.
- Vérifiez les échecs d'accès SoL.
- Vérifiez si le connecteur du périphérique a été déconnecté lors du démarrage du système d'exploitation.
S'il s'agit d'une nouvelle installation, assurez-vous que le mot de passe fourni n'est pas le mot de passe par défaut (Cisco123), même après avoir coché la case d'option Mot de passe par défaut.
Le résultat de cette action est que le programme d'installation peut se connecter à l'ESXi mais ne peut pas définir le mot de passe car la force du mot de passe par défaut est faible
Échec de la tâche : vérifier OVA par rapport à Sha1
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"
Action :
- Vérifiez si le serveur ESXi n'a pas de DNS configuré.
- Vérifiez si le sous-réseau IP de gestion ESXi est bloqué pour l'accès à Intersight.
Échec de la tâche : Ajouter un hôte au cluster vCenter
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts
Action :
La version de vCenter doit être supérieure ou égale à tous les hôtes du cluster. Mettez à niveau vCenter vers une version supérieure ou égale à ESXi ou rétrogradez ESXi vers une version stable inférieure.
Échec de la tâche : Échec de la configuration de la machine virtuelle du contrôleur de stockage réseau
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'
Action :
Le serveur d’API EXSI ne répond parfois pas à temps.
- Vérifiez l'état du service hôte pour vous assurer qu'est en cours d'exécution.
- Redémarrez ESXi et réessayez le déploiement.
Échec du workflow en raison de problèmes MTU
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
Action :
La trame jumbo n'est pas activée dans tous les chemins. Lorsque la trame jumbo est activée, la valeur MTU 9216 doit être configurée dans le commutateur de liaison ascendante. Assurez-vous que le MTU est défini sur des trames Jumbo dans tous les chemins et redémarrez le workflow
Échec de la tâche : Copie des packages logiciels sur la machine virtuelle du contrôleur de stockage
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.
Action :
- Assurez-vous de la connectivité réseau entre SCVM et Intersight.
- Vérifiez que les ports requis sont autorisés sur le réseau.
- Reportez-vous aux liens de vérification de pré-installation pour connaître la configuration réseau requise.
Informations connexes