Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document décrit les meilleures pratiques destinées à exécuter avec succès un processus de mise à niveau du cluster HyperFlex.
s
Cisco recommande de connaître les sujets suivants :
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
La décision relative à la version cible sélectionnée dépend des besoins de l'environnement HyperFlex. Son objectif est d'améliorer, de réparer et de tirer parti du nouveau logiciel de l'ancien.
Lisez les notes de version d'HyperFlex pour identifier des informations telles que les nouvelles fonctionnalités, le nouveau matériel pris en charge, l'interopérabilité entre les composants, les directives, les limitations, les correctifs de sécurité et les mises en garde résolues.
Pour consulter les notes de version, cliquez ici.
Avant d'exécuter la mise à niveau Hyperflex Cluster, vérifiez que toutes les versions sont compatibles. Cisco recommande :
Consultez les guides de mise à niveau de Cisco HyperFlex qui fournissent des instructions détaillées à effectuer.
Les guides fournissent des informations sur différents types de scénarios, tels que :
Effectuez des contrôles d'intégrité avant l'exécution de la mise à niveau HyperFlex pour corriger les défaillances potentielles et éviter les comportements inattendus pendant la mise à niveau.
Il existe deux méthodes différentes permettant d'effectuer ces contrôles d'intégrité.
Cet outil est un utilitaire permettant d'effectuer des auto-vérifications proactives sur les systèmes HyperFlex afin de garantir leur stabilité et leur résilience.
Les informations du guide Hypercheck sont disponibles ici.
Il s'agit de la méthode recommandée pour les vérifications préalables. Il est régulièrement mis à jour pour inclure de nouvelles fonctionnalités de dépannage qui détectent facilement les erreurs de configuration potentielles.
Il se tient informé des mises en garde récemment découvertes qui représentent des inconvénients pendant le processus de mise à niveau. Les informations du guide Intersight HealthCheck sont disponibles ici.
Étape 1. Connectez-vous à Intersight et naviguez jusqu'à Infrastructure Service, puis sélectionnez HyperFlex Clusters, et choisissez le cluster.
Des exemples montrent un cluster nommé San_Jose. Dans le menu déroulant Actions, sélectionnez Exécuter le contrôle d'intégrité.
Remarque : cet exemple montre les contrôles d'intégrité effectués sur un cluster unique. Vous pouvez sélectionner et effectuer des contrôles d'intégrité sur plusieurs clusters en même temps.
Confirmez votre cluster et cliquez sur Next.
Le workflow vous permet d'ignorer certaines vérifications, si vous le souhaitez.
Étape 2. Cliquez sur Start pour lancer la pré-vérification.
Vérifiez la barre de progression et attendez que la tâche de contrôle d'intégrité soit terminée.
Étape 3. Une fois la tâche de contrôle d'intégrité terminée, il y a quelques endroits où les résultats peuvent être vérifiés.
L'onglet Health Check affiche les résultats généraux. L'exemple est filtré sur no-show Passed and Not Run results.
Étape 4. Cliquez sur Noeuds affectés pour vérifier les noeuds en question.
Dans l'onglet Aperçu, sélectionnez Événements : Alarmes, Demandes, et Avis.
Développez chaque événement pour plus de détails.
Exemple : Demandes développées, cliquez sur Exécuter les contrôles d'intégrité Hypercheck sélectionnés ayant échoué.
Elle affiche toutes les vérifications réussies et ayant échoué.
Étape 5. Cliquez sur l'option Afficher les détails supplémentaires.
Chaque contrôle d'appel peut être développé, fournissant une vue granulaire de ce qui a été contrôlé.
Il fournit des informations détaillées au format JSON pour les journaux, les entrées, et les sorties.
Hypercheck vidéo.
Vidéo du bilan de santé Intersight.
Remarque : certains correctifs nécessitent l'intervention du centre d'assistance technique (TAC). Ouvrez un dossier si nécessaire.
Le gestionnaire de microprogramme UCS Manager nécessite le téléchargement des packages de microprogramme UCS dans la partition Flash de démarrage Fabric Interconnect. Vérifiez et supprimez les anciens packages de microprogramme qui ne sont plus utilisés sur les composants pour éviter de remplir la partition de mémoire flash de démarrage Fabric Interconnects avec des fichiers inutiles.
Vérifiez l'espace Fabric Interconnect.
Étape 1. Accédez à Equipement, sélectionnez Fabric Interconnects, puis choisissez un Fabric Interconnect. L'exemple montre Fabric Interconnect A (Primary).
Étape 2. Dans le panneau général, sélectionnez Informations sur le stockage local et développez-le.
Si le commutateur en amont prend en charge la commande STP PortFast, il est fortement conseillé de l'activer. L'activation de la fonctionnalité PortFast entraîne le passage immédiat d'un commutateur, ou d'un port agrégé, à l'état de transmission STP, ou lors d'un événement de liaison, contournant ainsi les états d'écoute et d'apprentissage.
La fonctionnalité PortFast est activée au niveau du port, et ce port peut être un port physique ou un port logique.
Vérifiez sur UCSM toutes les erreurs liées aux erreurs de port sur les liaisons ascendantes ou les ports du serveur pour éviter les scénarios de basculement indésirables.
Étape 1. Connectez-vous à UCSM et accédez à l'onglet Equipment, développez Rack-Mounts, et développez Servers. L'exemple illustre le serveur 1.
Étape 2. Développez Adapters, puis NIC.
Étape 3. Vérifiez que chaque carte réseau est propre.
Le VLAN de données de stockage doit être configuré sur le périphérique en amont pour garantir le basculement en cas de panne de l'interconnexion de fabric B.
Assurez-vous que vous disposez de toutes les conditions requises répertoriées dans le guide d'installation d'HyperFlex.
Assurez-vous que les flux de connectivité réseau pour les deux chemins sur les cartes d'interface réseau de machine virtuelle (vmnic).
Remarque : pour effectuer le test de connectivité en amont, vérifiez cette vidéo.
Ce guide vous permet de vérifier que l'association de cartes réseau appropriée est correctement configurée en fonction des stratégies UCS.
Lors d'une mise à niveau de l'infrastructure, attendez que les liaisons ascendantes ESXi s'activent avant de redémarrer l'autre interconnexion de fabric.
À partir de la version 4.0(2a) de Cisco HyperFlex, la page Mise à niveau affiche le dernier résultat du test d'éligibilité à la mise à niveau du cluster et la dernière version testée du serveur UCS, de la plate-forme de données HX et/ou d'ESXi.
Pour effectuer le test d’éligibilité à la mise à niveau, connectez-vous à HX Connect :
Étape 1. Sélectionnez Upgrade > Test Upgrade Eligibility.
Étape 2. Cochez la case UCS Server Firmware pour tester l'éligibilité de la mise à niveau du micrologiciel du serveur UCS.
Étape 3. Saisissez le nom de domaine complet (FQDN) ou l'adresse IP, le nom d'utilisateur et le mot de passe de Cisco UCS Manager. Dans le champ Current Version, cliquez sur Discover pour choisir la version du progiciel UCS qui doit être validée avant la mise à niveau.
Étape 4. Activez la case à cocher HX Data Platform pour tester l'éligibilité de la mise à niveau de la plate-forme de données HyperFlex.
Étape 5. Saisissez le nom d'utilisateur et le mot de passe vCenter. Téléchargez le bundle de mise à niveau de la plate-forme de données Cisco HyperFlex qui doit être validé avant la mise à niveau.
Étape 6. Cochez la case ESXi pour tester l'éligibilité de la mise à niveau d'ESXi.
Étape 7. Saisissez le nom d'utilisateur et le mot de passe administrateur vCenter. Téléchargez l'offre groupée d'images personnalisées hors connexion Cisco HyperFlex qui doit être validée avant la mise à niveau
Étape 8. Cliquez sur Valider.
Étape 9. La progression du test d'éligibilité à la mise à niveau s'affiche.
Vérifier les mots de passe pour :
Assurez-vous que les machines virtuelles exécutées sur l'hôte peuvent être migrées vers un autre hôte pendant le fonctionnement du mode maintenance. Si une machine virtuelle ne peut pas être migrée, elle doit être mise hors tension. Si une machine virtuelle ne migre pas automatiquement, mais qu'elle peut migrer manuellement, vérifiez s'il existe un problème lié à DRS.
Vérifiez que DRS est activé et configuré sur entièrement automatisé, si une licence pour DRS est disponible. Si DRS est désactivé, une intervention manuelle est requise pour vMotion manuellement les machines virtuelles lorsque le processus de mise à niveau l'invite.
Consultez le guide VMware pour plus d'informations.
Vérifiez que vMotion est correctement configuré pour éviter les tâches en mode maintenance qui ne peuvent pas être effectuées.
Pour plus d'informations sur le dépannage vMotion, consultez ici.
Étape 1. Connectez-vous à VMware vCenter et accédez à Home and Clusters.
Étape 2. Cliquez sur le cluster vCenter. Cet exemple montre un cluster nommé San_Jose.
Étape 3. Sélectionnez Configure, sous Configuration, cliquez sur VMware EVC et sélectionnez EDIT.
Étape 4. Assurez-vous de changer le mode EVC en Enabled pour le processeur respectif utilisé.
Vérifiez si une règle d'affinité a été créée sur la machine virtuelle invitée.
Étape 1. Accédez au cluster depuis VMware vCenter.
Étape 2. Accédez à Accueil et Clusters. Cet exemple montre un cluster nommé San_Jose.
Étape 3. Sélectionnez Configurer. Sous Configuration, sélectionnez VM/Host Rules, et vérifiez qu'une règle est créée.
Depuis HXDP 5.0(x) et les versions ultérieures, EAM n'est plus utilisé sur les hôtes ESXi pour gérer le réseau et le data store SCVM.
À partir de HXDP 5.0(x) et des versions antérieures, le réseau et le data store ont besoin d'informations SCVM.
Pour vérifier que l'intégrité d'ESXi Agent Manager (EAM) est normale.
Étape 1. Connectez-vous à VMware vCenter.
Étape 2. Accédez à Home et Clusters et à chaque noeud ESXi.
Étape 3. Sur le cluster VMware vCenter, accédez à Configure, et à partir de Virtual Machines, sélectionnez Agent VM Settings.
L'exemple montre des espaces vides car le cluster HyperFlex de l'exemple est sur 5.0(2c)
Si EAM est utilisé, vérifiez qu'aucune erreur de certificat n'est affichée sur vCenter.
Plus d'informations sur EAM sont disponibles ici
Licences vCenter et ESXi
Si vous effectuez une mise à niveau de 6.x vers 7.0, assurez-vous que vous disposez des nouvelles licences avant la mise à niveau.
Après la mise à niveau, vous ne disposez que de 60 jours en mode Évaluation.
Les échecs de connexion peuvent entraîner le verrouillage des utilisateurs ESXi.
Pour vérifier l'état de l'utilisateur hxuser ou root
Étape 1. Ouvrez une session SSH en tant que racine dans le noeud ESXi.
Étape 2. Exécutez pam_tally2 —user hxuser (ou root user).
Étape 3. Assurez-vous que l'utilisateur hexadécimal ou racine a été verrouillé.
[root@esxi1:~] pam_tally2 --user hxuser
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root
Login Failures Latest failure From
root 0
[root@esxi1:~]
Pour déverrouiller les utilisateurs ESXi mentionnés :
Étape 1. Exécutez pam_tally2 —user hxuser —reset (ou root user).
Étape 2. Assurez-vous que le nombre d'échecs passe à 0.
[root@esxi1:~] pam_tally2 --user hxuser --reset
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root --reset
Login Failures Latest failure From
root 0
Pour renforcer la sécurité sur l'hôte ESXi, vous devez activer le mode Verrouillage. Cette configuration empêche les mises à niveau HyperFlex en raison du mode de verrouillage qui doit être désactivé pour une mise à niveau du cluster HyperFlex.
Pour désactiver le mode de verrouillage ESXi :
Étape 1. Exécutez SSH directement sur l'hôte ESXi en tant que racine.
Étape 2. Appuyez sur F2pour effectuer la configuration initiale.
Étape 3. Entrez les informations d'identification racine pour ouvrir la configuration DUCI.
Étape 4. Accédez au paramètre Configure Lockdown Modessetting et changez-le en disabled.
Pour désactiver le mode de verrouillage à partir de vCenter,
Étape 1. Accédez à l'hôte dans l'inventaire du client Web vSphere.
Étape 2. Cliquez sur l'onglet Gestion, puis sur Paramètres. (avec la version 6.7, cliquez sur l'onglet Configurer).
Étape 3. Sous Système, sélectionnez Profil de sécurité.
Étape 4. Dans le panneau Mode de verrouillage, cliquez sur Modifier.
Étape 5. Cliquez sur Mode de verrouillage et sélectionnez l'une des options du mode de verrouillage.
Pour plus d'informations sur le mode de verrouillage, cliquez ici
Si la réplication est configurée et activée, elle doit être suspendue avant la mise à niveau.
Suspendre la réplication à l'aide de la commande run stcli dp schedule pause et l'activer après la mise à niveau à l'aide de la commande stcli dp schedule resume.
Les pannes de disque entraînent l'échec de la mise à niveau du cluster HyperFlex. Pour vérifier la présence de disques bloqués ou ignorés dans l'interface utilisateur graphique HyperFlex Connect :
Étape 1. Ouvrez l'interface graphique utilisateur HyperFlex connect, puis accédez à https://<Adresse-ip-virtuelle-HyperFlex ou fqdn>.
Étape 2. Accédez à Informations système, puis sélectionnez l'onglet Vue d'ensemble du système.
Étape 3. Recherchez des erreurs de disque.
Les problèmes de disques doivent être résolus par le TAC Cisco.
Le remplacement de la carte mère entraîne également le remplacement des anciens UID d'hôte par les nouveaux ID. Si certains problèmes ont été rencontrés lors des tâches de remplacement, l'absence de correspondance des UID peut entraîner l'échec de la mise à niveau HyperFlex.
Remarque : Intersight HealthCheck vous avertit en cas de non-concordance d'ID. Il est vivement recommandé de connecter le cluster HyperFlex à Intersight et d'exécuter HyperFlex Cluster HealtCheck.
Pour le remplacement de la carte mère, comparez l'UUID stNode de l'interface de ligne de commande ESXi pour vous assurer que les informations UUID correspondent à celles du cluster Hyperflex.
Pour collecter l'UID :
Étape 1. Ouvrez une session SSH vers le noeud ESXi en tant que racine.
Étape 2. Exécutez cette commande : hostsvc/hostsum | uuid grep -i | grep -v inst.
Étape 3. Collectez les informations UUID.
[root@esxi2:~] vim-cmd hostsvc/hostsumm | grep -i uuid | grep -v inst
uuid = "1f82077d-6702-214d-8814-e776ffc0f53c", <----- ESXi2 ID
[root@esxi2:~]
[root@esxi2:~]
Pour obtenir les informations UUID sur le noeud de cluster HyperFlex :
Étape 1. Exécutez SSH dans l'adresse IP du cluster HyperFlex.
Étape 2. Exécutez la commande stcli cluster info | plus.
Étape 3. Collectez les ID stNodes.
hxshell:~$ stcli cluster info | more
stNodes:
----------------------------------------
id: c4a24480-e935-6942-93ee-987dc8e9b5d9
type: node
name: esxi1
----------------------------------------
id: 1f82077d-6702-214d-8814-e776ffc0f53c <----- ID for ESXi2
type: node
name: esxi2
----------------------------------------
id: 50a5dc5d-c419-9c48-8914-d91a98d43fe7
type: node
name: esxi3
----------------------------------------
Assurez-vous que les ID de cluster stcli correspondent aux informations affichées sur les noeuds ESXi.
Vérifiez que les informations vCenter telles que les noms de data center, de cluster et de data store sur le cluster HyperFlex correspondent à celles de vCenter. Une incohérence des informations entraîne l'échec de la mise à niveau du cluster HyperFlex.
Pour obtenir les informations les plus récentes :
Étape 1. Exécutez SSH dans l'IP de cluster HyperFlex en tant qu'administrateur.
Étape 2. Exécuter les informations de cluster stcli | grep -i vcenter.
Étape 3. Collecter les informations vCenter enregistrées dans le cluster.
hxshell:~$ stcli cluster info | grep -i vcenter
vCenterClusterName: vcenter-cluster
vCenterDatacenter: hx-cluster-name
vCenterURL: https://vcenter-url
vCenterDatacenterId: datacenter-name
vCenterClusterId: domain-c5124
vCenterUrl: https://vcenter-url
vCenterVersion: 7.0.2 Build-18455184
Les noms sont sensibles à la casse. Si le nom et les informations vCenter du résultat précédent ne correspondent pas, un réenregistrement vCenter est nécessaire.
Pour réenregistrer le vCenter dans le cluster Hyperflex, regardez la vidéo d'enregistrement de vCenter ici
Pour réenregistrer le Vcenter, procédez comme suit :
Étape 1. Exécutez SSH dans l'adresse IP du cluster en tant qu'administrateur.
Étape 2. Exécutez la commande stcli cluster reegister.
stcli cluster reregister [-h] --vcenter-datacenter NEWDATACENTER --vcenter-cluster NEWVCENTERCLUSTER --vcenter-url NEWVCENTERURLIP [--vcenter-sso-url NEWVCENTERSSOURL] --vcenter-user NEWVCENTERUSER
hxshell:~$ stcli cluster reregister --vcenter-datacenter MyData-Center --vcenter-cluster Cluster-Name --vcenter-url https://vcenter1-url --vcenter-user <vCenter user>
Reregister StorFS cluster with a new vCenter ...
Enter NEW vCenter Administrator password:
Cluster reregistration with new vCenter succeeded
hxshell:~$
Révision | Date de publication | Commentaires |
---|---|---|
2.0 |
30-Sep-2023 |
faute de frappe corrigée |
1.0 |
10-Aug-2023 |
Première publication |