Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document décrit le processus d'exécution de l'outil de contrôle d'intégrité et de pré-mise à niveau d'Unified Computing System Manager (UCSM).
Cisco recommande d'installer Python 3.6 ou version ultérieure sur le système.
Remarque : si vous exécutez le système d'exploitation Windows, Python peut être installé et configuré sur le chemin d'accès de l'environnement.
Remarque : n'ouvrez pas de dossier TAC pour les problèmes Python/Échec de l'exécution du script. Reportez-vous à la section relative aux commandes CLI pour identifier manuellement le problème et ouvrir un dossier TAC par problème identifié.
Ce document n'est pas limité à des versions de matériel et de logiciel spécifiques.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si votre réseau est en ligne, assurez-vous de bien comprendre l’incidence possible des commandes.
L'outil de contrôle UCSM est un utilitaire permettant d'effectuer des auto-contrôles proactifs sur UCSM afin de garantir sa stabilité et sa résilience. Il permet d'automatiser une liste de vérifications de l'état et de pré-mise à niveau des systèmes UCS afin de gagner du temps lors des opérations de mise à niveau et de maintenance de l'infrastructure UCS.
Remarque : téléchargez et utilisez toujours la dernière version de l'outil. Comme l'outil est fréquemment amélioré, lorsque vous utilisez une version plus ancienne, il peut manquer des vérifications importantes.
Remarque : ce script est un script de type « best effort », libre d'utilisation. Toutefois, elle ne peut pas identifier tous les problèmes.
Étape 1. Téléchargez la dernière version de Python à partir de Téléchargements Python
Étape 2. Utilisez la procédure d'installation normale et cliquez sur Install Now (la procédure recommandée), pour télécharger l'installation.
Note : Assurez-vous de cocher Add Python to PATH.
Étape 3. Accédez au répertoire dans lequel Python a été installé sur le système.
Étape 4. Ouvrez l'invite de commande et tapez la commande Python pour vérifier l'installation de Python.
Étape 5. Téléchargez la dernière version du script de contrôle d'intégrité ici et enregistrez-la dans un dossier. Maintenant, extrayez le fichier compressé, comme indiqué dans l'image.
Étape 6. Téléchargez et enregistrez les derniers journaux d'assistance technique UCSM dans le dossier créé, comme illustré dans l'image. Cliquez sur ce lien pour connaître les étapes de téléchargement du bundle de journaux UCSM : Generating UCSM technical support.
Étape 7. Ouvrez CMD et cd dans le dossier où se trouve UCSMTool.py et exécutez UCSMTool.py comme indiqué dans l'image.
Étape 8. Entrez le chemin d'accès du fichier de support technique UCSM et choisissez l'option souhaitée.
1. Vérification du fonctionnement d'UCSM
2. Vérification préalable à la mise à niveau
Étape 1. MacOS est livré avec Python par défaut installé, vérifiez la version installée de Python comme indiqué :
Note : Si la version de Python est inférieure à 3.6, veuillez mettre à niveau vers la version 3.6 et les versions ultérieures.
Note : Si la version de Python est 3.6 ou ultérieure, passez à l'étape 5 sinon, passez à l'étape 2.
Étape 2. Téléchargez la dernière version de Python depuis https://www.python.org/downloads/macos/.
Étape 3. Utilisez le processus d'installation normal pour terminer/mettre à niveau l'installation de Python.
Étape 4. Téléchargez la dernière version du script de contrôle d'intégrité ici et enregistrez-la dans un dossier. Maintenant, extrayez le fichier compressé, comme illustré dans cette image :
Étape 5. Téléchargez et enregistrez les derniers journaux d'assistance technique UCSM dans le dossier créé, comme illustré dans cette image. Cliquez sur le lien pour connaître les étapes de téléchargement du bundle de journaux UCSM : Generating UCSM technical support.
Étape 6. Ouvrez le terminal, accédez au répertoire où vous avez téléchargé le script de contrôle d'intégrité, exécutez python UCSMTool.py ou python3UCSMTool.py comme indiqué : .
Étape 7. Entrez le chemin d'accès du fichier de support technique UCSM et choisissez l'option souhaitée pour exécuter le script.
1. Vérification du fonctionnement d'UCSM
Ces vérifications sont effectuées par UCSM-Healthchecktool :
UCSM HA Cluster State : affiche l'état de cluster des interconnexions de fabric.
PMON Process State : affiche l'état de tous les processus dans Cisco UCS Manager.
File System Mount : affiche la table de montage.
Recherchez le problème de taille /var/ sysmgr : vérifie les utilisations /var/ sysmgr.
Vérifiez le problème /var/ tmp size : Vérifie si /var/ tmp utilise.
6296 FI ne répond pas après un cycle d'alimentation, mise à jour de la révision matérielle : vérifiez le module d'interconnexion de fabric et son numéro de révision matérielle.
Défaillances avec gravité majeure ou gravité critique : signale si vous disposez d'une alerte majeure ou critique dans UCS Manager.
Check Backup Available : vérifiez si la sauvegarde est disponible dans UCS Manager.
Keyring Cert Check : Vérifiez si le porte-clés a expiré ou est valide.
Solution de contournement requise ou non : vérifiez si une solution de contournement est nécessaire en vérifiant le modèle FI et sa version.
Matériel obsolète dans Cisco UCS Manager version 4.x : recherchez tout matériel obsolète dans Cisco UCS Manager version 4.x.
Matériel obsolète détecté pour les versions 3.1.x et ultérieures : recherchez tout matériel obsolète dans la version 3.x de Cisco UCS Manager
Recherchez un redémarrage B200M4 en raison de champs MRAID12G vides : vérifiez si le serveur B200M4 a un S/N vide de contrôleur RAID MRAID12G.
UCSM 3.1 La modification de l'allocation d'alimentation maximale entraîne une défaillance de détection de lame : vérifie la politique d'alimentation configurée dans UCS Manager.
Existence of bootflash corruption fault code F1219 : vérifiez l'existence de bootflash corruption.
Check for httpd fail to start when the default keyring is deleted : vérifiez si le porte-clés par défaut est supprimé.
3rd GEN FIs has unclean file system states-"État du système de fichiers : nettoyer avec des erreurs" : rechercher les erreurs du système de fichiers.
Check for Server Auto-Install to 4.0(4b) Fails to Activate SAS Controller : vérifiez la version du microprogramme hôte et la version de l'amplificateur SAS
Vérifier si la mise à niveau du microprogramme de la série C reste longtemps dans le processus "effectuer un inventaire du serveur" PNU OS Inventory : Il vérifie le modèle de serveur et sa version pour identifier si vous rencontrez ce problème.
Vérifier le domaine d'authentification UCSM qui utilise un point ou un tiret : Vérifiez si le nom du domaine d'authentification est configuré avec un point ou un tiret.
Échec de l'authentification locale ou de secours : Vérifiez la méthode d'authentification configurée pour un modèle FI particulier et vérifiez également sa version.
Contrôle d'intégrité entre UCSM et UCS Central : vérifiez si UCSManager est enregistré auprès d'UCS Central
Groupes de broches LAN et SAN : vérifiez la configuration de broches LAN/SAN dans votre cluster et mettez-la en surbrillance pour examiner votre configuration avant la mise à niveau/toute activité MW
Vérification des activités en attente présentes dans UCSM : vérifiez si votre domaine UCS Manager contient des activités en attente.
Health Check for IOM : vérifiez l'état général des modules E/S.
Fichiers de base disponibles dans UCSM Vérifiez : Vérifiez si un fichier de base est trouvé dans les 60 jours.
Configuration incorrecte potentielle de la couche 2 disjointe : vérifiez si la configuration est incorrecte au cas où la couche 2 disjointe serait configurée.
Problème du volet de liaison VIC 1400 et 6400 : vérifiez les conditions présentes dans ce défaut
Vérification de la déconnexion et de la reconnexion des IOM 2304 lors de la mise à jour du microprogramme : vérifiez le modèle de module d'E/S et Fabric Interconnect et identifiez tout problème potentiel.
Vérification de l'intégrité DME : vérifiez l'intégrité de la base de données DME (Data Management Engine).
Nombre d'interfaces actives et correspondance de flogi sur FI : vérifiez le nombre d'interfaces et la session de flogi
Contrôle Jumbo ou MTU standard : identification de la configuration MTU.
afrahmad@AFRAHMAD-M-C3RS ucsm_health_check-master $ python UCSMTool.py
UCS Health Check Tool 1.1
Enter the UCSM file path: /Users/afrahmad/Desktop/20190328180425_fabric-5410-1k08_UCSM.tar
Press 1 for UCSM Health Check
Press 2 for PreUpgrade Check
Enter your choice (1/2): 2
Enter the UCS Target Version [Ex:4.1(1x)]: 4.2(1i)
Log Extraction: [########################] COMPLETED
UCSM Version: 3.2(3h)A
Target Version: 4.2(1i)
Upgrade Path: 3.2(3) ==> 4.2(1i)
Summary Result:
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| SlNo | Name | Status | Comments |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 1 | UCSM HA Cluster State | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 2 | PMON Process State | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 3 | File System Mount | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 4 | Check for /var/sysmgr size issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 5 | Check for /var/tmp size issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 6 | 6296 FI unresponsive after power cycle, HW revision update | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 7 | Faults with Severity Major or Severity Critical | Found | Review the faults and Contact TAC, if needed |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 8 | Check Backup Available | No Backup | Please ensure to take backup, |
| | | | Refer this link: |
| | | | http://go2.cisco.com/UCSBackup |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 9 | Keyring Cert Check | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 10 | Safeshut Workaround Needed or Not | Not Needed | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 11 | Deprecated Hardware in Cisco UCS Manager Release 4.x | Found | Review the release notes to verify the hardware compatibility. |
| | | | Refer this link: |
| | | | http://go2.cisco.com/RN-4 |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 12 | Deprecated HW found for 3.1.x onwards | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 13 | Check for B200M4 reboot due to blank MRAID12G fields | Found | Contact TAC |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 14 | UCSM 3.1 Change in max power allocation causes blade discovery | Not Found | |
| | failure | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 15 | Existence of bootflash corruption fault code F1219 | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 16 | Check for httpd fail to start when default keyring is deleted | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 17 | 3rd GEN FIs has unclean file system states-"Filesystem state: | Not Found | |
| | clean with errors" | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 18 | Check for Server Auto-Install to 4.0(4b) Fails to Activate SAS | Not Found | |
| | Controller | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 19 | Check for C-Series firmware upgrade stays long in process | Not Found | |
| | "perform inventory of server" PNU OS Inventory | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 20 | Check UCSM Authentication Domain using a Period or Hyphen | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 21 | Local or fallback Authentication failure | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 22 | Health check between UCSM and UCS central | Not Found | UCS Manager is Not Registered |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 23 | LAN and SAN Pin Groups | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 24 | Checking Pending Activities Present in UCSM | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 25 | Health Check for IOM | PASS | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 26 | Core Files available in UCSM Check | Not Found | No core files were found in last 60 days |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 27 | Disjoint L2 potential misconfiguration | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 28 | VIC 1400 and 6400 Link Flap Issue | Not Found | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 29 | Check 2304 IOMs disconnect and re-connect during firmware update | Not Found | |
| | step | | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 30 | Number of Interface up and Flogi Matching on FI | --- | Primary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 5, |
| | | | Flogi Count: 12 |
| | | | Secondary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 5, |
| | | | Flogi Count: 12 |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
| 31 | Jumbo or Standard MTU Check | NOT_FOUND | |
+------+-------------------------------------------------------------------+------------+----------------------------------------------------------------+
Faults with Severity Major:
F0207: Adapter ether host interface 3/3/1/2 link state: down
F0207: Adapter ether host interface 3/3/1/4 link state: down
F0207: Adapter ether host interface 3/3/1/3 link state: down
F0283: ether VIF 1153 on server 3 / 3 of switch B down, reason: Admin config change
F0479: Virtual interface 1153 link state is down
We would recommend Customers should complete the below prior to an upgrade:
a. Review firmware release notes
b. Review compatibility
c. Upload required images
d. Generate/Review UCSM show tech
e. Determine vulnerable upgrade bugs and complete pro-active workaround
f. Verify FI HA and UCSM PMON status
g. Generate all configuration and full state backups (right before upgrade)
h. Verify data path is ready (right before upgrade)
i. Disable call home (right before upgrade)
NOTE:
a. All reports and logs will be saved in the same location from where the script was executed.
b. Please visit the Summary Report/ Main Report to view all the Major and Critical Fault alerts.
Conseil : pour un contrôle général de l'état de votre environnement UCS, le TAC Cisco ne fournit pas ce service. L'équipe Cisco CX Customer Delivery Team (anciennement appelée Advanced Services) propose une analyse des bogues et des risques. Si vous avez besoin de ce type de service, contactez votre équipe de vente/compte.
SSH vers les deux interconnexions de fabric :
# show cluster extended-state, verify HA status is ready.
# connect local-mgmt ; # show pmon state, Verify the services are in running status.
# connect nxos ; # show system internal flash, Verify free size in /var/sysmgr and /var/tmp
# connect nxos ; # show module, verify HW revision number for 6296 fabric interconnects.
# show fault detail | include F1219, verify this fault code for bootflash corruption
# show iom health status, displays health of IOM
# show server status, verify the status of server.
# scope monitoring; # scope sysdebug; # show cores , verify if there are any core files.
# scope security; # scope keyring default; #show detail, verify details for default keyring, expiry etc.
# connect nxos; # show int br | grep -v down | wc –l, verify the number of active Ethernet interfaces.
# scope security; # show authentication, review the authentication type.
# connect nxos; # show flogi database, review the flogi database.
Révision | Date de publication | Commentaires |
---|---|---|
4.0 |
11-Jul-2024 |
Titre mis à jour, Introduction, Texte de remplacement, Traduction automatique, Exigences de style, Ponctuation et mise en forme. |
3.0 |
28-Mar-2023 |
PII adressés.
Titre, introduction, texte de remplacement, traduction automatique, exigences de style, fonds et mise en forme mis à jour. |
2.0 |
20-Dec-2021 |
Ajout d'une remarque supplémentaire sur l'utilisation de l'outil. |
1.0 |
16-Dec-2021 |
Première publication |