Introduction
Cet article est une extension du document “ Nexus 7000 Supervisor 2/2E Compact Flash Failure Recovery ” qui traite de tous les scénarios de défaillance possibles. Il est possible que l'outil de récupération Flash ne fonctionne pas, ce document peut être utile. Il est recommandé de disposer d'un accès console au périphérique pour effectuer les modifications. En outre, il est fortement recommandé de ne pas apporter de modifications sous le noyau Linux, qui n'est pas mentionné dans le document, car cela peut avoir un impact sur les opérations du commutateur. La supervision du centre d'assistance technique Cisco est recommandée.
Fond
Comme expliqué dans l'autre document, chaque superviseur N7K 2/2E est équipé de 2 périphériques Flash eUSB en configuration RAID1, un principal et un miroir. Ensemble, ils fournissent des référentiels non volatils pour les images de démarrage, la configuration de démarrage et les données d'application persistantes. Dans une situation où le RAID échoue pour un superviseur dans le châssis, nous exécutons l'outil de récupération Flash, pour corriger la même chose. Dans presque tous les cas, nous avons recours au rechargement/échec sur le superviseur, si l'outil de récupération Flash ne fonctionne pas. Il est possible de résoudre ce problème sans rechargement/basculement dans certains cas.
Conditions préalables
Conditions requises
Cisco recommande que vous connaissiez Cisco Nexus OS, les méthodes de récupération de disque flash ou de stockage et le débogage au niveau Linux.
Components Used
Commutateurs Nexus, série 7000
Symptôme
Une défaillance de RAID est observée sur un superviseur et lors de la tentative de récupération de la mémoire Flash pour les superviseurs affectés, l'erreur suivante apparaît lors de l'exécution de l'outil de récupération Flash,
Les commutateurs tomberaient dans l'état de défaillance RAID avec le code d'erreur - 0xe1
ERROR: Cannot perform recovery. /dev/sdb has incorrect partition info.
ERROR: Disk /dev/sdb needs to be manually inspected for errors.
INFO: No recovery was attempted on module 5. All flashes left intact.
INFO: A detailed copy of the this log was saved as volatile:flash_repair_log_mod5.tgz.
Solution
Chargez le plug-in de débogage sur le commutateur, pour vous connecter au shell linux,
Switch# load bootflash:n7000-s2-debug-sh.6.1.4a.gbin
Soyez prudents lors de l'exécution des commandes ici.
Une fois l'invite linux affichée, recherchez la partition affectée en fonction du message d'erreur. Dans notre cas, c'est /dev/sdb. Il pourrait y avoir d'autres partitions aussi.
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
La partition est manquante, ce qui entraîne une erreur lors de l'exécution de l'outil de récupération. Créez manuellement la partition manquante, avec la même autorisation que les autres blocs.
Linux(debug)# mknod -m 664 /dev/sdb b 8 16
Maintenant, nous pouvons voir la partition sdb sous /dev,
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root root 8, 16 May 26 07:31 sdb
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
Quittez le shell linux et réexécutez l'outil de récupération Flash.
Cette fois, sans aucun message d'erreur et la défaillance Raid sur la mémoire flash principale a été récupérée (0xf0). Confirmé à l'aide de la commande,
"slot x show system internal raid | i i cmos|block | head line 5"
Il doit fonctionner correctement sans de telles erreurs et doit pouvoir récupérer le superviseur affecté de l'état d'échec Raid. Dans le cas où l'outil de récupération continue à échouer, il peut être dû à une autre raison, ou une corruption réelle avec la partition, et nous pouvons avoir à recourir à un rechargement/basculement.
Informations connexes