Introduzione
Questo articolo è un'estensione del documento "Nexus 7000 Supervisor 2/2E Compact Flash Failure Recovery" che risolve tutti i possibili scenari di errore. Questo documento può risultare utile nel caso in cui lo strumento di recupero flash non venga eseguito. È consigliabile disporre dell'accesso console al dispositivo per eseguire le modifiche. Inoltre, si consiglia di non apportare modifiche sotto il kernel Linux, che non è menzionato nel documento, in quanto ciò potrebbe avere un impatto sulle operazioni dello switch. Si consiglia una supervisione Cisco TAC.
Sfondo
Come spiegato nell'altro documento, ogni N7K supervisor 2/2E è dotato di due dispositivi flash eUSB in configurazione RAID1, uno primario e uno mirror. Insieme forniscono repository non volatili per le immagini di avvio, la configurazione di avvio e i dati persistenti delle applicazioni. In una situazione in cui il Raid si guasta per un supervisore nello chassis, eseguiamo lo strumento di recupero flash per risolvere la situazione. In quasi tutti i casi, si ricorre al ricaricamento/failover del supervisore, se lo strumento di recupero flash non funziona. In alcuni scenari è possibile risolvere questo problema senza dover eseguire un ricaricamento o un failover.
Prerequisiti
Requisiti
Cisco raccomanda la conoscenza dei metodi di sistema operativo Cisco Nexus, storage o recupero flash del disco e debug a livello Linux.
Componenti usati
Nexus serie 7000 switch
Sintomo
Il guasto Raid viene rilevato su un supervisore e durante il tentativo di recuperare la memoria flash per i supervisori interessati, appare l'errore seguente durante l'esecuzione dello strumento di recupero flash,
Lo stato di errore Raid sugli switch è diverso da 0xe1
ERROR: Cannot perform recovery. /dev/sdb has incorrect partition info.
ERROR: Disk /dev/sdb needs to be manually inspected for errors.
INFO: No recovery was attempted on module 5. All flashes left intact.
INFO: A detailed copy of the this log was saved as volatile:flash_repair_log_mod5.tgz.
Soluzione
caricare il plug-in di debug sullo switch per accedere alla shell linux,
Switch# load bootflash:n7000-s2-debug-sh.6.1.4a.gbin
Fare attenzione durante l'esecuzione dei comandi.
Una volta ricevuto il prompt di Linux, cercare la partizione interessata come indicato nel messaggio di errore. Nel nostro caso è /dev/sdb. Potrebbe trattarsi anche di altre partizioni.
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
Partizione mancante. Errore durante l'esecuzione dello strumento di ripristino. Creare manualmente la partizione mancante, con la stessa autorizzazione degli altri blocchi.
Linux(debug)# mknod -m 664 /dev/sdb b 8 16
Ora è possibile visualizzare la partizione sdb in /dev,
Linux(debug)# ls -l /dev/sd?
brw-r----- 1 root root 8, 0 Aug 28 2015 sda
brw-rw-r-- 1 root root 8, 16 May 26 07:31 sdb
brw-rw-r-- 1 root disk 8, 32 Dec 18 2013 sdc
brw-rw-r-- 1 root disk 8, 48 Dec 18 2013 sdd
brw-rw-r-- 1 root disk 8, 64 Dec 18 2013 sde
brw-rw-r-- 1 root disk 8, 80 Dec 18 2013 sdf
brw-rw-r-- 1 root disk 8, 96 Dec 18 2013 sdg
brw-rw-r-- 1 root disk 8, 112 Dec 18 2013 sdh
brw-rw-r-- 1 root disk 8, 128 Dec 18 2013 sdi
brw-rw-r-- 1 root disk 8, 144 Dec 18 2013 sdj
brw-rw-r-- 1 root disk 8, 160 Dec 18 2013 sdk
brw-rw-r-- 1 root disk 8, 176 Dec 18 2013 sdl
brw-rw-r-- 1 root disk 8, 192 Dec 18 2013 sdm
Uscire dalla shell di Linux ed eseguire nuovamente lo strumento di recupero flash.
Questa volta senza alcun messaggio di errore e il guasto Raid sul flash primario è stato recuperato (0xf0). Confermato lo stesso utilizzando il comando,
"slot x show system internal raid | i i cmos|block | head line 5"
Dovrebbe funzionare correttamente senza tali errori e dovrebbe essere in grado di recuperare il Supervisor interessato dallo stato di errore Raid. Se l'esecuzione dello strumento di ripristino continua a non riuscire, è possibile che ciò sia dovuto a un'altra causa o a un danneggiamento effettivo della partizione e che sia necessario ricorrere a un ricaricamento/failover.
Informazioni correlate