Introduction
Ce document décrit la signification d'un bloc perforé sur un disque dur. C'est décrit également comment un bloc perforé se produit et les étapes de correction.
Qu'est-ce qu'un bloc perforé ?
Lorsqu'une opération Patrol Read ou Rebuild rencontre une erreur de support sur le lecteur source, elle perçoit un bloc sur le lecteur cible pour empêcher l'utilisation des données avec une parité non valide. Toute opération de lecture ultérieure du bloc perforé se termine, mais avec une erreur. Par conséquent, la perforation d'un bloc empêche toute génération de parité non valide ultérieurement lors de l'utilisation de ce bloc.
Source : Guide de l'utilisateur du logiciel MegaRAID® SAS 12 Gbit/s, Rev. F, août 2014
Comment les blocs perforés arrivent-ils ?
Dans RAID5, les données sont distribuées sous forme de parité sur tous les disques membres. Dans ce cas, si l'un des lecteurs est défectueux, les données peuvent être reconstruites en calculant la parité sur l'ensemble du lecteur. Il y a plusieurs choses qui peuvent causer une perforation, mais elle commence généralement par un RAID qui a un seul disque en panne qui a également un lecteur avec de nombreuses erreurs de support ou dans un état de défaillance prédictive.
Le lien suivant fournit un très bon scénario où il explique comment un tableau peut être perforé :
http://www.theprojectbot.com/what-is-a-punctured-raid-array
Après l'avoir lu, vous devez avoir une idée claire que lorsqu'un disque dur est remplacé sans vérifier les autres disques, des blocs logiques ou des erreurs de support défectueux ont été déplacés, et que les autres disques peuvent apparaître comme défaillants.
Un bloc perforé peut se produire sur plusieurs disques, avec un seul disque officiellement en panne. Il est ensuite possible de les répliquer sur des disques de remplacement, ce qui ajoute encore au problème.
Symptômes de bloc perforé
Le serveur peut signaler plusieurs défaillances de disque dur. Le simple remplacement du disque dur NE corrigera PAS le problème. En outre, les performances d'E/S peuvent être dégradées.
Preuve d'un bloc perforé
Les journaux peuvent contenir des entrées similaires aux lignes ci-dessous.
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 0c(e0x12/s5) Path 500000e11986c502, CDB: 28 00 0e 71 66 e7 00 00 19 00, Sense: 3/11/01
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 13(e0x12/s7) Path 50000395083063f6, CDB: 28 00 0e 71 66 eb 00 00 15 00, Sense: 3/11/14
Dans le résultat ci-dessus, e0x12/s5 indique qu'il se rapporte au HDD5. Le lien suivant décrit la signification du code de sens (Sense : 11/03/2014) :
http://en.wikipedia.org/wiki/Key_Code_Qualifier
Par conséquent, ce capteur indique des erreurs moyennes.
Les événements suivants peuvent également être évités dans les journaux :
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Unrecoverable medium error during recovery on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Puncturing bad block on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 19 03:46:22:BMC:storage:-: SLOT-5: Consistency Check detected uncorrectable multiple medium errors (PD 13(e0x12/s7) at e7166d9 on (null))
Correction possible
Chaque fois que des blocs perforés se présentent, les sauvegardes de données sont fortement recommandées. Lorsque les messages mentionnés ci-dessus sont présentés, il est possible que l'on cherche le disque dur défectueux et qu'on le remplace, mais il est possible que plusieurs blocs logiques défectueux aient été répartis sur la baie. Bien que des disques durs défectueux ou défectueux aient pu être la cause de cette panne, les blocs perforés ne seront résolus qu'en reconstruisant les disques virtuels affectés.
- Créer une sauvegarde des données
- Effacer la configuration de la baie RAID
- Créer un tableau à partir de zéro
Note: Note: Lors de la création de VD (Virtual Drive), sélectionnez l'initialisation FULL/SLOW au lieu de l'initialisation FAST.
- Réinstaller le système d'exploitation
- Restaurer la sauvegarde des données.
Note: Le remplacement des disques durs NE réparera PAS les blocs perforés par lui-même. En cas de défaillance d'un lecteur, il doit être remplacé, sinon le RAID doit être reconstruit.
Prévention des blocs perforés
- Surveillez les RAID et l'état de leurs disques membres.
- Avant de remplacer un disque dur, consultez les journaux du contrôleur.
- Assurez-vous que les lectures de patrouille et les vérifications de cohérence sont activées et en cours d'exécution (vérifiez le bogue CSCul22968).