概要
本書では、ハード ドライブ上でパンクチャされたブロックの意味について説明します。これは、 また、パンクチャードブロックの発生方法と修復手順についても説明します。
パンクしたブロックとは
Patrol ReadまたはRebuild操作でソースドライブでメディアエラーが発生すると、ターゲットドライブ上のブロックにパンクが発生し、無効なパリティを持つデータが使用されないようにします。パンクしたブロックに対する後続の読み取り操作は完了しますが、エラーが発生します。したがって、ブロックのパンクチャリングにより、このブロックを使用している間に後で無効なパリティが生成されるのを防止できる。
送信元:12Gb/s MegaRAID® SASソフトウェアユーザガイド、Rev. F、2014年8月
パンクしたブロックはどのように発生しますか?
RAID5では、データはすべてのメンバーディスクにパリティ形式で分散されます。この場合、ドライブの1つに障害が発生すると、すべてのドライブのパリティを計算してデータを再構築できます。パンクを引き起こす原因はいくつかありますが、通常は、1つの障害が発生したドライブを持つRAIDから始まります。また、多くの中エラーが発生したドライブや予測障害の状態もあります。
次のリンクは、アレイがパンクチャドされる仕組みを説明する非常に良いシナリオを示しています。
http://www.theprojectbot.com/what-is-a-punctured-raid-array
読み込んだ後、ハードディスクを他のディスクをチェックせずに交換すると、一部の不良な論理ブロックまたはメディアエラーが再配置され、他のディスクのいずれかが失敗として表示される可能性があることを明確に理解しておく必要があります。
パンクしたブロックは複数のドライブで発生する可能性があり、公式に「障害が発生した」ドライブは1台だけです。 その後、交換ディスクに複製して、問題をさらに複雑にすることができます。
パンクしたブロック症状
サーバが複数のハードドライブの障害を報告する場合があります。ハードドライブを交換するだけでは、問題は解決しません。さらに、I/Oパフォーマンスが低下する可能性があります。
ブロックの破れた証拠
ログには、次のようなエントリが含まれる場合があります。
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 0c(e0x12/s5) Path 500000e11986c502, CDB: 28 00 0e 71 66 e7 00 00 19 00, Sense: 3/11/01
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 13(e0x12/s7) Path 50000395083063f6, CDB: 28 00 0e 71 66 eb 00 00 15 00, Sense: 3/11/14
上記の出力では、e0x12/s5は、HDD5に関連していることを示しています。次のリンクでは、センスコード(センス:3/11/14)。
http://en.wikipedia.org/wiki/Key_Code_Qualifier
したがって、このセンサーは中程度のエラーを示します。
ログに次のイベントが表示されないこともあります。
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Unrecoverable medium error during recovery on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Puncturing bad block on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 19 03:46:22:BMC:storage:-: SLOT-5: Consistency Check detected uncorrectable multiple medium errors (PD 13(e0x12/s7) at e7166d9 on (null))
可能な修復方法
パンクしたブロックが存在する場合は、必ずデータバックアップを行うことを強く推奨します。上記のメッセージが表示された場合、障害が発生している実際のハードドライブを探して交換する必要がありますが、アレイ全体に複数の不良な論理ブロックが分散している可能性があります。ハードドライブの障害または障害が原因である可能性がありますが、破損したブロックは、影響を受ける仮想ドライブを再構築することによってのみ解決されます。
- データバックアップの作成
- RAIDアレイ構成の消去
- 新しいアレイを最初から作成する
注:注:VD (仮想ドライブ)の作成中に、FAST初期化の代わりにFULL/SLOWイニシュレーションを選択します。
- オペレーティングシステムの再インストール
- データバックアップを復元します。
注:ハードドライブを交換しても、パンクしたブロック自体は修正されません。障害が発生したドライブがある場合は交換する必要があり、そうでなければRAIDを再構築する必要があります。
ブロックのパンク防止
- RAIDとそのメンバードライブの状態を監視します。
- ハードドライブを交換する前に、コントローラのログを確認します。
- Patrol ReadsとConsistency Checksがオンで実行されていることを確認します(バグCSCul22968に対してチェック)。