소개
이 문서에서는 하드 드라이브에 구멍이 뚫린 블록의 의미를 설명합니다.It(It) 에서는 차단 구멍이 발생한 방법과 교정 단계에 대해서도 설명합니다.
구멍이 뚫린 블록이란?
Patrol Read 또는 Rebuild(패트롤 읽기) 작업에서 소스 드라이브에 미디어 오류가 발생하면 대상 드라이브에 있는 블록이 손상되어 데이터가 유효하지 않은 패리티를 사용하지 못하게 됩니다.오류가 발생한 블록에 대한 후속 읽기 작업이 완료되지만따라서 블록의 강도를 변경하면 나중에 이 블록을 사용하는 동안 잘못된 패리티 생성이 방지됩니다.
출처:12Gb/s MegaRAID® SAS 소프트웨어 사용 설명서, 개정판 F, 2014년 8월
구멍난 블록은 어떻게 발생합니까?
RAID5에서 데이터는 모든 멤버 디스크에 패리티 형태로 배포됩니다.이 경우 드라이브 중 하나가 잘못되면 모든 드라이브의 패리티를 계산하여 데이터를 다시 작성할 수 있습니다.몇 가지 원인이 될 수 있는 문제가 있지만, 일반적으로 RAID로 시작하는데, 이 RAID는 장애가 발생한 단일 드라이브가 있고 여러 가지 중간 오류가 있거나 예측 가능 장애 상태가 있습니다.
다음 링크에서는 어레이에 구멍이 뚫리는 방법을 설명하는 매우 좋은 시나리오를 제공합니다.
http://www.theprojectbot.com/what-is-a-punctured-raid-array
읽은 후에는 하드 디스크를 다른 디스크를 확인하지 않고 교체하면 잘못된 논리 블록 또는 미디어 오류가 재배치되고 다른 디스크가 모두 실패한 것으로 표시될 수 있다는 점을 분명히 알고 있어야 합니다.
구멍이 뚫린 블록은 여러 드라이브에서 발생할 수 있으며, 단 하나의 드라이브만 공식적으로 "고장"됩니다. 그런 다음 교체 디스크에 복제할 수 있으므로 문제가 더욱 복잡해집니다.
구멍이 뚫린 차단 증상
서버에서 여러 하드 드라이브 오류를 보고할 수 있습니다.단순히 하드 드라이브를 교체해도 문제가 해결되지 않습니다.또한 입출력 성능이 저하될 수 있습니다.
구멍이 뚫린 블록의 증거
로그에는 아래 행과 유사한 항목이 포함될 수 있습니다.
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 0c(e0x12/s5) Path 500000e11986c502, CDB: 28 00 0e 71 66 e7 00 00 19 00, Sense: 3/11/01
6:2014 Jul 27 00:36:06:BMC:storage:-: SLOT-5: Unexpected sense: PD 13(e0x12/s7) Path 50000395083063f6, CDB: 28 00 0e 71 66 eb 00 00 15 00, Sense: 3/11/14
위의 출력에서 e0x12/s5는 HDD5와 관련이 있음을 나타냅니다. 다음 링크는 감지 코드의 의미를 설명합니다(감지:3/11/14):
http://en.wikipedia.org/wiki/Key_Code_Qualifier
따라서 이 센서는 중간 오류를 나타냅니다.
다음 이벤트는 로그에서 방지할 수도 있습니다.
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Unrecoverable medium error during recovery on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 16 10:42:43:BMC:storage:-: SLOT-5: Puncturing bad block on PD 0c(e0x12/s5) at e7166e7
1:2014 Jul 19 03:46:22:BMC:storage:-: SLOT-5: Consistency Check detected uncorrectable multiple medium errors (PD 13(e0x12/s7) at e7166d9 on (null))
가능한 교정
자사가 완료된 블록이 있으면 언제든지 데이터 백업이 권장됩니다.위에서 언급한 메시지와 함께 표시되는 경우 장애가 발생한 실제 하드 드라이브를 찾아 교체하는 경향이 있을 수 있지만 잘못된 논리 블록이 여러 개 어레이에 분산될 가능성이 있습니다.장애가 있거나 장애가 발생한 하드 드라이브가 원인일 수 있지만, 손상된 가상 드라이브를 재구성해야만 구멍난 블록이 해결됩니다.
- 데이터 백업 생성
- RAID 어레이 컨피그레이션 지우기
- 처음부터 새 어레이 만들기
참고:참고:VD(가상 드라이브)를 생성하는 동안 FAST 초기화 대신 FULL/SLOW 초기화를 선택합니다.
- 운영 체제 재설치
- 데이터 백업을 복원합니다.
참고:하드 드라이브를 교체해도 구멍난 블록이 자동으로 고정되지 않습니다.장애가 발생한 드라이브가 있으면 교체해야 하며, 그렇지 않으면 RAID를 다시 작성해야 합니다.
구멍을 낸 블록 방지
- RAID 및 해당 구성원 드라이브의 상태를 모니터링합니다.
- 하드 드라이브를 교체하기 전에 컨트롤러 로그를 검토하십시오.
- Patrol Reads(패트롤 읽기) 및 Consistent Checks(일관성 검사)가 켜져 있고 실행 중인지 확인합니다(버그 CSCul22968에 대해 확인).