SMARTの値の読み方って意外と難しいよ、という話。

 本日はHDDのSMARTについてちょっとネタにしてみようかと。

 たまに「HDDのSMARTってどれぐらい役に立つの」ということを訊かれたりするのだが、こういう時当方はざっくりこんな感じで答えています。

 「まぁ無いよりはマシ程度ですか」

 というのも、コンシューマー向けモデルではSMARTの値なんてホント超適当なので。
 エンタープライズ向けでは多少は詳しい値が取れるものも多いが、それでも「この数字をどういう風に解釈すれば良いか」ということは、メーカやモデル毎の癖を把握していないと中々難しいことです、はい。

  ◇

 例えば、一番気になるであろう「不良セクタ数」(0x05)についてだけ見ても、当方が知っているだけで以下のような癖があったり。
 あ、当方の経験則というかそんなモノでしかないですよ、念のため。
 「意見には個人差があります」ってことで。

 #以降「読み取り」「書き込み」と書く際については、発生原因はI/O命令(要するに普通の読み書き)によるものか、ファームウェアが持っている自己検査・修復ルーチンに依るものかと2通りあるのだが、処理そのものについてはどちらでも同一のように見えるので、そういう風に解釈されたし。

 ◆SMARTの数字の意味が分かり易い例

 HGST全般・東芝全般・Seagateエンタープライズ・Samsungのモデルがおおよそこの傾向。
 ポイントは0xC5が減るのと0x05が増加するのが同期する点と、実際に訂正不能になる前にカウントされる点で、これを見ていれば劣化の進行具合が確認し易い。

 「代替待ちセクタ」(0xC5)増加条件
 →読み取り時にエラー訂正の範囲内でも、内部的にエラーレートが一定を超えた場合
 →読み取り時に訂正不能なエラー(IOエラー)が発生した場合

 「代替待ちセクタ」(0xC5)減少条件
 →不良セクタに対して書き込みが発行され、代替セクタが割り当てられた場合

 「不良セクタ数」(0x05)増加条件
 →不良セクタに対して書き込みが発行され、代替セクタが割り当てられた場合

 ◆SMARTの数字の意味が分かりにくい例

 Seagateコンシューマ・WD全般がおおよそこの傾向。
 ポイントはSMART上から劣化セクタ数が「消えて」しまう可能性がある(というか実感ではほぼ「消える」)こと、実際に訂正不能にならないとカウントされないことで、これでは傾向把握に役に立たない。

 「代替待ちセクタ」(0xC5)増加条件
 →読み取り時に訂正不能なエラー(IOエラー)が発生した場合

 「代替待ちセクタ」(0xC5)減少条件
 →不良セクタに対して書き込みが発行された場合、代替セクタが割り当てられるかどうかは不問

 「不良セクタ数」(0x05)増加条件
 →不良セクタに対して書き込みが発行され、代替セクタが割り当てられた場合

 ◇

 個人的にはこの分かりにくいSMARTの値もWDを敬遠する理由の一つだったり。
 要するに不良セクタで大量にマークされている筈なのに、完全初期化(いわゆる「ゼロフィル」)すると全部「無かったこと」になってしまう可能性があるという。

 とはいえ、一昔前のWDはもっと素直に0x05が増えていたと思うのだが。ここ数年のモデルでは明らかにSMARTの扱いがテキトーにしか見えないですわね。

 とまぁ以上、こんなこともありますよということで。

Share