ファイルサーバのHDD調査

先週ガリガリ異音を発したうちのファイルサーバですが、その後異音は発生せず。
とはいえ気になるのでHDDを調査しました。



結論から言うと、怪しいと思ってたHDDはOK、安全と思っていたほうが怪しくなった。



 

先週調べた時点では2TBのHDD2つのうち、片方にSmartでCurrent_Pending_Sectorの値が16となっていることを確認しました。
Current_Pending_Sectorは現在異常があり、代替処理を待つセクタの総数。
要は1つ怪しげなHDDがある。

 

それでそっち側のデータをバックアップ。
で、週末にHDDのテストを実施。smartctlを使用し、以下のコマンドを実施。



smartctl -a -t long /dev/ad4



/dev/ad4が問題のあったHDD。
2TBのHDDのテストが終了するのに5時間ほどかかった。


-t shortで簡易テスト。




結果。

# 1 Extended offline Completed without error



※smartctlの結果を抜粋しています

Completed without error、つまりエラーなし、ということ。
このテスト後もCurrent_Pending_Sectorの値に変化はなかった。


その後、もう一回5時間かけてテストを行うも結果は一緒。
エラーなし。Current_Pending_Sectorの値も変化なし。


なので、エラーは出ているものの、無視できそうな気がする。
これならHDD交換しなくても済むかも!



よかった、よかったとかなりルンルン気分。
せっかくだから俺はもう一個のHDDもテストするぜ!と問題なかった方もテストしてみたんですよ。



smartctl -a -t long /dev/ad6



/dev/ad6はsmart上に特に問題になりそう値がなかったHDD。




結果。

 

# 1 Extended offline Completed: read failure

 


あれ・・・・・エラー出てるし・・・・
しかももともと0だったCurrent_Pending_Sectorが12になった。
とりあえずデータのバックアップを取得。


結局ファイルサーバの全バックアップを取ったことになった。

 

きっと気のせいともう一度テストを行うが、結果は一緒。
むしろCurrent_Pending_Sectorが27に増加。あちゃー。


結局両方のHDDにCurrent_Pending_Sectorが発生していることに。
片方はテストでエラー出ていませんが、もう片方は何か怪しい。
やっぱりHDD交換しないとダメかしら。



もともと2年単位でファイルサーバの見直ししていたから、そう考えると交換してもいいんですけどねぇ。
費用も時間もないけど、頑張って捻出してみるかなぁ。

 


カレンダー

<   2012年12月   >
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
contents by leSYN情報発信所EXTRA 作成した曲等はこちらから

カテゴリ

アーカイブ