先週ガリガリ異音を発したうちのファイルサーバですが、その後異音は発生せず。
とはいえ気になるのでHDDを調査しました。
結論から言うと、怪しいと思ってたHDDはOK、安全と思っていたほうが怪しくなった。
先週調べた時点では2TBのHDD2つのうち、片方にSmartでCurrent_Pending_Sectorの値が16となっていることを確認しました。
Current_Pending_Sectorは現在異常があり、代替処理を待つセクタの総数。
要は1つ怪しげなHDDがある。
それでそっち側のデータをバックアップ。
で、週末にHDDのテストを実施。smartctlを使用し、以下のコマンドを実施。
smartctl -a -t long /dev/ad4
/dev/ad4が問題のあったHDD。
2TBのHDDのテストが終了するのに5時間ほどかかった。
-t shortで簡易テスト。
結果。
# 1 Extended offline Completed without error
※smartctlの結果を抜粋しています
Completed without error、つまりエラーなし、ということ。
このテスト後もCurrent_Pending_Sectorの値に変化はなかった。
その後、もう一回5時間かけてテストを行うも結果は一緒。
エラーなし。Current_Pending_Sectorの値も変化なし。
なので、エラーは出ているものの、無視できそうな気がする。
これならHDD交換しなくても済むかも!
よかった、よかったとかなりルンルン気分。
せっかくだから俺はもう一個のHDDもテストするぜ!と問題なかった方もテストしてみたんですよ。
smartctl -a -t long /dev/ad6
/dev/ad6はsmart上に特に問題になりそう値がなかったHDD。
結果。
# 1 Extended offline Completed: read failure
あれ・・・・・エラー出てるし・・・・
しかももともと0だったCurrent_Pending_Sectorが12になった。
とりあえずデータのバックアップを取得。
結局ファイルサーバの全バックアップを取ったことになった。
きっと気のせいともう一度テストを行うが、結果は一緒。
むしろCurrent_Pending_Sectorが27に増加。あちゃー。
結局両方のHDDにCurrent_Pending_Sectorが発生していることに。
片方はテストでエラー出ていませんが、もう片方は何か怪しい。
やっぱりHDD交換しないとダメかしら。
もともと2年単位でファイルサーバの見直ししていたから、そう考えると交換してもいいんですけどねぇ。
費用も時間もないけど、頑張って捻出してみるかなぁ。