[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[plamo:21953] Re: Diskの障害が発生しました。



こじま@昨日あたりから風邪でダウン中,,です.

From: ishiguro tatsuo <ishiguro@dainichi-net.co.jp>
Subject: [plamo:21951] Diskの障害が発生しました。
Date: Tue, 10 Feb 2004 11:34:33 +0900

> ダイニチ工業 石黒と申します。
> ちょっとDISK障害(EXT2)でショックな事例がありましたので、
> 一応、報告したいと思います。

イマイチ状況が飲み込めてないのですが,HDD はどういう構成でした? また,
ミラーリングはどことどこでやってたのでしょう?

> 何の前兆もなく突然、以下のメッセージを出して
> /dev/hdc の全てのパーティションの一部のファイル、ディレクトリ
> の内容が欠損してしまいました。
> このようなことは、よくあることでしょうか?

...snip...

> 【症状】以下のメッセージを繰り返して、吐いています。
> /var/log/messages
> Feb  5 03:00:26 izumi kernel: attempt to access beyond end of device
> Feb  5 03:00:26 izumi kernel: 16:08: rw=0, want=189094740, limit=13317853
> Feb  5 03:00:26 izumi kernel: dev 16:08 blksize=4096 blocknr=584144596
> sector=37
> 8189472 size=4096 count=1
> Feb  5 03:00:26 izumi kernel: attempt to access beyond end of device
> Feb  5 03:00:26 izumi kernel: 16:08: rw=0, want=498524280, limit=13317853
> Feb  5 03:00:26 izumi kernel: dev 16:08 blksize=4096 blocknr=-1485981667
> sector=
> 997048552 size=4096 count=1
> 

見た感じ,HDD のトラブルのようですね.その意味ではよくあることとも滅多
にないこととも言えそうな..

# HDD のトラブル自体は,(機械部品である限り)使い続ければほぼ 100% 発生
# する現象でしょうし,それがある一定期間の間に発生する可能性は MTBF 的
# に見れば滅多にないことだと言えそうだし.

自分では使ったことないんですが,ミラーリングの場合は書き込み時に 2 つ
のディスクに書き込みに行くはずなので,片方の HDD が壊れても,もう片方
にはデータは書き込まれているように思うのですが,今回の例では両方とも同
時にダメになっちゃったんでしょうか?

> 対策としては、定期的に別メディアにバックアップするとして、
> 、定期的にFsckすれば防げるのでしょうか?
> (これは、240日ほど連続運用してそのままの状態でした。)

HDD のトラブルだとすると fsck 云々の問題ではないでしょうね.HDD はいず
れは壊れるものだから別のメディアへのバックアップは必要ですが,最近だと 
HDD 以外に HDD のバックアップ先が無いのが結構つらいところ.

# 昔は,IDE HDD は相性があるから同じメーカーの HDD で揃える方がいいと
# いう話を聞きましたが,信頼性の観点から言うと異なるメーカーにした方が
# いい気もするなぁ..

さらに言うと,信頼性という観点では SCSI に比べて IDE はかなり低いよう
に聞いたことがあります.

# いわゆるサーバ用途の 24 時間 365 日ではなく,家庭用に一日 10 時間く
# らいの使用を前提にしていると聞いた気がする > IDE
# でも,ヘタに ON/OFF する方が HDD にとっては悪いような気もするなぁ..

> ちなみに、壊れたDiskを fsck -y /dev/hdcX したら
> 全て lost+foundに移動して、名前が変わってしまいました。

こうなるのはファイルシステムレベルで i-node の情報等が壊れた場合で,そ
れぞれの数字のファイルは元のファイルの断片になっているはず.

# 文章ファイルとかなら grep 等で漁りつつ復元することも不可能ではないで
# しょうが,バイナリなファイルだと難しいだろうなぁ..

でも,こうなるということは HDD 的には動作しているということなので,問
題がどこにあるのかは微妙な感じですね.

# 個人的には,ext2/ext3 の信頼性は HDD の MTBF よりも高い(= ファイルシ
# ステムよりも HDD が先に壊れる)と思っているのですが..

------
こじま

Follow-Ups
[plamo:21954] Re: Diskの障害が発生しました。, Takao Ono
[plamo:21955] Re: Diskの障害が発生しました。, Shun-ichi TAHARA (田原 俊一)
[plamo:21957] Re: Diskの障害が発生しました。, ishiguro tatsuo
References
[plamo:21951] Diskの障害が発生しました。, ishiguro tatsuo

[検索ページ] [メール一覧]
Plamo ML 公開システム