アカウント名:
パスワード:
# cat /proc/mdstat
むしろハードウェアRAIDカードの方に不信感を持ってますね。
んなわけあるかい。何のためのRAIDだよ。ドライブがこけたら勝手にデグレードモードになるっつーの。
不安定以前にカーネルがAPICを再初期化した時点で動かなくならないか?
一旦failマーク付けたらアクセス自体しなくなって勝手には復活しないので(2)があり得ない。
SMMIは完全にマスクできる。
少なくとも2.6以降のLinuxのsoftRAIDではアクセスできないセクタが発生してリトライが頻発した時点でfailにマークしちゃうし、
これは誤りです。I/Oのリトライはscsi(libata)やIDEドライバで行っているためmdドライバでfaultと判定する時点では既に何度かリトライして諦めた状態です。
sdのタイムアウトは30秒でリトライが5回なのでディスクから応答が無いときには2分30秒も待たされます。単純にタイムアウトしてくれればいいのですが、粘るディスクだと2分くらいでなんとか応答を返してくる場合もあり、こういう壊れ方をするとデグレードさせずに延々と遅いまま動き続けます。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
弘法筆を選ばず、アレゲはキーボードを選ぶ -- アレゲ研究家
まずもって目的を考えよ (スコア:-1, 荒らし)
- 演算サーバ
- ストレージサーバ
の2種類があります。演算サーバと言うのはようするに数値計算のようにメモリとCPUパワーは必要だがストレージは全然必要としない計算を専用にやるマシン。ストレージサーバは文字通りストレージとして機能し、データを保管するサーバです。普通のご家庭で演算サーバが必要だとは思えないし、例に出ているのもことごとくストレージサーバなので、ここからはストレージサーバだとしましょう。
ストレージサーバは大雑把に4種類あります。
高速ファイルサーバは、高速にIOする必要があるファイルを保存するためのものです。大抵の場合、複数の人間あるいは複数のマシン間で、「今作ったファイル」を共有するために使われます。
低速ファイルサーバは、「階層型ファイルシステム」を実装するときによく使います。高速なファイルシステムを大容量で作るのは非常に高コストです。しかし、全てのファイルを同じ頻度でアクセスするわけではありません。殆どのファイルは滅多にアクセスしないものなのです。そこで、滅多にアクセスしないファイルを、低速な、大容量のストレージを使って作った低速ファイルサーバに移動し、手元にある高速なファイルシステムの空き領域を増やそう、というのが「階層型ファイルシステム」の利用目的です。SubVersionのようなリビジョン管理システムも、大きなくくりではこの階層型ファイルシステムに属します。他の用途もあるかもしれませんが、ようするに「低速」「大容量」「低価格」の3拍子をそろえて、ビット保存単価を下げよう、と言うサーバです。
データベースサーバは…まぁ、文字通りですな。DBMSが動いているサーバです。普通の人がこれを必要とする場合はほとんどありません。
ブートサーバ…これも、普通の個人は要らないのでは…。今時のPCは BIOSレベルで PXE ブートと言うネットワーク経由でブートイメージ等を持ってくる機能があります。PC上にブートOSをインストールせずにサーバからのイメージでブートさせる事で、さまざまなOSでの実験に対応したりします。普通は何十台、何百台とある分散システムを管理するときに使います。個人がnotePCで使うことはまず絶対に無い。だってちょっと遠くに持っていくだけでそのPCはブートしないんですよ?? ちっともうれしくない。ブート用DVDとか持ち歩く人ならば別かもしれませんが…。
.
と言うわけで普通の人が必要とするのはファイルサーバです。
家族でファイルを共有するとか、ビデオを録画するとかそういう目的なら高速サーバ。SubVersionとかのサーバならば低速サーバでネットワークスピードは意識してもHDDの速度とかは考えない。そういう使い方がいいでしょう。
WikiとSubVersionサーバなら低速サーバですね。この場合、コツは次のようになります。
1) OSにWindowsはやめておけ。メモリの利用効率が悪すぎる。
2) メモリ1GbyteまでならFreeなunix系OS + 32bitCPU
3) メモリ2Gbyte以上ならFreeなunix系OS + 64bitCPU
2,3の違いは「カーネル空間の大きさの違い」です。この手のサーバはメモリの大半をファイルキャッシュに使います。LinuxやFreeBSDは32bit版の場合カーネル空間のサイズが1Gbyte程しかありません。なので1Gbyteを超えるメモリを与えられるならば、kernel空間がでかい64bit版OSを使うことになり、と言うことはCPUも64bitにせざるを得ないのです。たとえIntelのプロセッサがCorei7まで64bit命令を処理できるパイプラインが1つしかなく、脆弱極まりなかったとしても、です。
以上のことから、Atomを使ったサーバの場合 1Gbyte以上メモリを搭載しても効果的ではない、と言うことが判ります。また、大容量低速なHDDをRaid1などで多重化するのが利用方法として良いこと、速度を求めちゃいけない事なども見えてきます。
あ、ちなみに。LinuxのSoftRaidでRaid1を使うとPrimary HDDが死んでも、非常に高い確率で Primary を自動的に切り離す事ができません。つーかどれが死んだのか調べるだけでも一苦労です。死んだものが判ればマシンを停止して、死んだHDDを交換すればいいのですが…。なのでRaidを組む場合は上位で動いているOSとは全く独立したハードウェアRaidを使いましょう。BIOSを使った擬似HWRaidもやめておいたほうがいいです(バグでフリーズすると、OS等も全部巻き込まれます)。
ハードRaidを買えないなら、サーバ内に複数HDDを入れておいて、定期的に umount/snapshot を取ってddでコピーした後に mount…という手を使ったほうがまだましです。どうせ自分が自宅にいないときはサーバはサービスをしていないに等しいのですから、その間にバックアップを取ればよい。バックアップのしかたは dd よりも良い手があるでしょうし、それらは多分他の人が色々推奨するでしょう。
fjの教祖様
Re: (スコア:0)
# cat /proc/mdstat
自動的に切り離してホットスペアを入れてresync、までやろうとすると確かに割と大変ですね。
ただfailしたディスクは一発で分かるし、mdadmの機能でメール通知させることも可能です。
むしろハードウェアRAIDカードの方に不信感を持ってますね。
failしたデ
Re:まずもって目的を考えよ (スコア:1)
これは /home とかそういう「末端」が Raid 化している場合にしか使えません。 / がぶち飛んでいると、catも見つからないし、/proc も探せないのよ。その辺が考慮されていないのが、根本的な問題。
それは BIOS Raid では?カードだという事はPCIとかのスロットに挿すタイプでしょう?? それは十中八九擬似ハードRaid。このタイプは、CPUとして本体のプロセッサパワーをBIOSの制御モードで使おうとするので、ものすごく不安定です。一部機能をチップに押し出していてそちら自体はいいのだが、故障時のように例外処理が大量に発生すると、ボロボロ。
本当に本当のハードウェアRaidは、本体とPCとの接続には SATAとか SAS のケーブルしかありません。
fjの教祖様
Re:まずもって目的を考えよ (スコア:1)
んなわけあるかい。何のためのRAIDだよ。ドライブがこけたら勝手にデグレードモードになるっつーの。
そうならないのはRAIDとは言わない。
>本当に本当のハードウェアRaidは、本体とPCとの接続には SATAとか SAS のケーブルしかありません。
その場合の構成とRAIDボードをスロットに挿した場合、違いを考えてみたらおかしいとわかりそうなもんだけどな。
つまり拡張ボードであるかどうかは関係ない。てかイマドキBIOSをストレージの制御に使うOSってどのくらいあるよ。
その「疑似RAID」の作りだと不安定以前にカーネルがAPICを再初期化した時点で動かなくならないか?
Re:まずもって目的を考えよ (スコア:1)
「ドライブがこけた」事を実験するのに、HDD丸ごと引っこ抜く場合しか考えない人はよくそういう。が,それは間違いだ。
HDD障害で非常に多く発生するのは、bad sector の中でもTrack管理領域が死滅するケース。代替セクターの位置も記録できなくなって、IO不可能なセクターが出る。これが起こると、
1) retry が山のように発生してしまう
2) デグレードモードに落ちようとしてHDDの存在をチェックすると、ちゃんと生きていると返ってくるので復活してしまう
を繰り返すようになり、処理が全然前に進まなくなる。これはHDDが丸ごと応答しなくなるケースの1万倍近く多く発生する。
通常ファイルでも十分泣きたくなる状態(特に libc.so とか)に陥るが、メタデータ領域にこれを食らうとげんなり。
Raid1で4重化していたシステムが、この現象で立ち上がらなくなり、どれがおかしいのか1つづつ抜いてみるしかなかったときはもう…。 ならない。SMMコードが先に制御を取り返す。
fjの教祖様
Re:まずもって目的を考えよ (スコア:1)
勝手に想定するのは勝手だし、想定しないと話を進められないので勝手に想定する事自体は否定しないが、その想定は間違いだ。
まず、それはいつの話?
少なくとも2.6以降のLinuxのsoftRAIDではアクセスできないセクタが発生してリトライが頻発した時点でfailにマークしちゃうし、一旦failマーク付けたらアクセス自体しなくなって勝手には復活しないので(2)があり得ない。そもそもリトライを頻発するようなドライブにいつまでもアクセスしに行ってたら遅くてかなわん(=可用性を確保できてるとは言えない)。
failマークは揮発性なので再起動した時にドライブが見えてるとそのまま追加されてデータが壊れちゃうし(RAID1でも読む時はストライピングになるので一つでもデータが壊れてると読んだデータは壊れてる可能性がある)、あるいはswapもRAIDに置いてないと固まったりするけどな。まさかそんな状況の事は言ってないと思うけど、でも症状としては前者が非常に近いなぁ...ダメなのが入ってるとダメで、ダメなの抜けば直るとか。
>ならない。SMMコードが先に制御を取り返す。
SMMが動くためにはAPICでSMMIを許可しておく必要があるけどSMMIは完全にマスクできる。普通のLinuxがどうしてるかまでは知らんけど、ACPIで使うし許可してるかも知れんからそういう事もあるかも知れん(をれが仕事で扱ってるLinuxは普通じゃないのでSMMIは禁止してる)。
だけどハードRAIDがダメなのはそんな理由じゃない。壊れた時に復活できるハードが入手できないことがままあるのが決定的にダメで「不安定」とかの理由はそんなに大きくはない。不安定なら使わなきゃいいんだからデータは失われないけど、代替手段がないとデータが失われちゃう。softRAIDなら違うメーカーのハードであっても代替できるじゃん?
Re:まずもって目的を考えよ (スコア:1)
RHEL4でも5でも発生する事だ。そういう「実験しないで予想でモノをいう」のはやめよう。
ダウト。それはたまたまそういうBIOSバージョンに当たっているだけだ。
一般にはSMMIはBIOSによってロックされている。
fjの教祖様
Re:まずもって目的を考えよ (スコア:1)
これは誤りです。I/Oのリトライはscsi(libata)やIDEドライバで行っているためmdドライバでfaultと判定する時点では既に何度かリトライして諦めた状態です。
sdのタイムアウトは30秒でリトライが5回なのでディスクから応答が無いときには2分30秒も待たされます。単純にタイムアウトしてくれればいいのですが、粘るディスクだと2分くらいでなんとか応答を返してくる場合もあり、こういう壊れ方をするとデグレードさせずに延々と遅いまま動き続けます。
Re:まずもって目的を考えよ (スコア:1)
過去日記漁ってみ?
# かなり恥晒しではあるが根拠にはなってるよ?
>ダウト。それはたまたまそういうBIOSバージョンに当たっているだけだ。
>一般にはSMMIはBIOSによってロックされている。
(をれ自身が触ってるのはPCじゃないが)リアルタイムLinuxな仕事しててメイン開発者から出た話だから、そのくらいの信憑性はあると思うけど?
そもそもSMMI殺せなくてリアルタイムって言えると思う?
Re: (スコア:0)
安心した。筆者は親切だな。わざわざ正しいことを伝えてくれるなんて。
Re: (スコア:0)
失笑ものだ
Re: (スコア:0)
#1469203
とまるで複数いるように見せかけて、一人でのコメント乙。
ついでに言うと演算サーバという単語も知らないという辺りで馬脚、さらに乙。
Re:まずもって目的を考えよ (スコア:2, すばらしい洞察)
未だによく分からんのなら教えてやるが、自宅サーバの話をしてんのに、いきなり「演算サーバ」などとつまらん能書きを語り出して長い割に内容がない・間違っているのをつっこんでんだよ。だらだらとした長い文章の中で貴様も演算サーバは自宅サーバとしてはあり得ないと言う結論を出してるみたいだが、普通の人間はその課程までだらだらと文章にして他人様に垂れ流すような迷惑行為はやらねえんだよ。貴様の文章で他人に向いてる文章は一段落もないだろ。オナニーなら自分の巣でやれよ。
そこまで言わないと分からないのか?思考垂れ流しのまとまってない文章をだらだらと書いてんじゃねえよ。結論から書け。せめて他人に向けて文章を書け。ここはお前の公開オナニーの場じゃねえんだよ。それができないなら巣に帰れ。
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)
てすてす
Re:まずもって目的を考えよ (スコア:1, 参考になる)
Firefoxで先のコメント投稿してIEにOpera、Safariを試したけど全部ダメ
確かによく考えりゃ、News For Nerdsを名乗ってるのにこんなザルなわけないよな
Re: (スコア:0)
Re: (スコア:0)
NAPT経由でアクセスしている複数のACの誰かが書くたびに残りの人間が延々待たされるなんてあるわけ無いだろう。
それと一緒だ。