敢えて今SSDの欠点を見直してみる、という話。(3)性能の不安定性

 というワケで続きネタになってしまった第三弾。
 最終回は性能面について。

 3◇性能が不確実&未知数。

 端的に言ってしまうと、SSDの性能は誰にも分からない。
 新品ですらそう。更に使い込まれると不確定要素は増すという。

 この「性能が読めない」って話、エンタープライズの世界だと結構問題なんです。
 投資対効果をシビアに見るのがエンタープライズの世界なので、「わーい速い速い」で済むコンシューマとは違うんですよ。

 それではこれがHDDだとどうかと言われると、これがある程度は性能の見積もりが出来たりするんです。
 物理的に動くメカがある以上どう頑張っても一定以上の性能にはならないし、逆にどういう使い方しても一定以下にもならないので、メーカや世代が違ってもカタログスペックから推測出来るんですよ。

 つまり、HDDには性能見積もりに使えるだけの実績が既にあるが、SSDの実績はまだこれから作っていくというレベルなので。

 ちなみに、なんでこんなことになるかというと。
 SSDは同一コントローラを積んでる製品でもメーカが違うと性能傾向がバラバラだし、同一製品でもアクセスパターン次第でまた挙動が全然変わってしまうため、新品の状態ですら、実際に動かしてみないと「そのシステムでの」性能が未知数だったりするんですよ。
 更に、稼働を開始しても突然性能が落ちたり、また突然回復したり。
 一般論としてデータが埋まってくれば性能は落ちるのだが、そんな一般論で済む世界じゃないのですよ、エンタープライズは。

 ♯こういうことを言うと信用してくれない人も居るのだが、ファームが糞なSSDを使い込んでいくとHDD以下の性能になることすらあるんですよ、いやマジで。

 とはいえ、絶対値は兎も角相対的には値段が下がってきたのと、各社が実績を積んできた(=失敗しまくった)ことで製品の完成度が上がってきたことで、採用事例は増えてきてはいるんですよ。
 ブレイク目の前とは言い難いが、着実に勢力を伸ばしてはいる。
 エンタープライズSSDの現在はそんな状況です、はい。

 ◇

 エンタープライズといえば、FUSION-IOに代表されるエンタープライズPCI-Express SSDは相変わらず値段が高いですが。
 エンタープライズ向けを名乗る以上、どれだけ負荷が高くとも一定性能を確保する必要があるワケで、この最低性能の確保ってのはピーク性能と違って誤魔化しが効かない以上、どうしてもコストをかけざるを得ないワケです。
 コンシューマー向けでは殆どネタのような実装で見かけ上の性能を稼ぐのが流行ってますが、コレが出来ない世界なのですよ。

 ♯たまに本当にボッタクリな製品が出たりするが、そういうモノは割とあっさり消えまっせ。

 ◇

 以上、気の向くままに3項目書いてみましたが。
 取り敢えずコンシューマではどうでもいいかも知れないが、エンタープライズの世界ではこんなこともありますよ、という話でしたとさ。

Share

敢えて今SSDの欠点を見直してみる、という話。(2)データ信頼性

 というワケで続きネタになってしまったので第二弾。
 SSDの欠点も押さえつつ正しく活用した方が幸せだと思いますよ、という話。

 ◇

 前回は寿命ネタだが、今回はデータ信頼性ということで。 

 「SSDは動作中停電で保存済データが崩壊または消滅する可能性がある」

 これ意外と知られていない気がするが事実だし、個人的には(寿命より重い)最大の欠点だと思っている。

 ♯この話をすると必ず「フラッシュメモリの信頼性は・・・」ということを言い出す輩が出てくるのだが、メモリチップレベルの話なんかどうでも良くて。ここではSSDという製品の話をしているのですよ、念のため。

 で、何でこんなことが起こるのかといいますと。
 大雑把に言うと、SSDってPCからアクセスしていない間にも内部で勝手にデータを書き換えてたりするのですよ。
 この書換中に電源断を喰らうとデータが吹っ飛ぶ危険性があります。
 では何でそんなことしているのかって?
 そうしないとあっという間に性能がガタ落ちしてしまうから。

 物理的移動距離に制約されるHDDと違い、SSDではメモリチップ内にデータが綺麗に並んでいないと原理的に性能が落ちてしまう。
 読出はあまり気にならないのレベルなのだが、書込ではその構造上かなりトンでもないことになってしまう。

 で、何の工夫もなく書込で固まっていた=プチフリしていたのがいわゆる「第一世代」SSD。
 最近のSSDではファームウェアの工夫とDRAMキャッシュ搭載で、外部から書き込んでいる時でも急激に性能が落ちないようになっているワケです。

 その「ファームウェアの工夫」の一つが、PCからアクセスされていない間に内部でデータを整理=書き換えること。
 最近のSSDでは「使い込んでも性能が落ちない」という売り文句が良く見られるが、これはつまりそういうこと。
 これ逆に言うと、いつ書き込みしているのか外部から分からない、いつ電源OFFしていいのか分からない、ということです、はい。

 ♯ついでに言うとどの製品が実際にコレ(バックグラウンドメンテナンス)をやっているかも分からないという。

 勿論通常の使い方をしていれば、実際に電源が切れる前にOSからSSDにキャッシュフラッシュやスピンダウンのコマンドが飛んでくるので、これを見たSSDが動作を停止して、その後に実際に電源が切れるので、データ壊れることはない。
 が、HDDと同じノリで電プチをやってしまうと、運が悪けりゃデータを吹っ飛ばしかねないということ。

 ♯緊急時には電源OFFでなく再起動で。

 ちなみにエンタープライズ製品ではこの辺りどうなっているかというと。
 SSDの中に大きなキャパシタが入っていて、書換中に電源が吹っ飛んでも「その書き換えだけは最後まで完了する」だけの電力を確保しているのが普通。
 また、データ整理にしても、パフォーマンスやフラッシュメモリの寿命を犠牲にする代わりに「突然電源が落ちてもデータ不整合を起こさない」処理になっているのが普通。
 この2つの組み合わせ技で、

 ・普通にホストから書込中の停電なら書込完了までは何とかキャパシタの電力で持たせる
 ・データ整理中に停電してもフラッシュメモリ書込中でなければデータ不整合にならないのでセーフ
 ・運悪くデータ整理でフラッシュメモリに書込中でも書込完了まではキャパシタの電力で持たせる

 こんな風にデータを保護する構造になっている。
 で、最近ちらほら見かける「エンタープライズ品質を名乗って価格が高いクセにベンチマークでは書込が遅いSSD」の理由もこれ。
 結局このデータ保護の仕組みを作り込むのにカネがかかるし、パフォーマンスを上げようとすると更にデータ保護部分にカネがかかってしまうので、価格を抑えるためにパフォーマンスを妥協しているんですな。

 #Intel DC S3500なんて分かり易い例だと思う。

 ◇

 ・・・当方はECCメモリ信者でもあるぐらい「データそのものの信頼性」を重視しているので、多少表現がオーバーになっている(そして一般的にはコンシューマでは過剰レベルである)ことは重々承知ですが、でも実際そういう可能性があるからこそエンタープライズ品は対策がされているんですよ、と。

 さて、次は最終ネタ、性能の不安定性です。

Share

敢えて今SSDの欠点を見直してみる、という話。(1) 寿命

 さて、コンシューマ市場では既に確たる地位を築いたと言って良い、SSD。
 とはいえ、最近のコンシューマ向けSSDの宣伝文句なんかを見ていると、正直ゲンナリすることも。
 製品の利点しか訴えないのは広告としては当然なのかも知れないが・・・にしてもねぇ。

 #エンタープライズ向製品を実際に扱ったりしている身分としてはね。

 ということで、エンタープライズでSSDを活用しようとした際ブチ当たる「SSDの欠点」についてちょっと書いてみることに。
 コンシューマ向けではこの辺りは「無かったこと」になっているが、別に問題が解消されているワケではないですよ、念のため。

 ♯所詮コンシューマ向け製品の「信頼性」なんてその程度、というだけの話です、はい。

 主要なネタは以下の3つ。

 ・寿命
 ・データ信頼性
 ・性能の不確実性

 SSDには利点も多いからこそ現在でも勢力拡大の一途を辿っているワケなのだが、別に完璧なストレージというワケでもなんでもなく。
 欠点も押さえつつ正しく活用した方が幸せだと思いますよ、という話なんですわ、要するに。

 ♯念のため、別にSSDが嫌いなワケではないですよ・・・というか当方は自分では「かなり好き」だと思っていますが。
  但し一部の連中のSSD「信仰」には辟易しています、いやホント。

 ◇

 ということで、第一弾はド定番の「寿命」から。

 「SSDは寿命がある消耗品だということをお忘れ無く」

 ということです、はい。

 現在のエンタープライズSSD導入は多くの場合「使い潰すことが前提」ですよ、念のため。
 まぁ要するに「設計寿命に達したら交換する」ということで、普通は製品保証書込容量ですな。

 一方現在のコンシューマ向けSSDでは「寿命を気にする必要はない」ということが半ば常識になってます。
 これはあくまでも「普通のコンシューマはあんまり書き込まない」ということを前提(メーカにより20GB/日または40GB/日)としているから成り立っている論法でありまして。
 「普通でないコンシューマ」であるヲタやクリエイタの類が、SSDのメリットを最大限活かす使い方をしようものなら、そんな前提を突破するのは特段難しいことではない、ということは知っておいて良いと思いまっせ。

 ところが一方で、実際にはメーカー規定値を超える書込をしてもSSDって意外と壊れないんですよ。
 この「取り敢えず動いているからいいや」というのはエンタープライズでは許されなくともコンシューマでは大抵OKなのよね。
 これにもちゃんと理由がありますよ。

 ・フラッシュメモリそのものにかかる負荷は、アクセスパターンが違うと同一の書込量でも全然違う
 ・一般的なMLCフラッシュメモリの「実質的な」寿命はカタログ値より余裕がある

 一般的には、コンシューマで書込容量が多い場合、大容量のデータを一度にまとめて書き込むような使い方が多い。この使い方は意外とフラッシュメモリへの負荷が低かったり。
 逆に細切れに頻度高くデータを書き込むような使い方では、フラッシュメモリへの負荷がかなり高くなってしまう。即ちフラッシュメモリがどんどん消耗するので、コントローラがどれだけ頑張って負荷を軽減出来るかが各メーカの腕の見せ所となるワケですな。

 とはいえ、この「意外と壊れない」幸せな状況も崩壊目前なんですな、実は。
 というのも、フラッシュメモリはこれからも「値段が下がる代償として書換回数も激減する」というのが既定路線なので、そうなるとフラッシュメモリ単位での余裕がどうのなんて話は無くなってしまう。
 後はSSDメーカがどれだけ余裕を「仕込む」か、という話になってしまうのだが、価格競争になったらそんなモノも無くなりますよね、当然。

 というワケで、そう遠くないうちにSSDの書込寿命はカタログ値を保証するのが精一杯、という時代が来るんでないかと思っています、個人的にはね。

 #3D構造は上手くいけば現在の寿命レベルのまま容量を増やせる技術なのだが、はてさてどうなることやら。
  今丁度「2D微細化もう無理、3D行くわ」陣営と「2D微細化はあともう少しだけ行ける、3Dはそれから」陣営に二分されている状況だが、どちらにしても近い将来「3Dしかない」時代が来るので、そうなった時にフラッシュの信頼性ってのはどの程度が「標準」になっているんだかね。

 ◇

 さて、次は・・・と書いてみたら何か当初予定より長くなってしまったので、章分割。
 次の「データ信頼性」ネタは次記事で。

Share

HDDってどうよ、という話(後編)。

 取り敢えず、当方のHDDについての「実感」をちょっと書いてみる、続き。
 今回はHDDを長持ちさせるコツと、物置に使うのってどうよ、という話。

 ◇

 Q6:HDDが長持ちするコツは?
 A6:適温適湿適気、強固な固定、良質な電源、連続稼働、適時書換。

 HDDって使い方次第で本当に寿命が変わりますよ。
 ということで、取り敢えず以下5項目を挙げておきます。

 1・適温適湿適気。

 諸説あるが、当方のお薦めは30~35度ぐらい。温度高過ぎは当然駄目だが、流体軸受の流体=オイルは低温だと粘性が高くなるため軸へのストレスが高くなると言われているので。

 #ちなみに出始めの頃の流体軸受は時間経過による劣化が激しく、特に低温では粘性が急激に高くなってスピンアップ出来なくなるという障害が多発した。
  対策としてHDDを余熱して振動を与えてから起動する、というバッドノウハウがあったり。
  最近はここまで酷い話はあまり聞かないが、それでも流体軸受の経年劣化そのものは程度の差こそあれ現在でも不可避とのこと。

 また、湿度が低く、空気がキレイなことも重要。温度変化も少ない方が望ましい。

 あくまでも感覚値なのだが、ホコリっぽい部屋で使っているHDDは早死にし易い気がする。
 逆にホコリが少なく温度変化も少ない真っ当なデータセンタでは故障率が低いような。
 まぁ「ストレージが設置されるのにホコリっぽい場所」というのはご想像の通り一般的にその他の条件も劣悪なので(温度変化が大きい、雨が降ればすぐ高湿になる、床から振動が来る、電源フラフラ等挙げればキリない)、ホントにそれだけが原因かと言われると・・・だが。

 2・強固な固定。

 要するに振動を抑え込むということ。PC筐体に共振してブンブンいっするようなのはもう最悪の例。

 最近のデスクトップ機は防振ゴムを挟んで固定する方法をよく見るが、筐体に共振しないメリットがある一方で、設計がマズくてHDD自体は却って振動し易くなってしまっているという代物もあったりするので、その辺りは注意かな。

 3・良質な電源。

 ノイズやリップル、電圧変動が少ない電力を供給してあげましょう。

 4・連続稼働。

 先に書いた通り、起動停止の時にトラブる可能性が高いので、逆に言うと起動停止させなければトラブる可能性は低いということ。

 5・適時書換。

 これには2つの理由がある。以下の通り。

 理由1・磁気記録は経年劣化するものなので、劣化してエラーが出る前に新しいデータで上書きしましょう。
 理由2・頻繁に読書することでファームウェアがプラッタ記録状態を検査するタイミングを増やし、エラーセクタが出る前に代替させるようにしましょう。

 細かいことは次項で書きます。モロ被りなので。

 ◇

 Q7:HDDを光ディスクの代わりにデータ保存用にするのは?
 A7:はっきり言ってお薦めしない。

 最近HDDをストッカにしている人が増えている気がするが、HDDというのはデータ保存には向かないんですよ、ホントに。
 理由は以下の通り。

 ・HDDプラッタは通常数年程度、ハズレを引くと半年程度しか記録データが保たない。
 ・HDDの軸受は経年劣化する上、劣化すると直接的に物理クラッシュの原因になり得る。

 そもそもテープと比べても部品構成的にデータ保存向けではない上に、設計でもそんな用途は想定していないんですわ。
 それでもどうしてもHDDをストッカにするなら、以下のような点に留意して運用すると多少はマシではないかと。

 ・数か月に一度は全セクタのリードチェックを行い、更に暫く通電しておく。

 HDDは磁気記録である以上、記録原理「時間が経てば記録データが弱くなる」ことは避けられない。そしてデータが読み出せなくなればそれはエラーとなる。
 とはいえ通常は一度記録すれば数年程度なら全く問題無く読み出せるので、普通はあまり意識する必要はない。
 だが、希に半年程度で読出エラーになってしまうハズレなHDDがあるのもまた事実で、しかも実際にエラーになってみないとハズレであることが分からないという。

 ♯安かろう悪かろうのデスクトップ機だけなら兎も角、希にエンタープライズ機でもハズレが混ざってきたりするから油断ならない。

 そこで、数か月程度のインターバルでリードチェックをする意味はというと。
 昨今のHDDはリードしながら記録面の状況をチェックしていて、明らかに劣化しているようだと実際にエラーが出る前にセクタ代替したりセクタ上書きしたりしてフォローする仕組みになっているのですわ。
 この仕組みに発動してもらって、データを保全しようという話。
 暫く通電しておくというのは、このデータ保護の仕組みが「アクセスが暫く来ない時に動き出す」というファームウェア実装のHDDに対応する為。

 ♯RAIDでよく動いている冗長性確認のベリファイにはRAIDの論理整合性確保の他にこのデータ保護効果もあるのです。

 勿論この仕組みも完璧ではないので、HDDをデータ倉庫に使うことは本当にお薦めしないのだけど。
 昨今では他に大量のデータを安価&コンパクトに保存する方法も見当たらなかったりすることもあるので、仕方ない面もあるのかな・・・と。

 ◇

 まあ以上うだうだ書きましたが、最後には結局コレの要素が相当大きいです。

 「運」

 今更ソレかよ、と言われるかもしれないが、実感なんだから仕方がない。
 それだけバラツキの大きい製品なんです、HDDって。

 そういうモノとしておつきあいするのが一番大事、だと思います、はい。

 ◇

 最後に、例の会社(BlackBlaze)から新ネタで、機種別のレポートが出てきたので一言。
 かなりアクセス負荷軽い使い方してるんだろなと・・・24時間通電している以外はデスクトップに近い使い方に見える。

 そして各モデル別の故障率でも、当方の感覚と大方ズレてはいないかな、と。
 HGSTはハズレ機種&初期不良を喰らわなければ安定して長持ちするとか、WD Green 3TBは腐ってるとか。
 そして7K2000・7K3000・5K3000のド安定っぷりも数字で証明されてしまいましたと。
 逆に、ST3000DM001なんてもう少し安定していると思ってたのだが、結構壊れているのね。そんな印象無いのだけど・・・。

Share

HDDってどうよ、という話(前編)。

 某社がHDDの故障率がどーたらこーたらというレポートを発表したおかげで、これを話のネタに取り上げている各所で何か妄想繰り広げている人達が居た模様。
 エンタープライズHDDはカネの無駄だとか・・・まぁこういうこと言うのはモノも現場も知らない人間とほぼ相場は決まっているんですが。

 ♯これだけコスト削減圧力が強い中、ホントに無駄だったらエンタープライズHDDなんてとっくに消えてますわな。
  あとあのレポート、入っている情報量が少な過ぎて、正直何の参考にもなりませんて。

 取り敢えず、当方の「実感」をちょっと書いてみる。
 まあ結構な数のHDDを扱っているとはいえ、真面目に統計を取ったワケでもない「実感」なので。取り敢えず世間ではこれを出しておけばいいらしい?

 「意見には個人差があります」

 ということで。
 何か文章でちんたら書くとひたすら読みにくいので、QA方式で。

 ◇

 Q1:エンタープライズHDDは故障しないの?
 A1:がっつり故障します。つかホントもう少し故障率下げられないのかいな?>各社

 Q2:エンタープライズHDDは故障しにくいの?
 A2:ある程度負荷がかかる状況なら明らかに。

 ※当方には違和感があるのだが、最近ではニアラインもエンタープライズの領域に入れてしまうらしいので、以後そういう扱いで。

 本当に負荷が軽い使い方なら、デスクトップHDDとニアラインHDDで大差はないですな。
 だが、ある程度負荷がかかる(アクセス頻度が高い、使用時間が長い)使い方をするなら、エンタープライズ品の方がやはり優位と。

 ♯所詮は選別品でも、その程度の差は出るぐらいに品質のバラつきがあるんですよ。

 但し最近では、この辺りの考え方も変わってきていたりするのも事実ではある。

 一般的に、エンタープライズ品の価格の高さは、保証期間の長さや故障時の対応の手間というモノと引き換えというか釣り合いになって許容されている。
 この理屈が成り立つには、故障した時に交換出来るのは同一のHDDに限るとか、HDD交換の後はRAID再構築等の後処理が必要だとか、色々前提がついているのですよ。

 それでは、この前提が無ければどうなるか。
 故障したらその時一番安いHDDに交換すればいい、後処理は勝手に行われるから何も考えなくてよい、となると、デスクトップHDDが激安な故に故障率が高くとも結局トータルコストでは安くなる可能性がある。
 そして分散冗長化ストレージ等、そういうストレージを実現する仕掛けや仕組みもここ数年で俄然「使える」ようになってきた。

 レポートを発表した某社も結局この「実はデスクトップHDDを使い潰していった方がトータルコストで安い」というセンを狙っていて、今のところそれは上手くいっている、ということでしょう。

 ◇

 Q3:HDDが一番壊れやすいタイミングは?
 A3:スピンダウン・スピンアップ時。

 要するに物理的に大きな負荷がかかるタイミングですよ。

 プラッタという静止物を動かし始めるという慣性の法則に加え、軸受の摩擦もあるので、モータには一番負担がかかる。
 更に今では主流のランプロード方式でもプラッタに激突しないというだけで(注:語弊あり)、ヘッド待避・復帰には相応の負荷がかかる。

 #某社のIntelliParkのデフォ値は正直やり過ぎだと思う。

 あと「電源入れたら故障したので起動しない」という言い方を良く聞くが、結構な確率で「実は前から故障していて、再度電源を入れたからそれが発覚した」というのが正しい。
 メカ系にダメージが来ている場合、動かしている間は何とかギリギリ踏みとどまっていたが、電源を落としたら最後もうどうにもならない、再起動しようがない、なんてことは珍しくないので。

 ◇

 Q4:トラブルの原因で一番多いのは?
 A4:駄目ファーム。

 これはもう圧倒的に、ファームが原因のトラブル。
 一般にはIFとの相性程度で済むのだが、時々「特定のアクセスパターンを繰り返すと挙動が怪しくなる」なんていう超絶駄目ファームウェアすら平気でリリースされることすらあるのがこの業界ですよ。
 更に、ファームウェアのバージョンが変わったところで変更内容なんて公開されていないので、特定の不具合や相性が解消されたと思ったら今度はドライブの「癖」まで変わってしまって慌てる、なんてことも実際あったりする。

 注)デスクトップユースでは「あんまり」問題になりません。
   この項目についてはここの管理人の過去のイロイロな経験の恨み、ではなく感想が・・・。

 ◇

 Q5:最近のHDDカチャカチャうるさいのは何故。
 A5:プラッタ回転数を落として省電力モードに移行出来るよう、ヘッド退避させてるから。

 WDのIntelliParkが有名だが、それより前から2.5’では省電力と衝撃対策の為に実装されていたし、最近ではWDだけでなく他社でも実装されている機能。
 一定時間アクセスが無いとヘッドを退避させている音ですな。
 でも、何故ヘッドを退避させる必要があるのかってのは意外と知られていないらしいので。

 理由はというと、プラッタ回転数を落とすため。
 回転数が落ちればモータに供給する電力は少なくて済むため、省電力になるというワケです。

 但しこんなことをするとヘッドを浮かせるための浮力も不安定になっていまうため、放っておくとヘッドがプラッタに激突してクラッシュしてしまう。
 それでは困るので退避させる、というワケですな。
 同時に耐衝撃性も高くなるワケですが、3.5’ではあくまで副次的な効果なのに対し、2.5’では結構重要なポイントだったりします。

 ◇

 何か長くなってきたのでここで分割。
 お次のネタは「HDDが長持ちするコツは?」と「データ保存用にHDDってどうよ?」という話で。

Share