技術的考察

/ 特設 / Seagate / 技術的考察 – 09.01.26

根本的問題の所在

 個人的な状況判断では、今回の問題における根本原因は

  • 特にBrinks世代(333GB/375GBプラッタ品)で顕著になった品質低下

 これに尽きると思っている。
 具体的には以下のような状況を指している。

  • Brinks世代では多数のロットにおいてハードウェアに極端な品質低下があるが、品質管理が行き届かずそのまま出荷されている
  • そもそもハードウェアに変更やエラッタ(不良)があり、ファームウェアで対処しなければならないにも関わらず、肝心のファームウェアも完成度が低いまま出荷されてしまっている

 Brinks世代の不良発生率については、海外ニュースサイトに掲載されているOnTrack社長の指摘(30%:Seagate広報は否定)はいくら何でも大袈裟過ぎるとは思う。

 #ちなみにSeagateが提供しているSeatoolsはOnTrack製。ここはデータ復旧専門会社。

 一方、当方の個人的感覚として「出回ってる絶対数の割には妙にトラブルが多いな」という印象は確かにある。この「トラブル」というのは、純粋にハードウェアによるもの(プラッタ不良等)、ファームウェアが絡むもの(相性、制御不良等)、双方を含む。
 そしてどうやら、この印象は当方だけが抱いているものでは無い。

実際に発現した事象

 次に、実際に発現した事象を確認する。

  1. ファームウェアがバグを抱えていたため、キャッシュ周辺で問題が発生
  2. ハードウェア・ソフトウェア双方の問題により、インターフェイス互換性や内部エラー等複数(多数)の問題が発生
  3. Moose世代(250GBプラッタ品)から引き継がれた、1/320の確率で発動するロシアンルーレットのようなファームウェアのバグが発動

 1.は既に1.5TBで顕著になり、個別のテクニカルサポートでは対処法としてファームウェアのアップデートが指示されている。今回のアップデートではついでに解消する範囲に含まれる模様。

 2.は世界中で報告されている症状。Brinks世代のファームが怒濤のアップデートを繰り返したのは、この問題への対処と思われるが、未だに対処完了と言える完成度には至ってないように見える。

 3.が今回の騒ぎの原因。恐らくMoose世代では大問題にはならなかったものが、2.の問題のせいで顕在化してしまったものと思われる。

 さてここで3.の「1/320の確率で発動するロシアンルーレットのようなバグ」の情報の出所が問題になるのだが、これはmaxtormanと名乗る自称Seagate技術者によるslashdotへの投稿である。

 勿論、slashdotの捨てアカウントでの投稿自体の信頼性など皆無に等しいのだが、ここの管理人は当該IDにおける一連のやり取りに一通り目を通した結果、それなりに信用に値すると判断している。

 また、現在英語サポートサイトに掲載されている記述によると、ファームアップデートで解決される問題は「電源切断時に発生する」とされているが、この事象はmaxtormanの投稿による障害発生メカニズムと一致することも、管理人の判断に影響を与えている。

今回のアップデートの内容

 以上より、管理人は今回のアップデートについて、以下のように解釈する。

  • 1/320のロシアンルーレットでドライブがロックされるバグの修正のみ。

 上記で言うところの3.が該当する。

 勿論、最新ファームがベースになっているため、今回とは関係ない過去のファームアップデートにて更新された分も当然反映されている。
 そういう意味では一部2.も内包されてはいるが、これはSeagate社の言うところの「通常の改良の範囲」であり、根本的な問題ではない。

 とはいえ、この「通常の改良の範囲」の中に、個人的には重要性が高いと思われる更新もいくつか導入されている模様なのだが。

Share