帰ってきた2Dベンチネタ。
今回はPCIe バス幅編。
手元の790FXはx32リンクをx8とx16にバラして使うことが出来ます。I/Oが欲しければx8を使えば良いという話。
ところが、昨今の超高速SSDブームで、x8リンクをRAIDに使うというのは珍しくなくなってきましたよ。
で、I/Oをよく見てたら・・・あれ?以前からネタにしてる3124を2スロット挿して、ローカルHDD用のRAIDを挿そうとしたら、VGAがx8になってしまいますよ。おや困った。
ということで、ここからが本題。
世間の大多数でx16駆動が大前提のVGAを、x8で動かした時、どれぐらい2D関係の速度が落ちるのか。
これをベンチマークで確認する、と。
ちなみに前回とはCPUがPhenom X4 9750、M/BがM3A79-T Deluxe(790FX)に変わってます。
前回ベンチ時はCPUがAthlonX2 5200+、M/BがGA-M55S-S3(nForce550)だったので、CPUパワーが格段に上がっている一方、VGA自体はPCIe 1.0のままなので、ボトルネックになる部分のバス幅は「理論的には」変わらない筈。
なお、ベンチマークソフトはこのblogでGF8500/8400ネタやった時からずっと変わらずのCrystalMark2004R3。
まずはGDIから。
| VGA | GDI | Text | Square | Circle | BitBlt |
|---|---|---|---|---|---|
| GeForce 7600GT x16 | 12655 | 1268 | 4665 | 1930 | 4880 |
| GeForce 7600GT x8 | 12497 | 1240 | 4605 | 1791 | 4803 |
| GeForce 7600GT x16 DualDisplay | 8377 | 1218 | 4137 | 1467 | 1567 |
| GeForce 7600GT x8 DualDisplay | 8310 | 1216 | 4087 | 1440 | 1519 |
次、D2D。
| VGA | D2D | 10 | 100 | 500 | 1000 | 5000 | 10000 |
|---|---|---|---|---|---|---|---|
| GeForce 7600GT x16 | 3549 | 480 | 324 | 132 | 75 | 17 | 9 |
| GeForce 7600GT x8 | 3536 | 473 | 321 | 132 | 75 | 17 | 9 |
| GeForce 7600GT x16 DualDisplay | 3519 | 470 | 318 | 130 | 75 | 17 | 9 |
| GeForce 7600GT x8 DualDisplay | 3514 | 467 | 318 | 130 | 75 | 17 | 9 |
ふむふむ、成る程。
全体的な傾向として、x8とx16で差が「無いワケではない」が「正直誤差程度」。選べる状況でわざわざx8を選ぶ必要は無いが、選べない状況をそう悲観する必要も無さそう。
ちなみに3Dの方はどうかというと・・・Tom’s Hardwareにちょっと古いがレーン数別でベンチ取ったネタが出てます。
これ見ると、3Dゲームで余程負荷かけまくったりしない限り、x8とx16の差は誤差程度。Tom’sでは更にx4でも計測して「x4あれば取り敢えず困らない」という結論。
とはいえPCIe x4ってちょっと考えてみればAGP 8xとほぼ同等なんだから、当然といえば当然か。
・・・というか、逆に考えると。
AGP 8xなんて「オーバースペック」と散々言われていたのに、今じゃその帯域は「必須」ということですか。
まあ勿論、このベンチの頃からは時間が経っているで、最新のゲーム相手にすると多分x8とx16の差はもう少し出るとは思うが。
取り敢えず、2Dメインならx8あれば困らない、ということで。
◇
つまり、790FXでPCIe16を4本持ってたり、790GXでPCIe16を2本持ってたり・・・なんて人は、ベンチマークで限界値に挑戦でもしない限りは、物理スロットを有効に使えます、と。
そうなると、俄然お薦めなのは広帯域I/Oですな。SSD+Hardware RAIDの組み合わせなんて超ゴキゲンですわな。
・・・ふむ、ではそのHardware RAIDは何がいいかね。
Adaptecの2405は低価格でSASも使えて速いんだが、いかんせんシステムとの相性出たら全く使い物にならないし、ArecaのはAdaptecより相性が緩いらしいがSATAオンリーでちょぃと高いし・・・。
・・・790FXでAdaptec 2405の使用実績は・・・MSIのはあるのか。
MSIだと790Xでの使用実績もありますな。
これなら行けるのかな?790FX+ASR-2405。
・・・あでもここにRAID挿すと、手元のM/BだとLANがオンボードのMarvellになっちまうのか。遅いのよねぇコレ・・・。
せめてもう一本x1があれば・・・う~む。
◇
P.S.
以前のベンチと見比べて貰うと全体的に数字が上がっているが、特にBitbltの数値向上が激しい。これやっぱり、Phenomだからか?
だとすると、以前騒がれた「790GXもっさり病はPhenomだと出ない」というネタと丁度符合するな・・・と。
Tags: 2DonGPU
RocketRaidとPMP。
さて、RocketRaidネタは続く。
前回は単発HDDを接続しただけの環境だったので、次は3726(PMP)経由での挙動をチェック。
ということで、まずはガサゴソと繋いで・・・と。
HDD3台では実測230MB/S超を確認。ふむ、PMPチップの速度限界までさくっと出てます。
ついでなので、PCIeリンクをx1認識に速度落として(2300相当にして)チェック。185MB/S、こんなもんか。
ちなみにシステム負荷は普通のIDEよりちょい重い程度(IDE互換@SB750でHDTune3.0~3.2%、mv_sataで3.6~3.8%)。
SiI3132がひたすら遅いとはいえ、SiI3124から引き継いだ「内部SCSI互換構造」のお陰でシステム負荷が1.5%程度に抑えられているのに比べるとだいぶ落ちるが、かといって特別高いというワケでもないので、こんなもんか、と。
但し、HDDの認識は明らかに遅い。単発の時はSiI3132と大差ない認識速度だったが、PMPの認識は非常に遅く、「あれ?」という感覚が。
ちなみにこの認識の遅さ、起動時のBIOSによる時も感じたが、Windows上からの認識は更に遅い。せっかちな人はイラッと来るかも。
ともあれ、PMP使用時も危険なダイアログが(HDDの数分だけ)表示される以外は特に何も問題なく、普通に使えていますな。
これでダイアログメッセージ抑止さえ出来れば、全く普通にガッチャンコ出来る拡張SATA I/Fとして使い物になるのに。あぁ勿体ない。
#ちなみにサポートには既に英文メール投げてみたが音沙汰無し。
これは大人しくNORCOが790FXで使えるようになるのを待つしかないか。
ベンチマーク値と、本当の性能と。
さて、光サービスがまだ現在程普通でなかった数年前、とてもホット「だった」(←過去形)話題の一つが、「ブロードバンドルータ」選び。
というのも、光回線でまともに使い物になる「ブロードバンドルータ」が市場に殆ど存在しなかったため。
それでは市場に多数存在した「ブロードバンドルータ」はどんな代物だったかというと、「ベンチマークは高速、でも実通信でちょっと負荷かかるとすぐ落ちる」というモノ。
まあ要するに、通信機器として本来一番重要な性能である「安定性」が「カタログに数字で表記できない」という理由で無視された結果、意味のない数字と低価格競争に陥ったということ。一言で言ってしまえば「通信機器としてのレベルに達していない」と。
とはいえ、そんな時代から「鉄板」「間違いない」と言われ続けていた製品が、マイクロ総合研究所のNetGenesisシリーズ。高速スループットと鉄壁の安定性を誇り、各社の光サービスのテスト等にも使用され、正に日本の家庭向け光サービスの開拓者と言っていい存在。
もちろん他にも安定性という意味ではヤマハのRTシリーズという選択肢もあり、こちらも業務用で鍛えられた別次元の安定性を誇っていたのだが、問題はコンシューマー向けではスループット向上が遅れていたこと。そのため本格的に光回線対応を謳ってきたRT57iまでは「ADSLには完璧なんだけど」と言われ続けていたんですな。
・・・とはいえ、実は速度という意味ではRT57iでもかなりイマイチで、光をフル活用するなら最新のRT58iが欲しいところだったりするのだけど。あと、RTは伝統的に比較的温度に弱い(熱暴走する)。
◇
長過ぎた前フリは置いといて。当方、今まではNetGenesis SuperOPT50を光回線用ルータにしていたんですな。鉄板の安定性の前に、7年以上も本当に不満が何もなかったので。勿論購入当初は正直「高ぇなぁ」とは思っていたものの、これだけ長く使えていれば正直安い買い物でしたな。
ところが、本日秋葉原をウロウロしていた時、某所にてNetGenesis SuperOPT90が捨て値で転がっているのを確認。状態も良かったのでうっかり確保してしまい、本日SuperOPT50と差し替えてみましたよ。
が、ここで大問題。何しろ今までも不満が無かったので、単純に設定を入れて置き換えただけでは、全く何も違いが分からない。仕方ないので、回線ベンチマークをしてみた。
前:SuperOPT50 → 45Mbps
今:SuperOPT90 → 67Mbps
お、違い出た。
ちなみにOPT50とOPT90は基本的に構成は一緒(なのでファームも一緒)で、CPUであるSH4のクロックが167MHz→240MHzと約50%増になったというもの。見事にCPU性能通りのベンチ結果ですな。
#ちなみにここの回線、業者がフレッツスクエアで確認した時は95Mbpsとか出ていたので、多分SuperOPT GFiveとか持ってくればそういう数字になると思われる。
◇
とはいえ・・・確かにベンチが速くなったのは確認出来たが、実際問題として全く差が分からん。
何というか、モノも悪くないし、金額的にも捨て値だったというのに、実に満足感の無い買い物でしたなぁ・・・と。
Sil3132遅いよ伝説。
さて、PCI-ExpressでSATAを増設しようと思ったら。或いはeSATAを増設しようと思ったら。
安くて入手し易い一品、Sil3132。
PMPにも対応して、HDD多数接続にも対応。いい感じ。
・・・なのだが、ドライバが悪いのかハードの出来が悪いのか、よく「速度が出ない」という話を聞く。
特にWindows環境ではドライバがタコなんでMacより速度が出ないとか何とか・・・。
で、実際どれだけ出ないのか、ベンチしてみましたよ、と。
その1。1ポートあたり。
ポートの先にはSil3726があって、HDDが複数ぶら下がっている。
なので、HD Tuneを複数起動して、複数HDDに同時アクセスをかけて合計値を見てみる。
結果:110MB/S。遅ぇっ。
その2、1枚あたり。
このボードは2ポートあるので、両方にHDDぶら下げて先程と同じようにベンチマーク。
結果:140MB/S。こっちも遅ぇっ。
ここで念のため断っておくが、110MB/Sという数字はSil3726の速度限界ではない。
少なくとも200MB/S程度は出せるというのが色々触ってみた感覚なのだが、細かいベンチを取ってるサイトを見つけたのでリンク。
SiI3124とポートマルチプライヤによるRAIDの構成例
>http://ettcweb0.aa0.netvolante.jp/tips/SiI3124RaidExample.html
Readで230MB/S、Writeで216MB/Sという数字が。3726、意外と優秀だ。
ということで、結論。
Sil3132、やっぱり遅い。
最近じゃピーク速度で110MB/Sなんて突破するHDDが珍しくないので、これじゃダメだよ、みたいな。
あと、2ポート分散しても140MB/Sってのは正直、かなりイマイチ感が。
速度がどうしても必要というなら、Sil3124にPCI-Bridgeかましたボード使うしかないのかしらん、やっぱり。
そうなるとボードも高いし(¥25Kは切らない)、PCI-Express Bridgeは鬼門だし(特にAMD系にとっては(ぉ)、それ以前に入手困難(このテのものは大得意なOLIOSPECですら入荷未定)なんだよなぁ・・・と。
かといってそれではHighPointのRocketRaidはというと、アレはRAID特化型カードなので、Sil3124のようなお手軽抜き差しが出来ないし。
そのRocketRaidと同じMarvellチップ繋がりで探してみると、Adaptecの1430SAは安いがPMPに対応していないのが致命的。
同じくMarvellチップの本来Mac向け、SONNETのTEMPO SATA E4PはWindowsでもPMP行けるし、カタログ読む限りではHotSwapも行ける気がするのだが、いかんせんお値段がとっても豪勢で、とてもじゃないがそう簡単に人柱とは・・・。
Tags: eSATA
e1000eが来た。 ~ベンチマーク編~
さて、前回さりげなくPRO/1000と書いてしまったが、その通り。ついにPRO/1000が来ましたよ。
というか、当初の予定ではお流れ(笑)の筈だったのだが、VLAN周りのトラブル発生で急遽導入されたというか。
しかも「どうせなら新しい方がいいや」という超テキトーな理論により、単品カードとしては出たばかりのe1000eの方を入手(オンボードでは少し前から出てるよね)。
あ、勿論デスクトップ版ですが何か(汗。
ということで、早速ベンチ。見せて貰おうか、Intelの実力とやらを。
| From | To | SEP OFF | SEP ON | |
| Yukon | → | e1000e | 840 Mbps | 200 Mbps |
| r8168 | → | e1000e | 750 Mbps | 200 Mbps |
| e1000e | → | Yukon | 830 Mbps | 210 Mbps |
| e1000e | → | r8168 | 800 Mbps | 210 Mbps |
| e1000e | → | e1000e | 690 Mbps | 210 Mbps |
そいや前回書き忘れたが、パラメータは以下の通り。
netperf -H -l 30 — -s 65536 -S 65536
・・・えっと。
e1000e対向が妙に遅いんですが。何だコレ。
それならば、取り敢えずRWIN拡大効果を見てみましょ。
netperf -H -l 30
| From | To | SEP OFF | |
| e1000e | → | e1000e | 850 Mbps |
・・・にしたって遅過ぎやしないか。これだけ世間で信仰を集めているIntelが。
あ、念のため、設定は結構詰めてますよ。というか、デフォだとe1000e対向で500Mbpsしか出ないので。
それでは次、CIFSの転送速度実験。
| From | To | SEP OFF | SEP ON | |
| Yukon | → | e1000e | 250 Mbps | 210 Mbps |
| r8168 | → | e1000e | 280 Mbps | 240 Mbps |
| e1000e | → | Yukon | 260 Mbps | 240 Mbps |
| e1000e | → | r8168 | 260 Mbps | 220 Mbps |
| e1000e | → | e1000e | 310 Mbps | 240 Mbps |
・・・こんなもの、なのか?
ということで、取り敢えず数字を取るのに疲れたので続きは次回。
Tags: GbE NIC
