e1000 (not”e”)が来た。～考察編～

Posted on 2009 年 3 月 23 日2011 年 3 月 21 日 by S.Kaz

　e1000、別名PRO/1000 PTが来たので測ってみた、その続き。
　まずは、e1000eの時とe1000の時の表を合体させてみた。

From		To	netperf	CIFS SEP OFF
From		To	Jumbo Frame		Normal
e1000	→	e1000	640 Mbps	310 Mbps	350 Mbps
e1000	→	Yukon	850 Mbps	330 Mbps
e1000	→	r8168	870 Mbps	340 Mbps
e1000	→	e1000e		320 Mbps	350 Mbps
Yukon	→	e1000	840 Mbps	300 Mbps
Yukon	→	Yukon	700 Mbps	270 Mbps
Yukon	→	r8168	750 Mbps	270 Mbps
Yukon	→	e1000e	840 Mbps	250 Mbps
r8168	→	e1000	850 Mbps	320 Mbps
r8168	→	Yukon	630 Mbps	290 Mbps
r8168	→	e1000e	750 Mbps	280 Mbps
e1000e	→	e1000		300 Mbps	330 Mbps
e1000e	→	Yukon	830 Mbps	260 Mbps
e1000e	→	r8168	800 Mbps	260 Mbps
e1000e	→	e1000e	690 Mbps	310 Mbps

　で、色々と見える傾向をチェックしてみた。

・Intel同士を対向させるとnetperfの数字が低いのは仕様らしい。
　更にJumboFrame有無で数字がかなり変わる模様。
　e1000eの時はそこを疑いもしなかったのでベンチの数字が無いのが残念。

・一方、Intelと他のNICの組み合わせではJumboFrame有効でもnetperfで問題ない数字が出ている。
　但し、平均より上程度であって決して劇的に速いワケではない。

・e1000とe1000eを比べた場合、明確にe1000の方が性能は良い。
　成る程、e1000eがデスクトップ版しか無いワケだ。

・e1000、e1000e共に、受信部がJumboFrameの処理に弱い。
　CPU負荷がかなり下がるのと引き替えに、CIFS実効で30Mbps程度の速度低下を引き起こす。
　Intel対向のJumboFrameが速度が出ないのはこの受信部の弱さのため。

・e1000の送信部は他のNICと比べ確実に速度が出る。
　対してe1000eの送信部は他のNICと比べても並かそれ以下。

・r8168ことギ蟹とe1000は妙に相性がいい。
　これ絶対r8168側がドライバでチューンして来てるんだと思う。

　◇

　結論。

　どうせIntel買うならPRO/1000 PT Desktop。
　Gigabit CT Desktopはちょっとは￥が安いが、引き替えに性能はだいぶ落ちる。

　確かにPTの方が消費電力は高いが、平均で1Wちょいの差程度はシステム全体の消費電力から見れば大抵は大問題にはならない。
　また、PTは大きめのヒートシンクが付いているが、これも実は大して熱くならないので、よっぽど小さい箱に詰め込んだりしなければ、まず問題にならないと思われる。

　・・・まぁ、廉価版PCI-E GbE NIC定番のMarvell（￥3,500程度）に、もう少し（￥1,000程度）足せば安定したドライバとIntelブランドが手に入りますよ、安くてお買い得でしょ、というのがCTの位置付けなのかも知れないが。
　一度この性能差を見てしまうと、更にもう少し（￥1,000程度）足せば手が届くPTのを方を敢えて選ばない理由が、ねぇ。
　せめてMarvellと並ぶぐらいの価格が付いているなら兎も角。基板の構成からして頑張ればその値段で売れる程度のものだと思うのだけど。

　・・・つーか知ってたらGigabit CTなんて買わなかったなぁ。失敗した・・・。
　まあドライバは安定しているし、VLANも問題なく使えてるし、実際使っていて性能問題が出ているワケじゃないから、いいと言えばいいんだけどさ・・・。

e1000 (not”e”)が来た。～ベンチマーク編～

Posted on 2009 年 3 月 20 日2011 年 3 月 21 日 by S.Kaz

　世の中色々あるものでして。
　ついにと言うか、PRO/1000 PTを手にすることになってしまいましたよ。
　ということで、れっつべんち。

From		To	SEP OFF	SEP ON
e1000	→	e1000	640 Mbps	230 Mbps

　な、何かの間違いじゃないの？この遅さ。
　それでは、RWIN拡大効果を見てみますか。
　netperf -H -l 30

From		To	SEP OFF
e1000	→	e1000	685 Mbps

　や、やっぱ遅い。何で・・・いわゆるベンチ向け設定になってるのに。
　・・・って、もしかしてコレか？Jumbo Frame OFF、と。

From		To	SEP OFF
e1000	→	e1000	845 Mbps

　ビンゴ。何だこりゃ。
　速度上がってる分＋パケットが小さい分、CPU負荷がドカンと上がるのがちと悲しいが、こちらが多分本来の性能だよね。

　それでは、JumoFrame ON／OFFでベンチしてみましたよ。全部SEPはOFF。

From		To	9014byte	OFF
Yukon	→	e1000	840 Mbps	840 Mbps
r8168	→	e1000	850 Mbps	850 Mbps
e1000	→	Yukon	850 Mbps	840 Mbps
e1000	→	r8168	870 Mbps	875 Mbps

　CPU負荷にはそれなりに差があるが、速度面では誤差程度しか出ていない。う～む。
　んじゃJumbo Frame ONのままでいいや、ということで次はCIFSのベンチマーク。

From		To	SEP OFF	SEP ON
Yukon	→	e1000	300 Mbps	280 Mbps
r8168	→	e1000	320 Mbps	280 Mbps
e1000e	→	e1000	300 Mbps	250 Mbps
e1000	→	Yukon	330 Mbps	280 Mbps
e1000	→	r8168	340 Mbps	280 Mbps
e1000	→	e1000e	320 Mbps	290 Mbps
e1000	→	e1000	310 Mbps	270 Mbps

　ありゃ、またしてもe1000対向が妙に遅い。
　JumboFrame OFFにしてみるか。

From		To	SEP OFF	SEP ON
e1000	→	e1000	350 Mbps	300 Mbps
e1000e	→	e1000	330 Mbps	280 Mbps
e1000	→	e1000e	350 Mbps	290 Mbps

　・・・え～っと。netperfでは遅くともCIFSでは速いのね、Intel。
　だというのに、CIFSでもJumboFrame OFFの方が速いのか。
　e1000eとも絡めて、考察は次回へ。

帰ってきた2Dベンチネタ。

Posted on 2009 年 3 月 16 日2011 年 3 月 21 日 by S.Kaz

　今回はPCIe バス幅編。

　手元の790FXはx32リンクをx8とx16にバラして使うことが出来ます。I/Oが欲しければx8を使えば良いという話。
　ところが、昨今の超高速SSDブームで、x8リンクをRAIDに使うというのは珍しくなくなってきましたよ。
　で、I/Oをよく見てたら・・・あれ？以前からネタにしてる3124を2スロット挿して、ローカルHDD用のRAIDを挿そうとしたら、VGAがx8になってしまいますよ。おや困った。

　ということで、ここからが本題。
　世間の大多数でx16駆動が大前提のVGAを、x8で動かした時、どれぐらい2D関係の速度が落ちるのか。
　これをベンチマークで確認する、と。

　ちなみに前回とはCPUがPhenom X4 9750、M/BがM3A79-T Deluxe（790FX）に変わってます。
　前回ベンチ時はCPUがAthlonX2 5200＋、M/BがGA-M55S-S3（nForce550）だったので、CPUパワーが格段に上がっている一方、VGA自体はPCIe 1.0のままなので、ボトルネックになる部分のバス幅は「理論的には」変わらない筈。

　なお、ベンチマークソフトはこのblogでGF8500／8400ネタやった時からずっと変わらずのCrystalMark2004R3。

　まずはGDIから。

VGA	GDI	Text	Square	Circle	BitBlt
GeForce 7600GT x16	12655	1268	4665	1930	4880
GeForce 7600GT x8	12497	1240	4605	1791	4803
GeForce 7600GT x16 DualDisplay	8377	1218	4137	1467	1567
GeForce 7600GT x8 DualDisplay	8310	1216	4087	1440	1519

　次、D2D。

VGA	D2D	10	100	500	1000	5000	10000
GeForce 7600GT x16	3549	480	324	132	75	17	9
GeForce 7600GT x8	3536	473	321	132	75	17	9
GeForce 7600GT x16 DualDisplay	3519	470	318	130	75	17	9
GeForce 7600GT x8 DualDisplay	3514	467	318	130	75	17	9

　ふむふむ、成る程。
　全体的な傾向として、x8とx16で差が「無いワケではない」が「正直誤差程度」。選べる状況でわざわざx8を選ぶ必要は無いが、選べない状況をそう悲観する必要も無さそう。

　ちなみに3Dの方はどうかというと・・・Tom’s Hardwareにちょっと古いがレーン数別でベンチ取ったネタが出てます。
　これ見ると、3Dゲームで余程負荷かけまくったりしない限り、x8とx16の差は誤差程度。Tom’sでは更にx4でも計測して「x4あれば取り敢えず困らない」という結論。

　とはいえPCIe x4ってちょっと考えてみればAGP 8xとほぼ同等なんだから、当然といえば当然か。
　・・・というか、逆に考えると。
　AGP 8xなんて「オーバースペック」と散々言われていたのに、今じゃその帯域は「必須」ということですか。

　まあ勿論、このベンチの頃からは時間が経っているで、最新のゲーム相手にすると多分x8とx16の差はもう少し出るとは思うが。

　取り敢えず、2Dメインならx8あれば困らない、ということで。

　◇

　つまり、790FXでPCIe16を4本持ってたり、790GXでPCIe16を2本持ってたり・・・なんて人は、ベンチマークで限界値に挑戦でもしない限りは、物理スロットを有効に使えます、と。
　そうなると、俄然お薦めなのは広帯域I/Oですな。SSD＋Hardware RAIDの組み合わせなんて超ゴキゲンですわな。
　
　・・・ふむ、ではそのHardware RAIDは何がいいかね。
　Adaptecの2405は低価格でSASも使えて速いんだが、いかんせんシステムとの相性出たら全く使い物にならないし、ArecaのはAdaptecより相性が緩いらしいがSATAオンリーでちょぃと高いし・・・。

　・・・790FXでAdaptec 2405の使用実績は・・・MSIのはあるのか。
　MSIだと790Xでの使用実績もありますな。
　これなら行けるのかな？790FX＋ASR-2405。

　・・・あでもここにRAID挿すと、手元のM/BだとLANがオンボードのMarvellになっちまうのか。遅いのよねぇコレ・・・。
　せめてもう一本x1があれば・・・う～む。

　◇

　P.S.　

　以前のベンチと見比べて貰うと全体的に数字が上がっているが、特にBitbltの数値向上が激しい。これやっぱり、Phenomだからか？
　だとすると、以前騒がれた「790GXもっさり病はPhenomだと出ない」というネタと丁度符合するな・・・と。

RocketRaidとPMP。

Posted on 2009 年 2 月 18 日2011 年 3 月 21 日 by S.Kaz

　さて、RocketRaidネタは続く。
　前回は単発HDDを接続しただけの環境だったので、次は3726（PMP）経由での挙動をチェック。
　ということで、まずはガサゴソと繋いで・・・と。

　HDD3台では実測230MB／S超を確認。ふむ、PMPチップの速度限界までさくっと出てます。
　ついでなので、PCIeリンクをx1認識に速度落として（2300相当にして）チェック。185MB／S、こんなもんか。

　ちなみにシステム負荷は普通のIDEよりちょい重い程度（IDE互換＠SB750でHDTune3.0～3.2％、mv_sataで3.6～3.8％）。
　SiI3132がひたすら遅いとはいえ、SiI3124から引き継いだ「内部SCSI互換構造」のお陰でシステム負荷が1.5％程度に抑えられているのに比べるとだいぶ落ちるが、かといって特別高いというワケでもないので、こんなもんか、と。

　但し、HDDの認識は明らかに遅い。単発の時はSiI3132と大差ない認識速度だったが、PMPの認識は非常に遅く、「あれ？」という感覚が。
　ちなみにこの認識の遅さ、起動時のBIOSによる時も感じたが、Windows上からの認識は更に遅い。せっかちな人はイラッと来るかも。

　ともあれ、PMP使用時も危険なダイアログが（HDDの数分だけ）表示される以外は特に何も問題なく、普通に使えていますな。
　これでダイアログメッセージ抑止さえ出来れば、全く普通にガッチャンコ出来る拡張SATA I/Fとして使い物になるのに。あぁ勿体ない。

＃ちなみにサポートには既に英文メール投げてみたが音沙汰無し。
　これは大人しくNORCOが790FXで使えるようになるのを待つしかないか。

ベンチマーク値と、本当の性能と。

Posted on 2009 年 1 月 18 日2011 年 3 月 21 日 by S.Kaz

　さて、光サービスがまだ現在程普通でなかった数年前、とてもホット「だった」（←過去形）話題の一つが、「ブロードバンドルータ」選び。

　というのも、光回線でまともに使い物になる「ブロードバンドルータ」が市場に殆ど存在しなかったため。
　それでは市場に多数存在した「ブロードバンドルータ」はどんな代物だったかというと、「ベンチマークは高速、でも実通信でちょっと負荷かかるとすぐ落ちる」というモノ。
　まあ要するに、通信機器として本来一番重要な性能である「安定性」が「カタログに数字で表記できない」という理由で無視された結果、意味のない数字と低価格競争に陥ったということ。一言で言ってしまえば「通信機器としてのレベルに達していない」と。

　とはいえ、そんな時代から「鉄板」「間違いない」と言われ続けていた製品が、マイクロ総合研究所のNetGenesisシリーズ。高速スループットと鉄壁の安定性を誇り、各社の光サービスのテスト等にも使用され、正に日本の家庭向け光サービスの開拓者と言っていい存在。

　もちろん他にも安定性という意味ではヤマハのRTシリーズという選択肢もあり、こちらも業務用で鍛えられた別次元の安定性を誇っていたのだが、問題はコンシューマー向けではスループット向上が遅れていたこと。そのため本格的に光回線対応を謳ってきたRT57iまでは「ADSLには完璧なんだけど」と言われ続けていたんですな。
　・・・とはいえ、実は速度という意味ではRT57iでもかなりイマイチで、光をフル活用するなら最新のRT58iが欲しいところだったりするのだけど。あと、RTは伝統的に比較的温度に弱い（熱暴走する）。

　◇

　長過ぎた前フリは置いといて。当方、今まではNetGenesis SuperOPT50を光回線用ルータにしていたんですな。鉄板の安定性の前に、7年以上も本当に不満が何もなかったので。勿論購入当初は正直「高ぇなぁ」とは思っていたものの、これだけ長く使えていれば正直安い買い物でしたな。

　ところが、本日秋葉原をウロウロしていた時、某所にてNetGenesis SuperOPT90が捨て値で転がっているのを確認。状態も良かったのでうっかり確保してしまい、本日SuperOPT50と差し替えてみましたよ。

　が、ここで大問題。何しろ今までも不満が無かったので、単純に設定を入れて置き換えただけでは、全く何も違いが分からない。仕方ないので、回線ベンチマークをしてみた。

　前：SuperOPT50 → 45Mbps
　今：SuperOPT90 → 67Mbps

　お、違い出た。
　ちなみにOPT50とOPT90は基本的に構成は一緒（なのでファームも一緒）で、CPUであるSH4のクロックが167MHz→240MHzと約50％増になったというもの。見事にCPU性能通りのベンチ結果ですな。

　＃ちなみにここの回線、業者がフレッツスクエアで確認した時は95Mbpsとか出ていたので、多分SuperOPT GFiveとか持ってくればそういう数字になると思われる。

　◇

　とはいえ・・・確かにベンチが速くなったのは確認出来たが、実際問題として全く差が分からん。
　何というか、モノも悪くないし、金額的にも捨て値だったというのに、実に満足感の無い買い物でしたなぁ・・・と。

ひねもす庵

カテゴリー: Benchmark

e1000 (not”e”)が来た。～考察編～

e1000 (not”e”)が来た。～ベンチマーク編～

帰ってきた2Dベンチネタ。

RocketRaidとPMP。

ベンチマーク値と、本当の性能と。