PiledriverコアとしてのTrinityを見てみる。(Trinity Review No.3)

 さて、Trinityのシリーズ3回目。いよいよベンチとかが来ます。
 今回はテーマ毎に一段落ということで。
 まずは、Piledriver Coreの出来をチェックしてみましょ。

 その1◆処理速度はどうよ?

 ということで、実際にベンチを回してみることに。
 以下は全て、メモリはDDR3-1866相当で駆動。要するに完全定格ですよ。

 CrystalMark 2004R3(4.0GHz@TC作動 2Unit4Thread)
 → ALU 52707、FPU 43442、Memory 31944。
 → GDI 10487、Direct2D 2728、OpenGL 3760。

 非常にLegacyなベンチマークだが、現在でもゲームとコンテンツクリエイション系以外の殆どのアプリはこの頃から構造的に進歩していないので、実際問題としては比較基準として使い物になると思われる。
 といっても比較対象が無いと比べようがないので、参考値を。

 参考値>Intel Core i3-2100(3.1GHz 2Core4Thread)
 → ALU 45000、FPU 45000、Memory 35000。
 → GDI 16000、Direct2D 2700、OpenGL 3800。

 参考値>AMD PhenomIIX4 910e(2.6GHz 4Core4Thread)
 → ALU 40000、FPU 39000、Memory 31000。

 整数演算のIPC(クロックあたりの命令実行効率)はDenebと比べて2割減といったところの模様。
 Deneb 2.6GHzとタメになるのはPiledriver 3.1GHz程度と想定される。
 なのでクロックダウンを行い、実際に検証してみた。ついでにCore i3とクロックも揃うし。

 CrystalMark 2004R3(3.1GHz固定 2Unit4Thread)

 → ALU 40953、FPU 33109、Memory 29243。
 → GDI 8739、Direct2D 2515、OpenGL 3726。

 うん、こんなもんだ。
 一方、泣きたくなるのが対SandyBridge。
 ぱっと見るPiledriverの方がおおよそ10%減、まぁこの程度なら・・・とも思いきや、コア数が倍違うんですよコレ。

 更にオマケ。2.6GHzまで落としてみた。

 CrystalMark 2004R3(2.6GHz固定 2Unit4Thread)

 → ALU 34011、FPU 27391、Memory 27306。
 → GDI 7877、Direct2D 2390、OpenGL 3676。

 う~む。正直コメントしづらい。なので、話を進めて。

 浮動小数点演算のIPCを見てみると、対Denebだと約3割減、対SandyBridgeで4割減といったところか。
 構造的に浮動小数点演算を「見捨てて」いる形にも関わらずこの数字というのは、個人的には善戦していると言っていいと思う。

 #というか、ここまで割り切った構成で且つこれだけの成績を出せるってのは、ある意味整数演算よりPiledriverの思想を体現している気がする。

 とまぁ、こんなところで。
 Piledriverは良くも悪くもBulldozerのマイナーバージョンアップである、ということを再認識しましたとさ。

 その2◆消費電力はどうよ?

 取り敢えず他に思いつかないのでOCCTを使って試してみる。 

 4.2GHz → 128W
 4.0GHz → 122W (3.8GHz定格設定だがTurboCoreが効いて全コア4GHzで動作状態)
 3.0GHz → 108W

 3.8GHz →  40W (アイドル)

 当方の環境ではTurboCore ONにすると全コア4.0GHzで駆動する模様。最初のベンチでもTCで4GHzになっていたので。
 そういう意味では、TurboCoreって結構効き易い模様。

 但し全コア4.2GHzでVcore定格のままではかなりフラフラで、OCCT放置も1時間は大丈夫だったが2時間は超えられず。
 TC4.2GHzってコア性能をかなりギリギリまで攻めている模様。
 まあCPUの個体差もあるし、電源がヘボい(&くたびれてる)ということもあると思うので、もっとまともな電源使えば余裕なのかも知れないが。
 とはいえこの価格帯のシステム組む人が¥20Kを超えるような「しっかりした」電源を選ぶとも思えないので、一つの目安程度にはなるかと。

 #ちなみに、電圧盛ったら全コア4.2GHzでもさくっと安定したが、消費電力も盛り分にふさわしく増加。
  VCore盛りは2乗で消費電力に効いてくる、その分発熱にもダイレクトに反映される、のでね。

 一方で、クロックを3.0GHzまで落としても消費電力は意外と減らない。つかたった14W差?
 なんというか、この辺りがPiledriverのアキレス腱なのね、と納得してしまった。

 そもそも、CMOS回路の消費電力は大雑把に言うとクロックに比例し、電圧の2乗に比例する。
 ところが最近のCMOSでは微細化の影響で、この比例分に加えて「漏れ電流」という、常時流れっぱなしの電流による「使用電力の底上げ」があり、こいつがヘタすると比例分よりも大きかったりするというとっても辛い状態になっている。
 今回、CPUクロックという「比例分」を下げても消費電力があまり下がらないということは、要するに「漏れ電流」が多いということ。逆に言うと、消費電力全体のうちCPUが実際に使える分が少ないということでもあり、端から見ると「電力効率がよろしくないCPU」ということになってしまう。

 勿論、このままではモバイル等では使い物にならないので、実際には色々と工夫をして消費電力を押さえ込んでいるワケであり。

 その辺りの状況が垣間見えるのがアイドル時の消費電力の低さで、フルパワー稼働時との差分(と電源の変換効率)を考えると、これはかなり優秀な値と言っていい。
 実際に消費電力やクロック変動を監視しながらベンチ等を回してみると、「すぐに跳ね上がるがすぐに落ちる」という挙動を繰り返している様子が見て取れるし。

 その3◆Piledriverコアのまとめ。

 ・CPU性能では同クロック・同スレッド数のSandyBrigeと比較して、整数演算で1割減、浮動小数点で4割減。
 ・現在のソフトウェア状況を鑑みればコア構成も特に問題無いと思われる。
 ・TurboCoreって意外と効き易い。
 ・相も変わらず得手不得手が強烈。
 ・省エネ制御は優秀、けど本気出すとやっぱ熱い。やりくり上手の大喰らい。

 取り敢えずまとめるとこの辺りかな。

 まず、性能面。
 IPCとかコア絶対性能は確かにボロ負けだが、パッケージとしてのコストパフォーマンスという見方をすれば悪くない。
 この辺りはもうAMDは「織り込み済み」でしょう、この値段だし。
 これはコレでありだと思いますよ。

 #勿論もっと高性能なCPUコアが載っていれば嬉しいに超したことは無いのだけど。

 CPUコア・スレッド構成についても然り。
 WindowsXPが出回った頃と違って、Windows 7や8、そして最近のアプリなら4コア程度ならそこそこ効率的に回せるようになっている。
 なので、実際にシステムを使う状況では、Intel CPUとのコア特性の違いもあまり問題にならないかと。

 #逆にこの時代だからこそPiledriverコアでも許されるというか。
  これが8コアとか言い始めるとまたおかしなことになるのだが・・・FXシリーズはここがネックだよなぁ。

 あと、TurboCoreは意外と回る模様。
 当方はSAMURAI MASTERという時代物を取り出したが、世間を見ればこれより冷えて静かなCPUクーラーなんかいくらでもある。
 かなり多くの環境でTCの恩恵にあずかれるのでは。

 更に、相も変わらず得手不得手は強烈。
 消費電力を監視していると面白いのだが、ベンチ全力で回している筈なのに電気全然喰ってないよ何コレ、という状況が結構見られる。
 要するに命令デコーダが追いついていなくて実行ユニットがサボっている、或いはその逆になっている状態になっているということで、そんな状況では勿論ベンチの値も低い。

 #これでもBulldozerより改善されたらしいので、そうなるとBulldozerって…(以下略。

 最後に、省エネ制御については優秀だという感想。
 かなり細やかに制御していて、何としても最低限の電力で動かそうと涙ぐましい努力をしている様子が伺える。
 が、フルパワーを出すとIPCの低さが露呈してしまうワケで。
 一言で言うなら「やりくり上手の大喰らい」というところか。

Share

Trinity+A85XにOSを入れてみる。(Trinity Review Series No.2)

 さて、Trinity APU搭載PCネタ、第2回。
 前回組み上がった「遊び心満載PC」でいよいよTrinity APUに迫ってみようかとか。
 でもその前に、OSを入れないと。
 今回は検証ということで、Windows 8 ProとWindows 7 SP1 Ultimateを用意しました、はい。当然ですがどちらもx64。DVDからのインストールですよ。

 その1◆Windows 8 Pro x64で。

 先日UIをボロクソに言ったばかりの気がするが、OSコアとしてはWindows 7より良くなっているとも書いた覚えが。
 折角の新しいマシンなので、新しいOSから始めましょ。

 すると・・・驚きの結果が。
 なんてこったい、ドライバが全部入ってしまったでないの。

 USB3.0とかGbEとかHD Audio周りとかチップセットとか、何か一つ二つぐらい引っかけるかと思ったら、キレイさっぱり残しません。
 最新ハードウェアにインストールしてinboxで用が足りる、取り敢えず外部ドライバが不要って・・・ちょっとした衝撃。
 ちゃんとCPUもGPUも正しい型番で認識されてます。
 タスクマネージャの表示を見るとCPU「2コア4スレッド」・・・うぅ、ほらね。

 とはいえVGAやUSB3.0等のアップデートが頻繁なドライバについてはアップデートはした方が良い模様。例えば、Inboxドライバと最新Catalystでは3D系のパフォーマンスが1割以上違うとか、他にもちらほらと。
 但しそれでも、基本的にフル機能のドライバがセットアップされるというのは素晴らしい、いや本当に。

 #分って貰える人は必ず居る筈、OSインストール直後にLANが使えてWindows Updateを当てられることの幸せ。

 とまあそんなこんなで、DVI+HDMIの2枚Full HDを使うWindows 8マシンはあっさりと出来上がりましたとさ。
 ・・・もしかしてこのマザー、Windows 8に最適化済?

 その2◆Windows 7 SP1 Ultimate x64で。

 さて、正直言うとTrinityにはWin8よりWin7の方が圧倒的にインストールされる率が高いと思っているのだが、それは兎も角。HDDを別のものに付け替えてこちらも試してみる。

 すると、こちらは期待通りの結果に。
 インストール直後の状態ではチップセットドライバも無ければRadeon用ドライバも無い。ついでに蟹LANのドライバも無い。お約束のオールスター揃い踏み。
 他にも色々と「取り敢えず動くだけ」ドライバが入っているので、山ほど後入れする必要がある。Win8と違ってこの状態では「使い物にならない」ので、USBメモリを使ってガシガシと入れていきますよ。

 とはいえ、ドライバが入りきってしまえば見慣れたデスクトップがお出迎え。
 こちらも快適な1台が仕上がりました、はい。

 その3◆Win 7とWin 8、軽く比べてみた。

 ある意味デュアルブートというかセレクタブルブートというか、そんなマシンになりました。
 何でこんなことをしたのかというと、実はこの後「Windows 8とWindows 7でパフォーマンスの違いはあるのか」ということをベンチ等で確かめるためだったんですな。

 で、この後早速色々やってみたのだが・・・
 結論、パフォーマンスに目立つ差は無い。

 傾向的にはWindows 7の方が若干良い値が出ることが多いのだが、数字のブレの範囲だし、恐らく原因はドライバの成熟度でないかと思われるので、そのうちこの現象も解消するかと。

 で、こういう結論が出ると、以下のようなOS違いの環境でもベンチ比較が有意ということに。

 ・常用機、Deneb 2.6GHz+Radeon 6450 DDR3-512MB (Win7)
 ・検証機、Trinity 3.8/TC4.2GHz (Win8)

 というワケで次回以降の記事では、当方が現在もこのblog記事を書いている現行機と比較しつつ、色々と検証してみることにしますよ。

Share

AMD Trinity APUで一台マシンをセットアップしてみた。(Trinity Review Series No.1)

 さて、Desktop版 Trinityがいよいよ発売になりました。
 ということで、先日のイベントでの「豪華なお土産」で、当方も一台組んでみました。
 以下、構成。

 ◇

 CPU → A10-5800K。

 豪華なお土産その一。
 PlileDriver 2モジュール4コア、3.8GHz/TC4.2GHz、384sp@800MHz、100W。
 今回はK型なので、クロックいぢりを併せて「石の素性」を探ってみようかと。

 マザーボード → Gigabyte製GA-F2A85X-UP4。

 豪華なお土産その二。
 A85X搭載でSATA8ポートとCROSSFIREサポート、ついでに真っ黒な配色が特徴。
 更に型番が示す通り「OC出来ます仕様」なので、仕様通りに使ってやろうかと。
 実際UEFI画面に入ると、これでもかという程電圧やタイミングの設定がいじり放題に。
 まぁ細かいコトはまた後で。

 Memory → Patriot製Viper3 DDR3-2133 4GB×2 11-11-11-27

 DDR3-2133どころかDDR3-1866も未だNativeのダイは存在しないが、DDR3-1600の大量増産でOCメモリながら1.5V品もそこそこの値段で買える時代に。
 ここは真っ黒でヒートシンクも控えめなPatriot製の新製品をセレクト。同社は「AMD Memory」のOEM元でもある。
 ちなみに、DDR3-2133の設定はUEFIからOCプロファイルを読み込み指定するだけで一発完了、即安定動作でしたとさ。

 #にしてもDDR3-2133ともなれば手作業で詰めようとすると結構面倒だってのに、それが1発指定で即安定とは。

 ◇

 新規の品はここまで。
 これ以降は、手元にあったもののかき集め。

 CPU Cooler → ANDY SAMURAI MASTER。
 HDD → 日立 DeskStar7K2000 2TB。
 ケース → Shakoon T9 Window。
 電源 → Antec EA-430。
 光学ドライブ → ASUS DRW-1814BLT

 何だか時代モノも混ざっているが、気のせいということで。いや、SAMURAI MASTERは良いクーラーですよ。ファンはとっくの昔にダメになって交換されてますけどね。

 以上、光りまくりの1台が出来上がりました。
 あいやね、12cmファンが都合4つ(フロント×2、リア、CPU冷却)、全部光り物なんですよ。
 何しろ普段使いのPCは実用性と安定性を最優先で定番パーツしか選んでいないので、「折角だからこの際光らせてみるか」みたいな「遊び心」が組み立て中妙に楽しかったりしてね。

 ◇

 ということで、ここからは個々のパーツについてのちょっとした話。

 ・マザーボード雑感。

 最後に触ったのはGA-M55S-S3(nForce 550)辺りだった気がするので、ずいぶん久しぶりのGigabyteマザー。
 にしてもこれはスッキリしてますよ。元々FM系ソケットは必要部品が少ない上に、最近のマザーでは存在感主張し過ぎのVRMも100Wまでと控えめだし、しかもマザー全体が黒で締まって見えるから更にスッキリとした印象に。

 #フツーのGigabyteの青と白のコテコテ感も嫌いじゃないけど。

 ちなみに、Gigabyteというと伝統的にCPUソケット周りが窮屈で、大型ヒートシンクで静音化を狙おうとすると干渉に悩まされるというお約束があったが、このマザーでは部品自体が少ないこともあり、SAMURAI MASTERが何の干渉もなく取り付け可能。
 コレが付けられるなら、世間に出回ってる大抵のモノは付けられるのでは。

 #あ~あとこのマザー、Unbuffered-ECCメモリでもエラー吐きません。
  一時期Unbuffered-ECCメモリを蹴飛ばすマザーが流行ってたよね。

 ・メモリ選択について。

 Trinityは定格でDDR3-1866。ここは定格にしておくか、それとも・・・と3秒ぐらい悩んで、値段が大差なかったのでDDR3-2133を選択。

 ちなみにTrinityのメモリレシオはDDR3-1866の上にDDR3-2166とDDR3-2400。
 Llanoでは定格DDR3-1600、OC設定が1段のDDR3-1866、という構成だったが、TrinityではOC設定が2段あるのはやはり「当初はDDR3-2133を正式サポートする予定だった」名残かしらん。

 あと、OCメモリと言えば定番のCorsair、お手軽版のVENGENCEですが。
 選ばなかった理由はヒートシンクの背が高過ぎること。はっきり言って邪魔です、はい。
 最近では背の低いVENGENCE LPってのもあるが、これがまだ流通が少なくて、本家サイトで発売中になっていても国内では影も形も・・・なんてモデルが結構。これじゃ選べない。
 いやね、青色のヤツなら店にあったんですけどね(しかもViper3より安かった)、マザーが真っ黒なんで青はちょっと・・・と。赤だったら買ってたかも(AMD機だし)。

 ◇

 とまぁ、こんな風につらつらと書いてしまいましたが。
 次からはOSをセットアップして、使用感書いてみたりベンチマーク取ってみたりしていきますよ。

 ちなにワットチェッカーも準備済です。
 え、その電源で測るのか、正気かお前、とか言わないで(泣。

 #一応80PLUSですよ、無印だけど・・・。

Share

三位一体 (=Trinity)、デスクトップへ。

 本日のお題は先日の『AMDの「APU新製品」に関するブロガー勉強会、なるイベントにてほっこりして来た件。』続き。
 「解禁日以降」と書いた部分の、解禁日以降のネタです、はい。

 ◇

 ・第一部、デスクトップ版Trinityについて。

 国内でもHP製デスクトップに組み込まれた状態で既に出荷されていたりするデスクトップ版Trinity。
 いよいよ単品での販売開始に合わせて、セールスプレゼンテーションが始まりますよ。

 ということで、まずはコア構成のおさらいから。
 Piledriverコア+Radeon 7000シリーズのGPUがSocket FM2にパッケージされており・・・ということをコアのダイ写真を見せながら解説。
 GPUについては当然ながら大幅強化、これは納得。CPUも強化・・・ん~、そこは微妙かも。
 ここでの個人的注目ポイントはディスプレイコントローラの強化。画面出力周りが弱かったLlanoと比べて、やっと単品GPUと同等の画面出力が出来るようになります、と。

 ♯ダイ写真を見るとGPUコアが全体の半分近くを占めていて、もうこの写真がAPUの性質そのものを表しているといっても過言ではない気が。

 そしてソケットがFM2に変わります、というお話。結局キーになるのは「電力周り」ということで「変えざるを得ないんです」とのこと。
 まあBulldozerについてもそもそもAM3+で動かすのは相当キツいという話もあったりもするので、PiledriverそしてSteamrollerとコアを変えていく中でこっちはソケット変えるしかない、という結論に至ったのでしょうな。
 ちなみに「次の世代もFM2であることは確定してる」とも。

 #Socket754って昔あったよね。
  あと、FM2「+」ってのはありそうだよなぁ。

 次に、デスクトップ版Trinity最上位モデルが(最近では)軽量級と呼ばれる3Dゲームの類が十分に遊べるよ・・・同じパフォーマンスをIntel CPUとnvidia 単品VGAで揃えるとお値段が全然違うよ~、というコストパフォーマンスアピールが挟まって、いよいよ最後にお値段開示。

 ・・・ほお。最上位A10-5800Kで¥12,980(小売見込価格)とな。

 営業担当の方からは無茶苦茶自信ありますオーラが出ていて、会場も(所詮20人という頭数なので控えめに)盛り上がったが、いや、これは結構競争力あるお値段だと思うよ、ホントに。
 少なくとも自分は「同価格帯ならIntel選ぶ理由は一つもない」って本気で思ったし。

 もちろん、Core i5と正面衝突して勝てるワケがないが、i5とはそもそも値段が違う。
 AMD環境はマザーが比較的安いってのもメリットの一つなので、トータルで見ればコスパは更に良好に。この上うっかり「さすがにIntel HDだとキツいから低価格でいいから単品GPUを」なんてことになればお値段差か更に広がるしね。

 ・内蔵VGAも拡張しているんですよ。

 とまぁここで一息ついて、次はAMD GPUの機能向上のアピール。
 ハードウェア面では、動画再生支援が強化されたのと、更にハードウェアエンコーダまで内蔵してしまいましたという話。
 そしてそれを活かすため、ソフトウェア面でも強化していきますよ・・・という話。

 そしてこの流れで、GPGPUを活用するためOpenCLを推進していきますと(HSAもブチ上げたしね)。
 ソフトウェア屋さんとも連携していきますよ、そしてOpenCLが活用出来るアプリを紹介していくサイトを作りますよ、と立て続けに紹介。

 いやね・・・ここさらっと流されたけど、重要ですよこの「ソフトウェアの対応」と「紹介」は。
 一昔前、nvidiaはゲームベンダさんと協力しまくることで現在の「nvidia製VGAをレファレンスとするゲームが大多数」という状況を作り上げた。最近になって漸くAMDもその大切さに気づき、今ではゲームベンダとの協力もやっているというのは有名な話。

 で、ここではAppZoneというサイトを作って紹介していきます、という話だったが。
 個人的にはここはもっと推し進めていいと思う、というか、ぶっちゃけWebだけじゃアピールが全然足りないと思うのですよ。

 例えば、この際AppZoneというアプリそのものを作ってしまうというのはどうだろう。
 何故かというと、今時のユーザーはスマホのソフトウェアインストールの形に慣れている。カタログから選んで、ダウンロードして、インストール。
 同じことをAMDもすればいい。
 といっても決済機能まで持つ必要は無いだろうし、高機能なアプリである必要もない。極論言ってしまえば、AppZoneのURLを呼び出すだけのアプリでも良い。
 但し、検索がまともに動くことと、ソフトウェアを選んだら即ダウンロードor即決済サイトに繋がるようになっていないと話にならない。

 要するに、兎にも角にも多くのユーザにAppZoneにリーチして貰う為の手段なのですよ。
 そして、特に意識せずにAppZoneでOpenCL対応アプリを選んで貰い、使って貰うことで、OpenCLアプリの普及を促進し、APUが真価を発揮できる土台を広げる、と。

 後はこのAppZoneアプリをいかにインストールして貰うかだが、AMDにはCatalystというドライバパッケージが存在する。これを使えばいい。
 問答無用で入れるのはさすがにアレだろうが、ポップアップで案内画面を開いて確認すればそれで十分だろうし。

 ・・・とまぁこんなことを思いつつ。
 最後に、OpenCL対応アプリでは内蔵GPGPUのパワーが活きてパフォーマンスが大幅にアップすること、AMDとしては「日常PCを使う場面でパフォーマンスが出る」方向性を目指していて、OpenCLの活用もその方向でいってます、という話があって、セッション終了。

 #今のAMDにとってボリューム=シェアを取ることは至上命題だからねぇ。頑張っても貰わないと。

 ◇

 以上、これだけの内容を1時間で駆け抜けたんですな。内容特盛りですよ。

 タイトルだけ見ると「新製品凄いでしょ買ってね」という内容しかないように見えてしまうが、実の内容は「新製品凄いでしょ買ってね」+「APUが活かせる環境を作ろうと頑張っていますよ」という2段構えで、個人的には普段はあまり表に出てこない後者の方がより面白かったというか。

 兎に角、AMDはGPGPUやAPU環境への取り組んでいること、既に成果も出ていること、この辺りをもっと日常的にアピールした方が良いと思った、そんなプレゼンでしたとさ。

Share