PiledriverコアとしてのTrinityを見てみる。(Trinity Review No.3)

 さて、Trinityのシリーズ3回目。いよいよベンチとかが来ます。
 今回はテーマ毎に一段落ということで。
 まずは、Piledriver Coreの出来をチェックしてみましょ。

 その1◆処理速度はどうよ?

 ということで、実際にベンチを回してみることに。
 以下は全て、メモリはDDR3-1866相当で駆動。要するに完全定格ですよ。

 CrystalMark 2004R3(4.0GHz@TC作動 2Unit4Thread)
 → ALU 52707、FPU 43442、Memory 31944。
 → GDI 10487、Direct2D 2728、OpenGL 3760。

 非常にLegacyなベンチマークだが、現在でもゲームとコンテンツクリエイション系以外の殆どのアプリはこの頃から構造的に進歩していないので、実際問題としては比較基準として使い物になると思われる。
 といっても比較対象が無いと比べようがないので、参考値を。

 参考値>Intel Core i3-2100(3.1GHz 2Core4Thread)
 → ALU 45000、FPU 45000、Memory 35000。
 → GDI 16000、Direct2D 2700、OpenGL 3800。

 参考値>AMD PhenomIIX4 910e(2.6GHz 4Core4Thread)
 → ALU 40000、FPU 39000、Memory 31000。

 整数演算のIPC(クロックあたりの命令実行効率)はDenebと比べて2割減といったところの模様。
 Deneb 2.6GHzとタメになるのはPiledriver 3.1GHz程度と想定される。
 なのでクロックダウンを行い、実際に検証してみた。ついでにCore i3とクロックも揃うし。

 CrystalMark 2004R3(3.1GHz固定 2Unit4Thread)

 → ALU 40953、FPU 33109、Memory 29243。
 → GDI 8739、Direct2D 2515、OpenGL 3726。

 うん、こんなもんだ。
 一方、泣きたくなるのが対SandyBridge。
 ぱっと見るPiledriverの方がおおよそ10%減、まぁこの程度なら・・・とも思いきや、コア数が倍違うんですよコレ。

 更にオマケ。2.6GHzまで落としてみた。

 CrystalMark 2004R3(2.6GHz固定 2Unit4Thread)

 → ALU 34011、FPU 27391、Memory 27306。
 → GDI 7877、Direct2D 2390、OpenGL 3676。

 う~む。正直コメントしづらい。なので、話を進めて。

 浮動小数点演算のIPCを見てみると、対Denebだと約3割減、対SandyBridgeで4割減といったところか。
 構造的に浮動小数点演算を「見捨てて」いる形にも関わらずこの数字というのは、個人的には善戦していると言っていいと思う。

 #というか、ここまで割り切った構成で且つこれだけの成績を出せるってのは、ある意味整数演算よりPiledriverの思想を体現している気がする。

 とまぁ、こんなところで。
 Piledriverは良くも悪くもBulldozerのマイナーバージョンアップである、ということを再認識しましたとさ。

 その2◆消費電力はどうよ?

 取り敢えず他に思いつかないのでOCCTを使って試してみる。 

 4.2GHz → 128W
 4.0GHz → 122W (3.8GHz定格設定だがTurboCoreが効いて全コア4GHzで動作状態)
 3.0GHz → 108W

 3.8GHz →  40W (アイドル)

 当方の環境ではTurboCore ONにすると全コア4.0GHzで駆動する模様。最初のベンチでもTCで4GHzになっていたので。
 そういう意味では、TurboCoreって結構効き易い模様。

 但し全コア4.2GHzでVcore定格のままではかなりフラフラで、OCCT放置も1時間は大丈夫だったが2時間は超えられず。
 TC4.2GHzってコア性能をかなりギリギリまで攻めている模様。
 まあCPUの個体差もあるし、電源がヘボい(&くたびれてる)ということもあると思うので、もっとまともな電源使えば余裕なのかも知れないが。
 とはいえこの価格帯のシステム組む人が¥20Kを超えるような「しっかりした」電源を選ぶとも思えないので、一つの目安程度にはなるかと。

 #ちなみに、電圧盛ったら全コア4.2GHzでもさくっと安定したが、消費電力も盛り分にふさわしく増加。
  VCore盛りは2乗で消費電力に効いてくる、その分発熱にもダイレクトに反映される、のでね。

 一方で、クロックを3.0GHzまで落としても消費電力は意外と減らない。つかたった14W差?
 なんというか、この辺りがPiledriverのアキレス腱なのね、と納得してしまった。

 そもそも、CMOS回路の消費電力は大雑把に言うとクロックに比例し、電圧の2乗に比例する。
 ところが最近のCMOSでは微細化の影響で、この比例分に加えて「漏れ電流」という、常時流れっぱなしの電流による「使用電力の底上げ」があり、こいつがヘタすると比例分よりも大きかったりするというとっても辛い状態になっている。
 今回、CPUクロックという「比例分」を下げても消費電力があまり下がらないということは、要するに「漏れ電流」が多いということ。逆に言うと、消費電力全体のうちCPUが実際に使える分が少ないということでもあり、端から見ると「電力効率がよろしくないCPU」ということになってしまう。

 勿論、このままではモバイル等では使い物にならないので、実際には色々と工夫をして消費電力を押さえ込んでいるワケであり。

 その辺りの状況が垣間見えるのがアイドル時の消費電力の低さで、フルパワー稼働時との差分(と電源の変換効率)を考えると、これはかなり優秀な値と言っていい。
 実際に消費電力やクロック変動を監視しながらベンチ等を回してみると、「すぐに跳ね上がるがすぐに落ちる」という挙動を繰り返している様子が見て取れるし。

 その3◆Piledriverコアのまとめ。

 ・CPU性能では同クロック・同スレッド数のSandyBrigeと比較して、整数演算で1割減、浮動小数点で4割減。
 ・現在のソフトウェア状況を鑑みればコア構成も特に問題無いと思われる。
 ・TurboCoreって意外と効き易い。
 ・相も変わらず得手不得手が強烈。
 ・省エネ制御は優秀、けど本気出すとやっぱ熱い。やりくり上手の大喰らい。

 取り敢えずまとめるとこの辺りかな。

 まず、性能面。
 IPCとかコア絶対性能は確かにボロ負けだが、パッケージとしてのコストパフォーマンスという見方をすれば悪くない。
 この辺りはもうAMDは「織り込み済み」でしょう、この値段だし。
 これはコレでありだと思いますよ。

 #勿論もっと高性能なCPUコアが載っていれば嬉しいに超したことは無いのだけど。

 CPUコア・スレッド構成についても然り。
 WindowsXPが出回った頃と違って、Windows 7や8、そして最近のアプリなら4コア程度ならそこそこ効率的に回せるようになっている。
 なので、実際にシステムを使う状況では、Intel CPUとのコア特性の違いもあまり問題にならないかと。

 #逆にこの時代だからこそPiledriverコアでも許されるというか。
  これが8コアとか言い始めるとまたおかしなことになるのだが・・・FXシリーズはここがネックだよなぁ。

 あと、TurboCoreは意外と回る模様。
 当方はSAMURAI MASTERという時代物を取り出したが、世間を見ればこれより冷えて静かなCPUクーラーなんかいくらでもある。
 かなり多くの環境でTCの恩恵にあずかれるのでは。

 更に、相も変わらず得手不得手は強烈。
 消費電力を監視していると面白いのだが、ベンチ全力で回している筈なのに電気全然喰ってないよ何コレ、という状況が結構見られる。
 要するに命令デコーダが追いついていなくて実行ユニットがサボっている、或いはその逆になっている状態になっているということで、そんな状況では勿論ベンチの値も低い。

 #これでもBulldozerより改善されたらしいので、そうなるとBulldozerって…(以下略。

 最後に、省エネ制御については優秀だという感想。
 かなり細やかに制御していて、何としても最低限の電力で動かそうと涙ぐましい努力をしている様子が伺える。
 が、フルパワーを出すとIPCの低さが露呈してしまうワケで。
 一言で言うなら「やりくり上手の大喰らい」というところか。

Share

Trinity+A85XにOSを入れてみる。(Trinity Review Series No.2)

 さて、Trinity APU搭載PCネタ、第2回。
 前回組み上がった「遊び心満載PC」でいよいよTrinity APUに迫ってみようかとか。
 でもその前に、OSを入れないと。
 今回は検証ということで、Windows 8 ProとWindows 7 SP1 Ultimateを用意しました、はい。当然ですがどちらもx64。DVDからのインストールですよ。

 その1◆Windows 8 Pro x64で。

 先日UIをボロクソに言ったばかりの気がするが、OSコアとしてはWindows 7より良くなっているとも書いた覚えが。
 折角の新しいマシンなので、新しいOSから始めましょ。

 すると・・・驚きの結果が。
 なんてこったい、ドライバが全部入ってしまったでないの。

 USB3.0とかGbEとかHD Audio周りとかチップセットとか、何か一つ二つぐらい引っかけるかと思ったら、キレイさっぱり残しません。
 最新ハードウェアにインストールしてinboxで用が足りる、取り敢えず外部ドライバが不要って・・・ちょっとした衝撃。
 ちゃんとCPUもGPUも正しい型番で認識されてます。
 タスクマネージャの表示を見るとCPU「2コア4スレッド」・・・うぅ、ほらね。

 とはいえVGAやUSB3.0等のアップデートが頻繁なドライバについてはアップデートはした方が良い模様。例えば、Inboxドライバと最新Catalystでは3D系のパフォーマンスが1割以上違うとか、他にもちらほらと。
 但しそれでも、基本的にフル機能のドライバがセットアップされるというのは素晴らしい、いや本当に。

 #分って貰える人は必ず居る筈、OSインストール直後にLANが使えてWindows Updateを当てられることの幸せ。

 とまあそんなこんなで、DVI+HDMIの2枚Full HDを使うWindows 8マシンはあっさりと出来上がりましたとさ。
 ・・・もしかしてこのマザー、Windows 8に最適化済?

 その2◆Windows 7 SP1 Ultimate x64で。

 さて、正直言うとTrinityにはWin8よりWin7の方が圧倒的にインストールされる率が高いと思っているのだが、それは兎も角。HDDを別のものに付け替えてこちらも試してみる。

 すると、こちらは期待通りの結果に。
 インストール直後の状態ではチップセットドライバも無ければRadeon用ドライバも無い。ついでに蟹LANのドライバも無い。お約束のオールスター揃い踏み。
 他にも色々と「取り敢えず動くだけ」ドライバが入っているので、山ほど後入れする必要がある。Win8と違ってこの状態では「使い物にならない」ので、USBメモリを使ってガシガシと入れていきますよ。

 とはいえ、ドライバが入りきってしまえば見慣れたデスクトップがお出迎え。
 こちらも快適な1台が仕上がりました、はい。

 その3◆Win 7とWin 8、軽く比べてみた。

 ある意味デュアルブートというかセレクタブルブートというか、そんなマシンになりました。
 何でこんなことをしたのかというと、実はこの後「Windows 8とWindows 7でパフォーマンスの違いはあるのか」ということをベンチ等で確かめるためだったんですな。

 で、この後早速色々やってみたのだが・・・
 結論、パフォーマンスに目立つ差は無い。

 傾向的にはWindows 7の方が若干良い値が出ることが多いのだが、数字のブレの範囲だし、恐らく原因はドライバの成熟度でないかと思われるので、そのうちこの現象も解消するかと。

 で、こういう結論が出ると、以下のようなOS違いの環境でもベンチ比較が有意ということに。

 ・常用機、Deneb 2.6GHz+Radeon 6450 DDR3-512MB (Win7)
 ・検証機、Trinity 3.8/TC4.2GHz (Win8)

 というワケで次回以降の記事では、当方が現在もこのblog記事を書いている現行機と比較しつつ、色々と検証してみることにしますよ。

Share

AMD Trinity APUで一台マシンをセットアップしてみた。(Trinity Review Series No.1)

 さて、Desktop版 Trinityがいよいよ発売になりました。
 ということで、先日のイベントでの「豪華なお土産」で、当方も一台組んでみました。
 以下、構成。

 ◇

 CPU → A10-5800K。

 豪華なお土産その一。
 PlileDriver 2モジュール4コア、3.8GHz/TC4.2GHz、384sp@800MHz、100W。
 今回はK型なので、クロックいぢりを併せて「石の素性」を探ってみようかと。

 マザーボード → Gigabyte製GA-F2A85X-UP4。

 豪華なお土産その二。
 A85X搭載でSATA8ポートとCROSSFIREサポート、ついでに真っ黒な配色が特徴。
 更に型番が示す通り「OC出来ます仕様」なので、仕様通りに使ってやろうかと。
 実際UEFI画面に入ると、これでもかという程電圧やタイミングの設定がいじり放題に。
 まぁ細かいコトはまた後で。

 Memory → Patriot製Viper3 DDR3-2133 4GB×2 11-11-11-27

 DDR3-2133どころかDDR3-1866も未だNativeのダイは存在しないが、DDR3-1600の大量増産でOCメモリながら1.5V品もそこそこの値段で買える時代に。
 ここは真っ黒でヒートシンクも控えめなPatriot製の新製品をセレクト。同社は「AMD Memory」のOEM元でもある。
 ちなみに、DDR3-2133の設定はUEFIからOCプロファイルを読み込み指定するだけで一発完了、即安定動作でしたとさ。

 #にしてもDDR3-2133ともなれば手作業で詰めようとすると結構面倒だってのに、それが1発指定で即安定とは。

 ◇

 新規の品はここまで。
 これ以降は、手元にあったもののかき集め。

 CPU Cooler → ANDY SAMURAI MASTER。
 HDD → 日立 DeskStar7K2000 2TB。
 ケース → Shakoon T9 Window。
 電源 → Antec EA-430。
 光学ドライブ → ASUS DRW-1814BLT

 何だか時代モノも混ざっているが、気のせいということで。いや、SAMURAI MASTERは良いクーラーですよ。ファンはとっくの昔にダメになって交換されてますけどね。

 以上、光りまくりの1台が出来上がりました。
 あいやね、12cmファンが都合4つ(フロント×2、リア、CPU冷却)、全部光り物なんですよ。
 何しろ普段使いのPCは実用性と安定性を最優先で定番パーツしか選んでいないので、「折角だからこの際光らせてみるか」みたいな「遊び心」が組み立て中妙に楽しかったりしてね。

 ◇

 ということで、ここからは個々のパーツについてのちょっとした話。

 ・マザーボード雑感。

 最後に触ったのはGA-M55S-S3(nForce 550)辺りだった気がするので、ずいぶん久しぶりのGigabyteマザー。
 にしてもこれはスッキリしてますよ。元々FM系ソケットは必要部品が少ない上に、最近のマザーでは存在感主張し過ぎのVRMも100Wまでと控えめだし、しかもマザー全体が黒で締まって見えるから更にスッキリとした印象に。

 #フツーのGigabyteの青と白のコテコテ感も嫌いじゃないけど。

 ちなみに、Gigabyteというと伝統的にCPUソケット周りが窮屈で、大型ヒートシンクで静音化を狙おうとすると干渉に悩まされるというお約束があったが、このマザーでは部品自体が少ないこともあり、SAMURAI MASTERが何の干渉もなく取り付け可能。
 コレが付けられるなら、世間に出回ってる大抵のモノは付けられるのでは。

 #あ~あとこのマザー、Unbuffered-ECCメモリでもエラー吐きません。
  一時期Unbuffered-ECCメモリを蹴飛ばすマザーが流行ってたよね。

 ・メモリ選択について。

 Trinityは定格でDDR3-1866。ここは定格にしておくか、それとも・・・と3秒ぐらい悩んで、値段が大差なかったのでDDR3-2133を選択。

 ちなみにTrinityのメモリレシオはDDR3-1866の上にDDR3-2166とDDR3-2400。
 Llanoでは定格DDR3-1600、OC設定が1段のDDR3-1866、という構成だったが、TrinityではOC設定が2段あるのはやはり「当初はDDR3-2133を正式サポートする予定だった」名残かしらん。

 あと、OCメモリと言えば定番のCorsair、お手軽版のVENGENCEですが。
 選ばなかった理由はヒートシンクの背が高過ぎること。はっきり言って邪魔です、はい。
 最近では背の低いVENGENCE LPってのもあるが、これがまだ流通が少なくて、本家サイトで発売中になっていても国内では影も形も・・・なんてモデルが結構。これじゃ選べない。
 いやね、青色のヤツなら店にあったんですけどね(しかもViper3より安かった)、マザーが真っ黒なんで青はちょっと・・・と。赤だったら買ってたかも(AMD機だし)。

 ◇

 とまぁ、こんな風につらつらと書いてしまいましたが。
 次からはOSをセットアップして、使用感書いてみたりベンチマーク取ってみたりしていきますよ。

 ちなにワットチェッカーも準備済です。
 え、その電源で測るのか、正気かお前、とか言わないで(泣。

 #一応80PLUSですよ、無印だけど・・・。

Share

三位一体 (=Trinity)、デスクトップへ。

 本日のお題は先日の『AMDの「APU新製品」に関するブロガー勉強会、なるイベントにてほっこりして来た件。』続き。
 「解禁日以降」と書いた部分の、解禁日以降のネタです、はい。

 ◇

 ・第一部、デスクトップ版Trinityについて。

 国内でもHP製デスクトップに組み込まれた状態で既に出荷されていたりするデスクトップ版Trinity。
 いよいよ単品での販売開始に合わせて、セールスプレゼンテーションが始まりますよ。

 ということで、まずはコア構成のおさらいから。
 Piledriverコア+Radeon 7000シリーズのGPUがSocket FM2にパッケージされており・・・ということをコアのダイ写真を見せながら解説。
 GPUについては当然ながら大幅強化、これは納得。CPUも強化・・・ん~、そこは微妙かも。
 ここでの個人的注目ポイントはディスプレイコントローラの強化。画面出力周りが弱かったLlanoと比べて、やっと単品GPUと同等の画面出力が出来るようになります、と。

 ♯ダイ写真を見るとGPUコアが全体の半分近くを占めていて、もうこの写真がAPUの性質そのものを表しているといっても過言ではない気が。

 そしてソケットがFM2に変わります、というお話。結局キーになるのは「電力周り」ということで「変えざるを得ないんです」とのこと。
 まあBulldozerについてもそもそもAM3+で動かすのは相当キツいという話もあったりもするので、PiledriverそしてSteamrollerとコアを変えていく中でこっちはソケット変えるしかない、という結論に至ったのでしょうな。
 ちなみに「次の世代もFM2であることは確定してる」とも。

 #Socket754って昔あったよね。
  あと、FM2「+」ってのはありそうだよなぁ。

 次に、デスクトップ版Trinity最上位モデルが(最近では)軽量級と呼ばれる3Dゲームの類が十分に遊べるよ・・・同じパフォーマンスをIntel CPUとnvidia 単品VGAで揃えるとお値段が全然違うよ~、というコストパフォーマンスアピールが挟まって、いよいよ最後にお値段開示。

 ・・・ほお。最上位A10-5800Kで¥12,980(小売見込価格)とな。

 営業担当の方からは無茶苦茶自信ありますオーラが出ていて、会場も(所詮20人という頭数なので控えめに)盛り上がったが、いや、これは結構競争力あるお値段だと思うよ、ホントに。
 少なくとも自分は「同価格帯ならIntel選ぶ理由は一つもない」って本気で思ったし。

 もちろん、Core i5と正面衝突して勝てるワケがないが、i5とはそもそも値段が違う。
 AMD環境はマザーが比較的安いってのもメリットの一つなので、トータルで見ればコスパは更に良好に。この上うっかり「さすがにIntel HDだとキツいから低価格でいいから単品GPUを」なんてことになればお値段差か更に広がるしね。

 ・内蔵VGAも拡張しているんですよ。

 とまぁここで一息ついて、次はAMD GPUの機能向上のアピール。
 ハードウェア面では、動画再生支援が強化されたのと、更にハードウェアエンコーダまで内蔵してしまいましたという話。
 そしてそれを活かすため、ソフトウェア面でも強化していきますよ・・・という話。

 そしてこの流れで、GPGPUを活用するためOpenCLを推進していきますと(HSAもブチ上げたしね)。
 ソフトウェア屋さんとも連携していきますよ、そしてOpenCLが活用出来るアプリを紹介していくサイトを作りますよ、と立て続けに紹介。

 いやね・・・ここさらっと流されたけど、重要ですよこの「ソフトウェアの対応」と「紹介」は。
 一昔前、nvidiaはゲームベンダさんと協力しまくることで現在の「nvidia製VGAをレファレンスとするゲームが大多数」という状況を作り上げた。最近になって漸くAMDもその大切さに気づき、今ではゲームベンダとの協力もやっているというのは有名な話。

 で、ここではAppZoneというサイトを作って紹介していきます、という話だったが。
 個人的にはここはもっと推し進めていいと思う、というか、ぶっちゃけWebだけじゃアピールが全然足りないと思うのですよ。

 例えば、この際AppZoneというアプリそのものを作ってしまうというのはどうだろう。
 何故かというと、今時のユーザーはスマホのソフトウェアインストールの形に慣れている。カタログから選んで、ダウンロードして、インストール。
 同じことをAMDもすればいい。
 といっても決済機能まで持つ必要は無いだろうし、高機能なアプリである必要もない。極論言ってしまえば、AppZoneのURLを呼び出すだけのアプリでも良い。
 但し、検索がまともに動くことと、ソフトウェアを選んだら即ダウンロードor即決済サイトに繋がるようになっていないと話にならない。

 要するに、兎にも角にも多くのユーザにAppZoneにリーチして貰う為の手段なのですよ。
 そして、特に意識せずにAppZoneでOpenCL対応アプリを選んで貰い、使って貰うことで、OpenCLアプリの普及を促進し、APUが真価を発揮できる土台を広げる、と。

 後はこのAppZoneアプリをいかにインストールして貰うかだが、AMDにはCatalystというドライバパッケージが存在する。これを使えばいい。
 問答無用で入れるのはさすがにアレだろうが、ポップアップで案内画面を開いて確認すればそれで十分だろうし。

 ・・・とまぁこんなことを思いつつ。
 最後に、OpenCL対応アプリでは内蔵GPGPUのパワーが活きてパフォーマンスが大幅にアップすること、AMDとしては「日常PCを使う場面でパフォーマンスが出る」方向性を目指していて、OpenCLの活用もその方向でいってます、という話があって、セッション終了。

 #今のAMDにとってボリューム=シェアを取ることは至上命題だからねぇ。頑張っても貰わないと。

 ◇

 以上、これだけの内容を1時間で駆け抜けたんですな。内容特盛りですよ。

 タイトルだけ見ると「新製品凄いでしょ買ってね」という内容しかないように見えてしまうが、実の内容は「新製品凄いでしょ買ってね」+「APUが活かせる環境を作ろうと頑張っていますよ」という2段構えで、個人的には普段はあまり表に出てこない後者の方がより面白かったというか。

 兎に角、AMDはGPGPUやAPU環境への取り組んでいること、既に成果も出ていること、この辺りをもっと日常的にアピールした方が良いと思った、そんなプレゼンでしたとさ。

Share

続・AMDの「APU新製品」に関するブロガー勉強会、なるイベントにてほっこりして来た件。

 本日のお題は先日の『AMDの「APU新製品」に関するブロガー勉強会、なるイベントにてほっこりして来た件。』続き。
 「個々の細かい話は別段」と書いた部分の、別段です、はい。

 ◇

 ・第二部、AMDの省電力への取り組みについて。

 まずは既にお馴染みTurboCoreの件について。省電力というよりはいかに発熱を設計ギリギリに抑えるか、という気もしなくもないのだけど。

 で、前半は一言で言うとTrinityではGPUも含めてトータルでバランスを取っていますよ、という話。
 まあこれは至極理に叶った話なワケでして。

 特にノートPCなんかの場合は少ない電力枠と放熱能力枠を奪い合っているので、枠をギリギリまで使いたい。それに、GPGPUとして活用していくならGPUも所詮は演算コア、CPUコアと一緒の枠の中でせめぎ合っていかないと、計算能力のバランスがおかしなことになってトータルパフォーマンスが残念なことにもなりかねない。

 正直な話、個人的にはGPUをCPUの中に入れてしまう以上、トータルでバランスを取るなんて出来て当たり前という気もするが。実際にはそうでもなかったと。
 この辺りはLlanoで経験値を既に積んでいるAMDのアドバンテージですな。

 次に後半は、Switchable Graphicsのお話。nvidiaだとOPTIMUSとか言っているアレ。
 一言で言うと、最新v5.0では内蔵GPUを使っている時には外付GPUを完全に電源OFFに出来ます、というお話。

 さらっと流されたけどこれ結構画期的な話だと思うんですよ。
 バスも含めてWake up必要最低限の回路以外は全てOFFにしてしまうことで、外付側がホントに「存在しないかのように」電池が持つ。
 バッテリという制約のあるモバイルだけでなく、エコが叫ばれるこの時代、デスクトップでも売りに出来る筈。

 何しろ、Intel・AMD・nvdiaという業界3社の中で、唯一、統合GPU・チップセット・単品GPUの「3点セット」を持っているのがAMD。
 この3点セットを持つ強みを活かせる技術の一つだと思うんですよコレ。
 nvidiaと違って他社CPUや他社チップセットとの相性なんて考えなくていいし、その気になれば専用回路だってチップセットやAPUの中に仕込める。

 ・・・とまぁこんな風に思っているとこで、AMD担当者よる実物デモ。
 MXM typeIIIに載ったGPUをノートPC相当の開発プラットフォームに挿すとそれだけで最大消費電力が20W近く上がるが、Switchable GraphicsのドライバがロードされるとGPUのファンも停止して、すとんと消費電力が下がって挿してない時と同じに値に、というもの。
 エコワットの簡易計測とはいえ、通電時20WのGPUに通電したままファンを止めたら火を噴くのは目に見えているので、正に「無かったこと」になっているということですな。

 #つかノート用GPUって結構電気喰うよね。

 とまぁこんな風に現物を目にするとやっぱり魅力的な機能なのだが、その後の質疑応答で残念な事実が発覚。

 「(Switchable Graphics v5.0を)デスクトップマザーボードで有効にしているベンダさんは無いです」

 ・・・え゛ー。
 兎に角、折角の技術が目の前にあるのに何か惜しいなぁ、と思うこと仕切りでしたとさ。

 ◇

 ・第三部、GPGPUとヘテロジニアスコンピューティングの話。

 ここからは一気にアーキテクチャの話に。
 まずAMDは過去からGPGPUについては色々やっていますよ、そして今はOpenCLに全力投球ですよ、というお話。BROOK+なんてまあ余程のAMDマニアでないと聞いたことすらないかも知れないが、公式なのでちゃんとこの辺りも触れてますな。
 あと、AMDからはOpenGL・OpenCLの実装や最適化に便利な、というか事実上必須のツールが公開されている、という話も。

 #BROOK+の実装のための研究の成果はきちっとOpenCLにも活かされてるんだけどねぇ。

 ちなに今回のお話、AMDの担当の方が話をしたのは言わば「AMD公式としての話」なので、この話に時代背景や当時のIntelとnvidiaの動きを重ねていくとこれまた面白い、という内容でした、はい。
 詳細を書くと長くなるので各自調べて貰うとして、Larrabeeとか、CUDAとか、キーワードは色々ありますよ。

 とまぁ、この辺りの一通りの概念の話もまあ「まとめ」的な感覚で悪くなかったが。
 もっと興味深くて面白かったのが、このお話をしてくれたAMDの担当の方と、実装レベルまでレイヤを落とした話をした時。

 OpenCLで実際にコードを書いて動かした際、パフォーマンスを発揮するにはいかにCPUとGPUで最適なロードバランスになるようにするかがキーで、ヘタクソな実装だとGPU側のパイプラインがスカスカになってしまってパフォーマンスが出ないとのこと。とはいえハードウェア能力によってこのバランスなんていくらでもブレるワケで、それを実装するとなると・・・まぁ要するにこの辺りが腕の見せ所、と。

 そして、Trinityやそれ以降のAPUでのGPGPU最適化は、従来の単品GPUをベースにしたGPGPUとは全く別のアプローチになっていくとのこと。
 キーは「メモリ帯域」と「ダイレクトアクセス」で、単品GPUと比べて圧倒的に「メモリ帯域」は狭い代わりに、GPUとCPUがハードウェア的に共通のメモリを使うことでGPUからCPU上のデータへの「ダイレクトアクセス」が出来る。単品GPUのように「CPUメモリからGPUメモリへ処理前データを入力し、処理後データを再びCPUメモリへ引き抜く」というオペレーションが不要になるので、その分より多くの時間をデータ処理に割くことが出来る、という理屈。

 ・・・なんというか、AMDもいよいよ本気なんだな、というか。
 ヘテロジニアスコンピューティング、これから面白いことになりそうですよ。
 今までx86とかARMとか命令セットだけで語られてきたアーキテクチャという概念も、もしかしたらひっくり返るかも。

 #OpenCLは自前でプログラム書いたことないんだよなぁ。
  最適化のテクとか、色々面白そうなんだけど、時間が・・・。

 ◇

 最後に以下、ちょっと雑談。

 今回も感じたのだが、国内でのAMDのプレゼンスを落としている(いた)最大の元凶は、ちらほらと醸し出される「最後の一歩が詰め切れない」感だという気がするんですよ。
 例えばBulldozerのLlanoも、国内ではもともとそこまで爆発的ヒットになるとは予想されていなかったにも関わらず圧倒的な品薄で一番の「売れ時」を逃し、結果としてSandy Bridgeの売上増加に大いにに貢献してしまった。

 もう、今のAMDに出し惜しみなんてやっている余裕は無い筈。
 でも、今回「勉強会」に参加して話を聞いた限りだと、実はまだ繰り出せるネタはあちこちに転がっているように見える。

 例えば、Switchable Graphicsをデスクトップに展開してみる。
 マザボ屋さんとBIOS屋さんと協力して、FM2世代の「プラットフォームの基本機能として」Switchable Graphics v5.0を展開する。勿論、AMD側で適当な統一ロゴを用意して、マザボ屋さんにはそれを使ってもらう。ユーザ混乱を避けるため、デフォルト設定ではどのマザボでも本体側のVGAポートを画面出力に使うよう設定を統一して貰う、なんてことも必要と思われる。
 あとは、既にタスクトレイに常駐しているVision Engine Control Centerにちょっと機能を追加して、クリック一発で内蔵と外部を切り替えられるようにしておけばOK。勿論、プロファイルを使った自動切替は必須だけど、お好みで一発切替出来るようにもしておかないと。

 こうすると「使ってない時は完全にOFFです」ので「FM2プラットフォームなら必要な時だけGPUがONになる、省エネとエコに配慮したシステムが組めます」という売り文句が一つ作れる。「普段は省電力で静か、ゲームが来たら本気出します」というマシンが簡単に構築出来る。

 この売り文句の為にAMDが準備しなくてはならない新規リソースはそんなに無い筈。モバイルでは既に動いているものなのだし、各種ソフトとの互換性チェックなんかもモバイル向けで既にやっているものをちょっと拡張すればそれで済むだろうし。

 以上、素人考えだが、例えばこんな感じで、一つでも多くの要素を積み上げてプラットフォームとしての魅力を最大限引き上げていくこと、それがAMDには大切だと思うんですよ、自分はね。

 もちろん、こんなことはAMDの中の人も分かっている筈だし、取り敢えず直近の「新APU」については「国内流通分は頑張ってがっつり確保しました」と営業担当の方も言っていたので、前回と同じ轍は踏まない筈。
 これからのAMDの「反撃」に期待してます、いやほんとに。

Share