AMD好きはもう少し夢を見てても良い、らしい。

 以下、全て噂レベルの話なのでツッコミ無用。
 そういう話もあるとか無いとか、というレベルの話なので。

 ◇

 AMDはBulldozerの次のx86コアアーキテクチャを現在開発中の模様。陣頭指揮は勿論Jim Kellerとのこと。
 今のところ一切の情報は公開されていないが、Bulldozerのダイ面積効率重視から命令実行効率重視へと転換し、SMTを実装するだろうという風の噂。
 最短で登場するのは2015年末、Excavatorの次のコアとしての見込み。

 ちなみにこのJim Kellerって人は俗に言う天才らしく、

 ・DECでAlphaの設計に関わり
 ・AMDでx86-64のデザイン、HyperTransportのデザイン、およびK7/K8の設計に関わってAMD CPUの黄金期の礎を築く
 ・P.A.Semiで特殊用途のPowerPC互換チップ開発に関わる
 ・P.A.SemiがAppleに買収された後はARM互換のApple製チップの開発に関わる(A4・A5と言われている)
 ・2012年末にAMDに再度入社

 という凄まじい職歴の持ち主。
 そしてK7のバスがAlphaのEV6バス互換だったり(実際AMD761 NorthBridgeはAlpha 21264でも使える)、HyperTransportにもEV6の影が見え隠れするのもこの人がAlphaに関わっていたからです、はい。

 ◇

 ・・・以上、全て噂のレベルを出ていないのだけど。
 海外のPCネタ噂系サイトでも殆どスルーされているというレベルなのだけど。
 それでも、AMDがx86のパフォーマンスコアを諦めていない、という噂が出てきただけでも良かったというか。

 以上、AMDファンが夢を見ていられる時間がもう少しだけ延びましたよ、という話でしたとさ。

Share

Steamroller 16Core Opteronは死んでいない?!

 ・・・マジですか。

 CESでもあんまり楽しい話は無かった上に、国内PCパーツは為替の影響で値上がり傾向、NAMMまで楽しいそうな話は聞かないかな・・・なんて思っていたところに、とんでもないニュースが飛び込んできましたよ。

 AMDが開発者向けに公開している「プロセッサの仕様と癖のまとめ」というドキュメント(Optimization Guide)が、2年ぶりに改訂されたんですが、その中にこっそりととんでもない表記が。

 >Rev 3.08 Extended coverage to Models 30h–4Fh 

 AMD Family 15hというのは要するにBulldozerで、10hが初代Zambezi、20hがPiledriver、30hがSteamroller(先日発売されたKaveriがコレ)、そして40hがExcavator(予定)なので、このドキュメントが正しいのであれば、パフォーマンス向けCPUをまだAMDは諦めていないということになる。

 但しこのテのドキュメントについては「仕様は出たけど現物は?」ということも往々にしてあるので、過度な期待は禁物なんですよ。
 世の中にはサンプルチップどころか実動する開発用ボードまで出来たのに結局お蔵入りってブツすらあるんだし。

 ・・・でも、でもね。
 こんな具体的なこと書かれてしまうと期待しちゃうじゃないですか。

 ・Steamroller、Excavator世代は1ダイで16コア
 ・1ダイに2つのHTリンク、1つのPCI-Expres 3.0リンク、2つのHT/PCIe3.0切替式リンクを装備
 ・CPUコア、メモコン、IOリンクをクロスバー接続

 ちなみにこれ、昔一瞬名前が出てすぐ消えた、Socket G2012のスペックそのものです。

 ぶっちゃけこんなサーバ用途しか考えていないCPUがAM3+に来るとは思えないが、GF 28nmが使えればSteamroller 16コアを3GHz超で回しても115Wで収まる筈なので(現行6380は2.5GHz/115W)、同一消費電力枠ならばクロック向上+コアのIPC改善で最大40%程度の処理能力向上が期待出来る筈。これ結構な違いですよ。

 ♯まぁ勿論これでもコアあたりの実行効率ではHaswellには追いついていないが、Zambeziのようにダブルスコアなんて差をつけられることは無くなるだろうし、その分物理コア数でカバーするのがBulldozerなので。

 更に希望的観測に妄想が入った状態で書き続けると、Bulldozerのコンセプトは登場当時より現在の方が「比較級で」受け容れられ易くなっている。IntelですらXeon E5でコア数を急速に増やしているように、既にそっちの方向でしか処理速度の向上は望めないという事実が漸く浸透し始めたので。

 ・・・さて、Socket G2012は日の目を見るのか。
 CPUは発売されるのか。どっか付き合ってM/B出してくれるOEMはあるのか。
 というか、こんな状況でTyanとSupermicroがAMDサーバ部門にお付き合いしてくれるのか。

 新年早々、ちょっとだけ妄想のネタが増えて嬉しい管理人でした、とさ。

Share

AMDサーバ用プロセッサロードマップ公開で、見えてきたAMDの戦略と現実。

 Twitterで絶叫してしまったが、このネタは外せない。
 AMDのサーバ用ロードマップが出てきて、見えてきた現実は、当方の思っていた以上にシビアだったという。

 ということで、ちょっと書いてみる。

 1◆Steamrollerパフォーマンスコアが出てこない?!

 何より衝撃的だったのはコレ。8コアSteamrollerが何処にも無い。
 これ普通にIvyBridge-EPとの勝負を投げたとしか思えないんですよ、自分には。

 まぁ意図して投げたというよりGFのプロセス絡みで投げ「ざるを得なかった」のだと信じたいが、とはいえPiledriver、しかも32nmでIvyBridge-EPと対抗しようというのはもう自殺行為にしか見えない。
 確かにGF32nmでもRichlandでTrinityから同一TDPで10%近くクロックを上げられたので、Opteronも(もしかしたらFXも)同程度のエンハンスメントは出来るだろうが、IvyBridgeが相手じゃその程度では・・・。

 #TSMC28nmで作れるようにするファウンダリ移行作業が全然進んでないのか、既に失敗してリカバリの見込みすらが立たないのか、最初からGF32nmと心中する気なのか、というかそもそもSteamrollerパフォーマンスコアなんてものが存在しないのか。

 また、FXシリーズのSteamrollerが出てくる可能性もこれで消えたと思っていい。
 所詮FXはOpteronの余り物なので、Opteronが出てこないならFXも出てこない。
 まぁAM3+も息長いし、Piledriverを最後にこのままフェードアウトってことですかね・・・。

 2◆Kaveriの姿が見えてきた。

 元ページにあるBERLINのブロック図。これはKaveriそのものでしょう。
 何故って、BERLINとKaveriを作り分ける理由が無いから。

 #勿論最終的にはアプリ認証とかで差が出てくるのだろうけど。現在のRadeonとFireProの関係と一緒。
  ・・・デスクトップ版でもECCメモリサポートして下さいお願いします(笑。

 で、このブロック図を見ると気になるのはこの辺りか。

 ・Steamroller 4コア。

 →以前6コア版が出るの出ないのという噂があったが、これ見る限りでは4コアで確定か。
  にしても演算性能は足りるんかいな?

 ・PCI Express 3.0。

 →AMDでもついにサポート入るよ~。

 ・DDR3-1866 Unbuffered ECCメモリサポート。

  →わ~い、DDR3-1866 Unbuffered ECCという「現時点では多分世界中でS.Kazぐらいしか欲しがっていない」製品がこれで出てくるぞ、きっと。

 ん~、よく言えば手堅い、悪く言えば新味の無い構成ですな。

 3◆FM2+はECCメモリをサポートする?

 Kaveriの話で敢えて触れなかったのが、正直よく分からないソケットについて。

 FM2+はFM2と基本互換の筈で、FM2にはメモリ用データ線が64bit分しかない(物理線的にECCメモリが使えない)という話を以前聞いたことがあることを考えると、FM2+でもECCメモリを挿すことは出来ず、サーバ用には新しいソケットを作るしかないということになる。

 が、現在のAMDの状況を考えると正直新しいソケットというのはハードルが高いし、FM2の設計時にAPU Opteronなんて当然視野に入っていただろうから、最初から何か仕込みがあっても別に不思議ではない。

 ・・・もしかして、FM2+ではReservedとかNCピンを活用して72bitデータ線を実現している?
 16ピン分何とか捻出出来ればいいワケで、これが一番「ありそう」なセンではある。
 ついでにPCI Express 3.0正式対応と電源周りの強化もするんだろうな、きっと。

 ♯あでもECCメモリがサポートされるのなら日常使いマシンはAPU化かな(笑。

 4◆Socket AM3+とSocket C32が消滅する?

 そして、上記の以下の項目を再整理すると以下の結論が出る。

 ・1P OpteronはAPUに移行する
 ・Steamroller パフォーマンスコアは出てこない

 →Socket AM3+とSocket C32は用無しとなり消滅する

 Socket AM3+は兎も角、Socket C32を見捨てるのは早いなぁ・・・と。

 まぁ現在のマーケットシェアではAM3+/FM2/C32/G34と4種類もプラットフォームを維持している方が異常且つカネの無駄なのであって、さっさと処置すべきなのだが、いよいよその時が来たか、と。

 そうなると5GHz Piledriverはいよいよ本当に「最後の華」になってしまうのかこれは・・・。

 ◆◆◆

 まぁそんなワケで、いよいよAPU1本に勝負賭けてきた、というかそれ以外のウリが無くなってしまったAMD。
 頑張れとしか言いようがない・・・。

 最後に、普段はこういうことはしないのだが、AMD Opteron blogのサーバロードマップ解説のエントリをそのまま超(適当)訳したものを載せてみる。皆さんはどう読みますかね。
 ちなみにこの英語エントリを書いているのはAMDサーバ部門のVP(副部長)。訳してる当方は専門家ではない上超速で書き殴っているので、明らかな誤訳があったら指摘していただれば。

 元記事>http://community.amd.com/community/amd-blogs/business/amd-operon/blog/2013/06/17/amd-reveals-plans-and-products-to-shake-up-the-enterprise-market-in-2014

—————–
AMDが2014年のエンタープライズ市場を刷新するためのプランと製品を公開

 AMDは本日最新版のサーバーロードマップを公開しました。そこで今回は私達AMDが何を目指しているか紹介してみたいと思います。
 AMDは現在、ビッグデータ・クラウド・Webホスティング・仮想化等の現在急拡大しているコンピューティング用途に適した最新の技術を投入し、エンタープライズサーバ市場でのシェアを取り戻すことに注力しています。
 そしてその目的のため、AMDは2014年にはx86とARMの両アーキテクチャの3種類のプロセッサを発売する予定です。以下のスライドをご覧下さい。

 Berlin (APU Opteron)

 世界初のサーバ用APUである「Kyoto」の発表が成功裏に終わった後、AMDのx86ビジネスを更に強化するために用意するのが「Berlin」、更なる高パフォーマンスと電力効率向上を目指した製品です。この製品はCPUとAPUが用意されます。
 このプロセッサは次世代Steamrollerコアを4つ内蔵し、現在のOpteron 6386SEと比べて演算速度/消費電力比でおよそ8倍程度の性能を発揮します。
 そしてこのプロセッサはAMDの革新的なHSAアーキテクチャを採用する最初のAPUとなり、CPUとGPUの双方から同一のメモリ空間にアクセス出来る仕組みはプログラミングを劇的に容易にするでしょう。
 更に並外れた消費電力効率により、このプロセッサはラックへの高密度なサーバ実装を可能とします。
 登場予定の2014年前期をお楽しみに。

 Seattle

 一方、「Seattle」は現在の「Kyoto」の2倍から4倍というパフォーマンスと劇的な消費電力削減とを実現します。
 「Seattle」は業界で唯一の、サーバ用プロセッサ供給実績のある会社から登場する、64bit ARMアーキテクチャを採用したサーバ用SoCです。
 このプロセッサは128GBのメモリをサポートし、より高い電力効率とCPU負荷低減のため暗号化および圧縮専用のオフロードエンジンを備え、更に10Gbイーサネットも統合されています。更にこのプロセッサは高密度実装システムのために先進のFreedamFablicをも内部に直接統合しました。
 「Seattle」は今年後半に生産を開始します。

 Warsaw

 最後に、日々複雑になっていくコンピューティング用途に対するAMDの回答が「Warsaw」、次世代の2ソケット・4ソケット製品です。このプロセッサは2ソケット・4ソケットサーバに類を見ないコスト競争力を提供します。
 このプロセッサは現行のOpteron 6300シリーズと比べてより電力効率に優れ、且つOpteron 6300シリーズから容易にアップグレードが可能です。そして2014年の第一四半期に製品は提供開始予定です。

 世界今変化の最中です。より多くのユーザーが10億以上のデバイスをクラウドに接続するようになり、コンピューティング・ネットワーキング・ストレージの需要が急激に増加していますが、これらのプロセッサはそれらの処理を捌くのに最適です。
 クラウドコンピューティングの時代には旧来と同じやり方は通用しません。だからこそ私達AMDには新しい技術、製品、そしてビジネスモデルが必要なのです。

 私達AMDはx86ビジネスを強化し成功するため、クラウドやその他急激の増加するコンピューティング需要に最適化されたより電力効率の高いサーバの開発や、オープンコンピュート仕様のようなオープンな技術、オープンソースツールへの取組みを計画しています。

 詳細については、製品が出荷開始され私達の事業がまた一歩前進するその日をお楽しみに。
—————–

Share

これが本当のAPUの「生きる道」。

 ・・・だよなぁ、と。SONY PS4の発表を見ていて思った。いや本当に。

 PC用APUとはなんてったってメモリ帯域が段違い。これだけの帯域があればGPU性能も存分に振り回せるというもの。
 グラフィックスとして使うにしても、GPGPUとして使うにしても、これだけあれば使い物になるでしょ。

 #逆に言うと、PC用としてのAPUがどれだけメモリ帯域に苦労しているのか、ということだけど。

 にしてもこの「カスタム」チップ、カスタムにしておくには勿体ない気がする。並列演算用の演算ノードとして相当使い易そうなのだけど。
 そこそこの性能のGPGPU+コントローラとして十二分な性能のx86コアが同一メモリ空間を共有している上に、GPUの性能もスポイルされない。CPU側でデータの配列・入出力・同期を行い、GPU側で並列演算を回す。8GBというメモリ容量もリッチだし、これこそHSAが目指す理想的なハードウェア構成。

 まぁメモコンがECCに対応しているかとか、汎用バス(PCI-Express)の帯域足りているのかとか、細かいところは色々あるが。
 取り敢えずSeaMicroのブレードのバリエーションとしては絶対アリでしょ、これは。

 いやね、このチップの売り方というか扱いについては、AMDはSONYと真面目に交渉すべきだと思うよ本当。
 売り方さえ間違えなければnVIDIAに押されっぱなしというかほぼ制圧されつつあるGPGPU市場での、起死回生の切り札に出来るだけのポテンシャルはあると思う。
 最高性能でこそないものの、量産チップをベースとすることで価格性能比に優れ、且つx86バイナリが動き、メモリ空間を共有するHSAアーキテクチャで扱い易い。

 通常CPUとGPGPUをバラバラに組み合わせる「GPGPUサーバ」がワンチップになったもの、という言い方すら出来てしまう。
 ワンチップがそのままワンノードとなり、Freedom Fablicと組み合わせればレイテンシも低くてデータ転送効率にも優れたGPUクラスタが出来上がってしまう。器を新しく作る必要もない、SeaMicroの箱がある。

 ・・・いやね、こうやって見ると、さ。
 GPGPU本格活用時代って、ホントに目の前なんだな、と。

 #にしても、HSAアーキテクチャを初めて本格的に活用するのはPS4ソフトウェア、ってことになるのかしらん。

Share

2013年のAMDは・・・

 さてと、今更ですがCESで見えた~その後のAMDの今年の展開でもちょっとまとめてみますかね。

 まずはAPU。
 今回一番注目されていたのは今年前半に製品が出るというJaguarですな。Bobcatの流れの低消費電力プロセッサで、PS4だとかXbox720もCPUコアはコレだなんて噂もあったりしたり。
 で、BobcatもAtom以上Celeon以下ぐらいの場所でぼちぼち使われていたが、IPC改善に加えて4コア、そしてHSA対応というのがJaguarのポイントかと。これが予定通り出荷出来ればAtomに普通に対抗出来る仕上がりなのでモバイル分野でのシェア向上も狙えるし、HSA対応ということで他の使い方もありそう。SoCなので目立たないだろうが、AMDの業績改善にはかなり貢献するんでないかな。

♯個人的にはコレ積んだMini-ITXボードが出回るの期待します、はい。一時期E-350とかE-450積んだのが流行ったみたいな感じで。

 で、あまり注目されなかった方、TrinityのマイナーアップデートであるRichlandはノート向けに既に出荷開始済み、デスクトップもそう遠くないうちとのこと。
 まぁCoreは所詮PiledriverなのでCPU性能が劇的に改善しているとも思えないが、AMDにはuncoreの改良だけでZambeziから10%近くIPCを引っ張り上げたなんて実績もあるので、今回も全く手を入れてないということはないでしょう。まぁ最低でもクロック引き上げ分は素直に性能に出るので、5800よりは演算性能も多少上がるか。
 グラフィックについてはRadeon 8000番台を名乗るようだがこちらは中身はVLIWという噂。このタイミングならGCN載せてきても良いて思うのだが、HSAと合わせてってことですかね。パフォーマンス増分はクロック向上とGPUの改良で稼ぐってことかな。

 一方、Steamroller+GCNで本当の意味でのTrinity後継、Kaveriについては年内狙いとのこと。まぁノート優先だろうからデスクトップ版はギリギリ年末商戦か、来年送りでしょう、きっと。
 で、コレについては個人的にはソケットは変わらない、変える理由も無いと思うのだが、世間ではソケット変えるぞという話も。まぁ一つ話として分かるのはDDR4への対応というのだが、時期的にFM2のソケット設計段階でその辺りは考慮に入れてあるだろうと。なので、万が一あっても「FM2+」(DDR3/DDR4両対応)であって「FM3」ではないと思うのだけどね。んで、当分はDDR3しか使わないので事実上は「無印」FM2のまま、てな展開に・・・あってもこの程度でないのかねぇ。

 ♯メモリ帯域不足を少しでも補うためDDR4が欲しいというのはAPU的には切実だが、一方でお値段の問題もまたとっても切実なのであり。

 次にFXとサーバ用。
 取り敢えず・・・Steamrollerは年内は無いということね、コレは。というか、ヘタするとSteamrollerが単品で出るかどうかすら怪しいとか言いたくもなるよね、こんなんじゃ。
 あ、勿論、サーバ向けでSteamrollerが出るのが100%確定している以上、FXが更新されないことはあり得ないですよ。時期的に最後のDDR3対応、最後のNorth独立チップかも知れないし。

 ・・・というか、Steamrollerをホントに早く投入しないとAMDのサーバ部門がいよいよヤバいのでは。
 今のところコア数の多さが効く特定ジャンルの仮想化サーバ(仮想端末集約系ね)では唯一辛うじて選択肢に入るものの、Steamrollerが遅れたらこの「最後の取り付く島」すら無くなっちまうし。急げ急げ、息のあるうちに。虫の息とはいえあるのと無いのは雲泥の差。

 最後にGPU。
 Radeon 8000系はもう規定通りというか予定通りというか。
 ちなみに久々に400番台(映ればいい系。6450とか)もリフレッシュがかかって上から下まで完全にGCN血統になるようですな。
 ・・・ちなみにその「8470」、中身は7750の丁度半分とか。演算コア数よりメモリ帯域が気になったり。

 ◇

 以上、こんな感じですかね。
 まぁ一行に要約するなら、こんなん↓で。

 JaguarとKaveriが予定通り出せれば、少なくとも去年よりはマシな年。

Share