AMDがRADEONシリーズ向けに提供しているドライバ(RADEON Software)に搭載されているGPUコアの各種設定ユーティリティGPUクロック、供給電力、メモリクロック、GPUの温度、冷却ファン速度が設定可能となっており、これらが相互に影響する事を示す

VR環境をより安く ~AMDの新グラフィックスカードが狙うもの~ 前編

  • このエントリーをはてなブックマークに追加

by [2016年6月20日]

RADEON RX480のお披露目の場となったCOMPUTEX TAIPEI 2016での発表内容を伝えるAMDのプレスリリース

RADEON RX480のお披露目の場となったCOMPUTEX TAIPEI 2016での発表内容を伝えるAMDのプレスリリース

現在のVR環境で一番の問題は何かと問われれば、恐らく業界関係者のほぼ全員が「VR環境のためのシステム一式のコストが高すぎることだ」といった意味のコメントを発するのではないでしょうか。

VRの要となるヘッドマウントディスプレイ(HMD)と、VRに必要なステレオグラフィック画像をリアルタイムで生成するために必要な高性能グラフィックスカードと高性能CPUを搭載したパソコン。

この2つを揃えるだけで簡単に20万円を突破する、場合によっては30万円、40万円といった高額の請求書が示されるのですから、バブル期(※注1)ならばともかく、今の日本でその請求書に一も二も無く支払いを行える人はそれほど多くないことでしょう。

 ※注1:バブル絶頂期にはハードディスク無しのフロッピーディスクドライブのみ内蔵の本体が定価368,000円、純正ディスプレイテレビとセットだと合計で約50万円もした某社のホビーパソコンが飛ぶように売れたという逸話があります。ちなみにバブル崩壊直後の1993年に大学に入った祝いでパソコンを買って貰った筆者でさえ、その予算として親から100万円を渡されるという今からすると全くあり得ないような話があったりしました。

それは言い替えれば、VRを本格的に普及させるには、是が非でもパソコンとHMDのいずれか、あるいはその両方の価格をこれまでよりも大幅に引き下げねばならないことを意味します。

そして同時に、その引き下げられた価格で購入出来るシステムでは、それによって得られるVR体験を十分なものとするため、これまでと同等以上のグラフィック画面表示機能が提供されねばなりません。

しかもVR対応HMDの価格は基本的に搭載されている2枚ないしは1枚のディスプレイパネルの価格に依存していますから、これの品質・解像度を落とさずに価格を引き下げるのは至難の業です。

また、パソコン本体を構成するマザーボードや電源、メモリといった部品の価格を、それも品質や性能を落とさずに今より引き下げるのも、もう不可能に近い状況(※注2)です

 ※注2:以前筆者がアルバイトで働いていた秋葉原の某パソコン専門店では、いわゆる自作パソコン向けパーツの利益がハードディスク1台で数円とかそんな状況で、店としてはごく一部の例外を除くとそれ以上値下げを行うのがほぼ不可能となっていました。

そのような状況下でVRシステムで性能を落とさずにコストダウンできる部品があるとすれば、恐らくグラフィックスカード、そしてそれに搭載されているGPU(Graphic Processing Unit)が最も可能性が高いと言えるでしょう。

そしてこのほど、Windowsパソコン向けGPUメーカー大手の一角を占めるAMD(Advanced Micro Devices)社から、Oculus RiftやHTC Viveなどの要求する性能を満たしつつ従来製品よりも低価格化した新世代GPUとして、新アーキテクチャ”Polaris”の採用を掲げてRADEON RX480が発表されました。

そこで今回は、なぜそのRADEON RX480が低価格高性能を実現できるのか、記事執筆時点で発表されている情報を元に考えてみたいと思います。

基本スペック

まずここでRADEON RX480の現時点で公表されている基本的なスペックを見てみることにしましょう。完全ではありませんが、性能やその特性を類推するにはこれで必要十分です。

・単精度浮動小数点演算性能:5TFLOPS以上
・演算ユニット(Compute Unit:CU)数:36基
・メモリインターフェイス転送帯域:256GB/s
・メモリ容量と種類:4GBないしは8GBのGDDR5メモリ
・メモリバス幅:256ビット
・消費電力:150W
・対応するDisplay Portバージョン:1.4

以上となります。

もっとも、これらのスペックを並べられても「で、それのどこがどうなの?」と思われる方が多いことでしょう。

Sapphire R9 FURY X 4GB HBM 3DP HDMI PCIERADEON R9 FURY Xを搭載するグラフィックスカードの例。現行AMD製シングルGPU搭載グラフィックスカードの最上位モデルにあたる

Sapphire R9 FURY X 4GB HBM 3DP HDMI PCIE
RADEON R9 FURY Xを搭載するグラフィックスカードの例。現行AMD製シングルGPU搭載グラフィックスカードの最上位モデルにあたる

そこで、現行最上位のRADEON R9 Fury Xのスペックを同じように書き出してみるとしましょう。

・単精度浮動小数点演算性能:8.6TFLOPS
・演算ユニット数:64基
・メモリインターフェイス転送帯域:512GB/s
・メモリ容量と種類:4GBのHBM1メモリ
・メモリバス幅:4096ビット
・消費電力:275W
・対応するDisplay Portバージョン:1.4

一目瞭然かと思いますが、メモリの種類とそれがもたらすハードウェア的な制約による搭載メモリ量上限以外では(あまりに過大な消費電力を含めて)現行最上位のRADEON R9 Fury Xの性能は、競合他社のハイエンド製品に見劣りする部分もあるものの色々圧倒的です。

HBM(High Bandwidth Memory)の構造を紹介したAMDのページオレンジ色のメモリチップが複数枚積み重ねられ、それらを貫通して配線が引き通され、さらにこれらのチップ群がサブ基板にGPUチップと並べて実装されている。このメモリは従来のGDDR5を大きく上回る転送帯域性能を実現するが、残念ながら現状では高コストに過ぎるためRADEON RX480では採用されていない

HBM(High Bandwidth Memory)の構造を紹介したAMDのページ
オレンジ色のメモリチップが複数枚積み重ねられ、それらを貫通して配線が引き通され、さらにこれらのチップ群がサブ基板にGPUチップと並べて実装されている。このメモリは従来のGDDR5を大きく上回る転送帯域性能を実現するが、残念ながら現状では高コストに過ぎるためRADEON RX480では採用されていない

RADEON HD7950・HD7970以降のAMD製GPUではGCN(Graphics Core Next)と呼ばれるアーキテクチャが(多少の改良はあるものの)踏襲され続けていて、演算ユニット1基あたりの基本性能は動作クロック周波数その他の条件が同一ならばほぼ同等となっているため、このRADEON R9 Fury Xでは量的・数的な強化がストレートに効いている印象です。

言い替えると、今回のRADEON RX480はこのRADEON R9 Fury XやRADEON R9 NanoのようにHBM1規格の積層メモリを採用した、演算性能で圧倒的優位に立つ現行ハイエンドグラフィックスカード群を置き換えるものではない、ということになり、実際にもRADEON RX480発売開始後も当面はRADEON R9 Fury XがAMD製GPUの最上位モデルという位置づけになる予定です。

それでは、このRX480は一体どのようなグラフィックスカードの置き換えを狙った製品なのでしょうか?

Sapphire R9 290 4GB GDDR5 DP HDMI 2DVI PCIEAMD RADEON R9 290搭載グラフィックスカード、それもAMD標準のリファレンスクーラーを搭載するモデルの例。Oculus Riftの推奨動作環境の最下限に位置するカードであり、現時点でVR対応を謳うにはこのカードと同等あるいはそれ以上の性能が必要となる

Sapphire R9 290 4GB GDDR5 DP HDMI 2DVI PCIE
AMD RADEON R9 290搭載グラフィックスカード、それもAMD標準のリファレンスクーラーを搭載するモデルの例。Oculus Riftの推奨動作環境の最下限に位置するカードであり、現時点でVR対応を謳うにはこのカードと同等あるいはそれ以上の性能が必要となる

そこで比較のため、Oculus Riftで推奨スペックを満たすGPUの最下限として示されたRADEON R9 290のスペックもRX480と同じ記法で書き出してみると以下の通りとなります。

・単精度浮動小数点演算性能:4.9TFLOPS以上
・演算ユニット数:40基
・メモリインターフェイス転送帯域:320GB/s
・メモリ容量と種類:4GBのGDDR5メモリ
・メモリバス幅:512ビット
・消費電力:非公開
・対応するDisplay Portバージョン:1.4

なお、この機種は消費電力が非公開ですが、電源コネクタの構成から225W以上300W未満、同世代かつ上位のRADEON R9 290Xが公称典型消費電力250Wとされていることから、実際には225Wと250Wの間位の消費電力であると推定できます(※注3)。

 ※注3:筆者はこのRADEON R9 290を現用中ですが、元々電源の給電能力に充分な余力があるとは言え、また電源ケーブルのピン配列を変換するアダプタを介してとはいえ、PCI Express電源コネクタが6ピン×2、つまり最大225Wまでの給電能力を公称するマシンにおいて、ピークに近い負荷がGPUに連続してかかる状況でも特に問題なく利用できています。このことからも、このカードの消費電力は225Wを超えてもさほど大きくならないレベルの値が上限である可能性がかなり高いということになります。

また、メモリ周りの性能ではバス幅がRADEON RX480の倍となるRADEON R9 290の方が幾分高く、演算ユニット数でもRADEON R9 290が約1割増し、にもかかわらずGPUとしての演算性能を示す単精度浮動小数点演算性能ではわずかながらRADEON RX 480の方が上回っていることがわかります。

シェーダプロセッサの1ユニットごとの性能は、双方共に基本アーキテクチャがGCNでほぼ同等と考えられることから、元々演算ユニット数が少ないRADEON RX480がRADEON R9 290を少しでも上回る性能の発揮が可能であるとすれば、それは事実上、前者のGPUの動作クロック周波数が後者のそれを演算ユニット数の差を埋める程度には上回っているということを意味します。

元々RADEON R9 290はGPUコアの定格動作クロック周波数が未公開ながらブーストクロック、つまり定格超過のオーバークロック動作を行っているときのクロック周波数が947MHzで、RADEON HD7970(定格1,000MHz、ブースト時1,050MHz)よりも100MHz以上、つまり1割ほど低く設定されていました。このことから考えるとRADEON RX480のコアクロック周波数は標準で1GHzを少し超えたか超えないか程度の値である可能性が高いと言えます。

VR対応グラフィックスカードが199ドル!

さて、ここまで伏せてきましたが、今回発表されたRADEON RX480はその搭載グラフィックスカードがアメリカで199ドルにて発売される予定であることがアナウンスされています。

これは現在の為替レートで日本円に換算すれば約21,000円、俗にAsk税と揶揄される、決して市場規模が大きいとは言えない日本国内での輸入販売サポートにかかるコストが上乗せされたとしても、恐らく日本市場での初値が36,000円~37,000円程度までのレンジに収まる可能性が高いと推定できます。

ちなみにRADEON R9 290の発売時価格は299ドルで日本市場での初値は5.5万円程度、水冷かつ初物のHBM1積層メモリを搭載するRADEON R9 Fury Xは何と649ドルで日本での初値が約11万円でしたから、いずれにせよRADEON RX480はその性能からするとかなり安い値段で発売されるカードである訳です。

クロック周波数を上げるのはそう簡単ではない

AMDがRADEONシリーズ向けに提供しているドライバ(RADEON Software)に搭載されているGPUコアの各種設定ユーティリティGPUクロック、供給電力、メモリクロック、GPUの温度、冷却ファン速度が設定可能となっており、これらが相互に複雑に影響しあう事を示す。GPUチップメーカー純正のツール故にこれはおとなしめの設定項目となっているが、オーバークロック動作を売りにした製品では、コア電圧やメモリ電圧まで変更可能なものが存在する

AMDがRADEONシリーズ向けに提供しているドライバ(RADEON Software)に搭載されているGPUコアの各種設定ユーティリティ
GPUクロック、供給電力、メモリクロック、GPUの温度、冷却ファン速度が設定可能となっており、これらが相互に複雑に影響しあう事を示す。GPUチップメーカー純正のツール故にこれはおとなしめの設定項目となっているが、オーバークロック動作を売りにした製品では、コア電圧やメモリ電圧まで変更可能なものが存在する

さてここで、「動作クロック周波数を上げるだけでそんなに簡単に演算性能を引き上げられるのならば、どうしてこれまでやってこなかったのか?」と思われた方もおられることでしょう。

実を言うと、動作クロック周波数の引き上げはそう簡単な事ではありません。

同じ半導体製造プロセスのままで動作クロック周波数を引き上げるには、チップ自体の生産歩留まりを引き上げて1枚のシリコンウェハーから採れる良品チップの数を増やす=母集団の規模を大きくして、その中で更に選別を行って高周波数での動作に充分耐えるチップを選び出さねばならないからです。

半導体の生産では、一般にフォトレジスト法、つまり写真と同様にシリコンウェハー上に感光剤を塗布して回路パターンを露光、現像処理を行って不要な部分の感光剤を除去した上で必要な部位にだけ酸化膜などを形成する手法を用いて回路が形成されるわけですが、この手法では回路パターンの原本の露光を行う際に、どうしてもごくわずかですがピンぼけが生じることがあります。

ピントが合っていれば高い周波数でも問題なく動作するのですが、それがボケていると配線の幅が適切でなくなって低い周波数でしか動作しなかったり、あるいは配線パターンが細くなりすぎて実質的に断線状態となり、そもそも動作しなかったりするのです。

これが同じウェハー上で作られたチップに当たり外れが生じる主な理由の1つなのですが、この結果中央のピントの良く合った部分では高クロック動作品が、外縁の今一つピントの合わない部分では不良品が、それぞれ出やすくなってしまいます。

もちろん、ウェハーの平滑・平坦性や不純物の混入状況、フォトレジストを行う機材の動作精度、それに露光する光の波長などさまざまな要素がからみあっての品質ですから、これは「そういう傾向がある」というレベルの話なのですが、それでも同じウェハーからそうして品質の良いチップと悪いチップが生産されてしまうことだけは(程度の差こそあれ)避けて通れません。

ただ、それほど品質の良くないチップでも本来の定格クロック周波数で動作させて問題が無ければそれは「良品」で、余程のことがない限りさほど手間をかけずにそのレベルまでは到達できます。

しかし、そこから一歩踏み込んでクロック周波数を規定値より一定程度引き上げて連続使用しても問題ないレベルの品質の「良品」を充分な数得るとなると、そのための選別コストや生産工程の改善コストが馬鹿にならなくなってきます。

また、それほど品質の良くない「良品」チップでも入力する電圧を上げる(※注4)など幾つかの手法を用いればより高いクロック周波数での動作が期待できるようになるのですが、それを行うとチップの寿命が指数関数的な勢いで縮んでしまうことがあるため、それはそれでリスキーです。

 ※注4:これはCPUのオーバークロックでも昔から用いられている安定動作のための常套手段で、俗に「活入れ」などと呼ばれます。ただし、後述するようにこの手法を用いると回路に高電圧がかかることから設計時に想定されているよりも格段に短い期間でチップ内部の絶縁膜破壊などが起きてチップそのものが使い物にならなくなる恐れがあって、また電圧を上げればそれに比例して回路で発生するジュール熱が増えるため、冷却コストもまた増大します。

さらに、この種の選別ではもう一つ重要な問題があります。選別に漏れたいわゆる「外れ」のチップの扱いです。

基本的には通常の定格動作クロック周波数の製品に積めば良い話で、選別のコストは選別で「良品」となったチップを搭載する最終製品の価格に転嫁してしまえばそれで済む話でもあるのですが、「当たり」の良品が出る率が期待値を下回った場合、価格と性能のバランスの問題があるため際限なくその選別コストを「良品」に負担させることはできませんから、最悪の場合「外れ」のチップを搭載した製品の価格にも一定比率で選別コストが転嫁されることになってしまいます(※注5)。

 ※注5:過去にはこの問題の対策として、動作クロック周波数の引き上げ率を二段階に分けて、極力「当たり」となる率を大きくする工夫を行ったグラフィックスカードメーカーもありました。例えばGPUのコアクロック周波数の引き上げには強いもののメモリインターフェイス周りの速度が上がらない、といったチップだけをまとめて、本来の「当たり」チップを用いたオーバークロックモデルの下位機種、定格クロック動作モデルの上位機種という扱いで販売する訳です。ちなみにCPUでもやたら細かく動作クロック周波数ごとに製品が細分化されているのが一般的ですが、これも元々は同じく良品率の問題から編み出されたアイデアでした。

Sapphire R9 290 Vapor-X TRI-X 4GB GDDR5 DP HDMI 2DVI PCIE先に示したリファレンス仕様カードの後で発売された、AMD RADEON R9 290搭載のオーバークロック動作モデル。高発熱に耐えられるよう、冷却ファンが大幅に増強されている

Sapphire R9 290 Vapor-X TRI-X 4GB GDDR5 DP HDMI 2DVI PCIE
先に示したリファレンス仕様カードの後で発売された、AMD RADEON R9 290搭載のオーバークロック動作モデル。高発熱に耐えられるよう、冷却ファンが大幅に増強されている

付け加えて言えば、一般に動作クロック周波数の引き上げはその引き上げ率よりも高い率での発熱量増大を伴います。そのため、従来のクロック周波数での動作を前提とした冷却系の設計は見直しが必要となり、場合によっては全面的に冷却系を作り直す必要が生じます。

市販グラフィックスカードの中には、GPUチップメーカーが公称しているよりも高い動作クロック周波数で動作させるオーバークロックモデルが少なからずありますが、それらがほぼ例外なく冷却能力を向上したと謳う高性能クーラーを搭載しているのは、定格動作での放熱に最適化された純正クーラーでは熱容量的に不十分となるためなのです。

つまり、同じ半導体製造プロセスでのチップ生産を前提とする限り、動作クロック周波数を当初設計での想定上限値から引き上げるというのは、生産ラインでの歩留まり向上などが期待できる状況や他に高速化の手段が無い中で絶対性能が求められる場合を除き、チップ選別と放熱対策でコストがかかるため、あまりクレバーな策ではないのです。

それでは、今回のRADEON RX480は一体どのようにして動作クロック周波数の引き上げを問題ないレベルで実現しているのでしょうか。

後編ではそのあたりから見て行きたいと思います。

▼参考リンク
Polaris Architecture
Radeon™ RX 480 set to drive premium VR experiences into the hands of millions of consumers; starting at just $199
AMD Showcases New High-Performance Solutions at COMPUTEX TAIPEI 2016

タグ:
PageTopへ