iMac Proエアフローイメージ左下に上下2基ずつDDR4メモリのDIMMソケットが搭載されていることから、CPUはその間に搭載されている事と、そこからヒートパイプで下部中央のヒートシンクへ熱を導き、ここで上部から送り込まれた冷却風を当てて放熱していることがわかる。位置関係と構造から、GPUは右下部に搭載されていると推測できる

Appleが示すVRの進む道~Apple、VR対応iMac・iMac Proを発表~前編

  • このエントリーをはてなブックマークに追加

by [2017年7月04日]

Apple iMac Proディスプレイ一体型Macのラインナップに追加された、高性能上位機種

Apple iMac Pro
ディスプレイ一体型Macのラインナップに追加された、高性能上位機種

ここ数年来、AppleはVR(仮想現実)に対して消極的な対応を続けていました。

どの位消極的であったかというと、Apple製品に対しても好意的であった、Oculus Riftを発案し企業としてのOculusの共同創業者でもあったパーマー・ラッキー氏が、初期バージョンではMacに対応していたOculus Riftのコンシューマーバージョン(CV1)発売に際し、Mac対応を断念し、また将来のMac対応について問われて「それはApple次第だ(up to Apple)」と答えざるを得なかった程に、Mac各製品のGPU性能が低かったことが示す通りです。

Mac各製品のスペックをご存じの方には今更だと思いますが、驚いた事に製品最上位にしてApple自身が強力なGPUを搭載していると喧伝していたクリエイター向けデスクトップ機のMac Proでさえ、Oculus Riftが要求したスペックを満たせない程には当時のMac各製品のGPU性能は低かった※注1のです。

※注1:Oculus Rift CV1は発売開始当時、NVIDIA製ならばGeForce GTX 970、AMD製ならばRADEON R9 290を性能的に対応するGPUの下限として公表していましたが、当時の(そして記事執筆時点での)Mac Proでは最上位モデルでもAMDのFirePro D700 デュアルGPU構成となっていました。これは同メーカーによるRADEONで言えばRADEON R9 290よりも1世代古いRADEON HD7000シリーズ、それもシングルGPUでは上から3番目のグレードであるRADEON HD7870相当のチップを使用した製品で、仮にデュアルGPU構成がその性能を最大限に発揮したとしてもGPU内部で演算処理を行うストリームプロセッサ数が2048基でR9 290比だと80%となる(実際には2基のGPUが協調動作することにより性能を最大限に発揮するCROSS FIRE技術に対応しないためもっと下がる)ため、演算性能が決定的に不足します。

現行Mac Pro内部左右に分かれている基板がGPUモジュールで、内側にGPUチップやメモリが実装されているため、本体に組み付けるとこのような外観となる。当然ながらこれはMac Pro専用設計のため、交換用GPUモジュールを用意するには、この形状の基板を新規設計する必要があるが、残念ながらそうした製品は提供されていない

現行Mac Pro内部
左右に分かれている基板がGPUモジュールで、内側にGPUチップやメモリが実装されているため、本体に組み付けるとこのような外観となる。当然ながらこれはMac Pro専用設計のため、交換用GPUモジュールを用意するには、この形状の基板を新規設計する必要があるが、残念ながらそうした製品は提供されていない

もちろん、ここからGPUカードの交換や追加によるアップグレードが可能であれば対応可能であったのですが、困った事にはMac ProのGPUカードは円筒形の筐体に合わせた専用設計品で、それを交換するアップグレード用の高性能GPUカードはどこからも発売されていない※注2ため、より強力・高性能なGPUへ交換するという手段は採れず、また他のMac各機種では概ねCPU内蔵GPUを使用する設計となっていて本体に拡張スロットを搭載していないため、GPUカードの追加によるアップグレードという手段を利用出来ません。

※注2:排熱を筐体構造による通風に依存し、カード本体への冷却ファン搭載を想定しない、そして給電能力も純正搭載カードを前提として設計された現行のMac Proの構造では、熱的に現行のFirePro D700よりも発熱量の大きなGPUが搭載出来ず、また給電能力的にもOculus RiftクラスのVRデバイスに対応するハイエンドGPUの搭載が困難となっています。このため、後述するWWDC 2017で今後登場することが予告された次世代Mac Proでは、現行Mac Proの設計が全面的に見直される(≒現行Mac Proの設計に大きな問題があった)ことが示されています。

そうした事情からOculusはOculus Rift CV1以降でのMacサポートを打ち切り、またHTC Viveなどの後続VRデバイス各機種でもMacは最初から「なかったこと」にされる状況が長らく続いてしまっていました。

HTC Vive

HTC Vive

しかし、そんなMacにおけるVR不遇の時代にようやく終止符が打たれる時がやってきました。

先日開催されたWWDC 2017の基調講演で発表された新型Mac各機種の中で、iMacのクリエイター向け上位モデルとして「iMac Pro」が追加されてこれと「iMac」の27インチディスプレイ搭載モデルがVRに対応することと、OSの側でもこれに合わせてMac OS・iOS・tvOS共通の3DグラフィックスAPIである「Metal 2」、中でもMac OSのそれでVRレンダリングとこれを支える外部GPUのサポートが行われることになったためです。

そこで今回は、この「iMac Pro」と「Metal 2」を中心にMacでのVR環境について考えてみたいと思います。

ディスプレイ一体型としては破格のスペック

まずは今回の発表の目玉である「iMac Pro」がどのようなマシンなのか、仕様から見てみることにしましょう。

記事執筆時点で公表されている「iMac Pro」の仕様は以下のとおりです。

  • プロセッサ:Intel Xeon E5(8・10・18コアのいずれか)
  • メモリ:2,666MHz DDR4 ECC 32GB (最大128GB)
  • OS:macOS High Sierra
  • グラフィックス:
  •  GPU:AMD RADEON Pro Vega 56・64
  •  ビデオメモリ:HBM2 8GB(Vega 56)・16GB(Vega 64)
  • ディスプレイ:
  • 種類:Retinaディスプレイ
  • 解像度:5,120×2,880ピクセル(数十億色以上対応)
  • 画面サイズ:27インチ(対角線長)
  • 輝度:500ニト
  • 色域:P3
  • 外部出力:Thunderbolt 3経由でDisplayPort出力対応。5K解像度ディスプレイ2台あるいは4K UHD解像度ディスプレイ4台(垂直同期60Hz 十億色対応)との同時表示可能。
  •  ビデオメモリ:HBM2 8GB(Vega 56)・16GB(Vega 64)
    • ストレージ:
    •  1TB SSD (2TBあるいは4TB SSDに変更可能)
    •  メモリカードリーダー:SDXC対応×1
    • USBポート:
    •  USB 3 ×4
    •  Thunderbolt 3(USB Type C) ×4
    • 通信:
    •  Wi-Fi:IEEE 802.11 a/b/g/n/ac
    •  Bluetooth:Ver.4.2
    •  LAN:10GBASE-T
    • 筐体サイズ:650×516×203 mm
    • 重量:9.7 kg

    記事執筆の時点では詳細について明らかになっていない部分も多々ありますが、現状で判明しているだけでも、破格のスペックであると言えます。

    遂に18コアに達したCPU

    iMac Proエアフローイメージ左下に上下2基ずつDDR4メモリのDIMMソケットが搭載されていることから、CPUはその間に搭載されている事と、そこからヒートパイプで下部中央のヒートシンクへ熱を導き、ここで上部から送り込まれた冷却風を当てて放熱していることがわかる。位置関係と構造から、GPUは右下部に搭載されていると推測できる

    iMac Proエアフローイメージ
    左下に上下2基ずつDDR4メモリのDIMMソケットが搭載されていることから、CPUはその間に搭載されている事と、そこからヒートパイプで下部中央のヒートシンクへ熱を導き、ここで上部から送り込まれた冷却風を当てて放熱していることがわかる。位置関係と構造から、GPUは右下部に搭載されていると推測できる

    まずはCPUから。

    今回のiMac Proで5Kディスプレイ搭載やVR対応と共に大きくアッピールされているのが、選択可能なCPUの最上位に18コアCPUが設定されていることです。

    18コアのCPU、この場合は恐らくXeonかCore i9と考えられますが、それは元々サーバやワークステーションなど、通常のパソコンとは異なった使われ方をするマシンへの搭載を前提として設計されたプロセッサに由来します。

    具体的に言えば、この種のCPUではサーバなどでの仮想マシン多重起動を前提としたCPUコア数の多コア化やメモリインターフェイスの多重化による多チャネルかつ大容量メモリのサポート、メインメモリのECC(Error Check and Correction:誤り検出訂正)機能への標準対応、ストレージの高負荷動作を前提とする広帯域I/Oインターフェイスのサポートなど、一般に用いられるCore i7以下のCPUとは若干かけ離れた機能を備えていて、その一方で必要に応じより高性能なGPUを搭載することもあるため、GPUは内蔵していません。

    MacでもMac Proではそのシリーズ開始当初から現在に至るまで、ずっとXeon系のCPUが標準的に搭載されているのですが、ディスプレイ一体型のiMacへの搭載はこれまでなく、このiMac ProがXeon系のCPUを搭載するApple初のディスプレイ一体型パソコンということになります。

    ただ、今回の発表では具体的にどのような型番のCPUが搭載されるのか明らかにされていません。

    搭載可能なメインメモリ容量が最大で128GB、かつ種類がECC付きの2,666MHz駆動されるDDR4メモリ、そして動作しているCPUコア数が少ない際に使用していない分のCPUコアに割当てられていた熱容量を振り向けることで高速化を実現するTurbo Boost技術で許容される最大動作クロック周波数が4.5GHzとなっていることから判断する限り、少なくとも現行製品にはこれに該当するCPUコアは見当たりません。

    CPUコアが18コアとなっていることを踏まえると、開発コード“Skylake-X”として知られるLGA2066タイプのXeon E5あるいはCore i9プロセッサ、そしてECCメモリサポートがある事から恐らくはその中でも後者のXeon E5系(Core i9-7980XE相当)となる可能性が高いと言えます。

    これらの系統のCPUは、いずれもシングルCPUコア性能よりも多コア化による並列処理性能の向上を重視した、典型的なサーバ用CPUを出自としています。そのため、VRのようにリアルタイム処理を重視しシングルスレッド性能を要求される用途にはあまり向いていないと言えるのですが、今回のiMac Proのように動画編集などのクリエイティブ用途を重視したマシンではこの最大で18コアに達する実CPUコア数は非常に強力な武器となります。

    また、それだけのCPUコアを定格クロック周波数で動作させるのに充分な冷却性能が確保されていれば、IntelのTurbo Boostのように多くのCPUコアを休止させて少数のCPUコアだけをオーバークロック動作させることでシングルスレッド性能を確保する技術の適用に有利でもあって、シングルスレッド処理での絶対性能ではLGA 1150等に対応する通常のCore iシリーズほどでなくとも、少なくともVRアプリなどの動作に必要充分な性能は確保出来るだけのキャパシティがあると言えます。

    また、この系統のCPUが対応するCPUソケット規格であるLGA 2066では、Core iシリーズで一般に使用されるLGA 1150などとは異なりCPU自体に内蔵されるI/Oインターフェイス回りの機能が充実していて、例えばPCI ExpressインターフェイスでCPUに直接接続できるレーン数は44でLGA 1150対応CPUの16に比して圧倒的に多くなっています。

    これは後述するThunderbolt 3のような広帯域I/Oインターフェイスを多数接続したり、GPUを外付けで接続するには重要な機能で、LGA 1150の場合16レーン接続のGPUを1基接続したらそれでお終いですが、このLGA 2066に対応するプロセッサだとGPUを2基16レーンでフル接続してもなお最大で12レーン余ります。

    今回のiMac Proで一般的なLGA 1150ではなくLGA 2066に対応するプロセッサが選択されたと考えられるのは、実のところ宣伝文句となっているCPUコアの多さではなく、恐らくこのCPUに直接接続されるPCI Express Gen.3のレーン数の多さが重視されたためと推定できるためです。

    PCI Express Gen.3のデータ転送帯域は双方向の44レーンで最大704Gbps、16レーンで256Gbpsに達するのですが、Thunderbolt 3はホスト1ポート(全二重1レーン)で40×2=80Gbpsとなり、これを4ポート搭載するiMac Proの場合それだけで320Gbpsとなるため、LGA1150では性能が大幅に不足することになります。

    つまり、充分な性能のPCI Express Gen.3 16レーン接続の外部GPUチップをマシン本体に搭載し、さらにThunderbolt 3 ×4を制限なく利用出来るようにするには、現状ではLGA 2066あるいはその前世代のLGA 2011-3(PCI Express Gen.3で最大40レーン接続可能)に対応するCPUを搭載する必要がある訳です。

    なお、最近登場し話題となったAMDのRyzenプロセッサはRyzen 7でPCI Express Gen.3を24レーン接続可能でIntelのLGA 2066とLGA 1150の間の規模となっており、更に今後登場予定の上位機種であるRyzen Threadripperでは何と1ソケットで64レーンのPCI Express Gen.3をサポートする設計となっています。

    PCI Express接続のM2 SSDなどGPU以外にもレーンを多数消費するデバイスの利用が増えている昨今の傾向から考えても、今後のデスクトップパソコンではこのあたりのI/O回りの拡張性が重要視されることになりそうで、本体に汎用の拡張スロットを持たないこのiMac Proが多数のThunderbolt 3ポートを備えるのは理に叶っていると言えます。

    メモリがHBM2接続となったGPU

    今回の「iMac Pro」では5K Retinaディスプレイの搭載とVRサポートがアッピールされたのですが、その双方を支えるのが、CPU内蔵ではなく※注3CPUとは別途搭載されたGPUによるグラフィックス機能です。

    ※注3:Intelの現行Core iプロセッサ、中でもメインストリームに位置づけられるLGA 1150に対応するモデルでは、その大半についてGPUが内蔵されていますが、これらは5K解像度ディスプレイへの出力に充分とは言いがたい性能しか出ません。

    AMD RADEON RX480コードネーム“Polaris 10”と呼ばれるグローバル・ファウンダリの14nm FinFET技術で製造されるGPUチップを搭載するグラフィックスカード。比較的低コストでVRに対応することからAMDにとっては久々のヒット作となった

    AMD RADEON RX480
    コードネーム“Polaris 10”と呼ばれるグローバル・ファウンダリの14nm FinFET技術で製造されるGPUチップを搭載するグラフィックスカード。比較的低コストでVRに対応することからAMDにとっては久々のヒット作となった

    近年のAppleはMac各製品の中位以上のモデルについてAMDのGPUを搭載しているのですが、ここ数年、AMDのGPUは製造に利用出来る半導体製造プロセスが28nmで足踏み状態だったこともあってぱっとしない製品が続いていて、昨年発表のPolaris 10ことRADEON RX480および今年発表のPolaris 20ことRADEON RX580(いずれも14nm FinFETプロセスにて製造)でコストパフォーマンスを前面に押し出すことでようやく競合他社に対する競争力をある程度回復したような状況でした。

    また、AMDがRADEON RX480より前から発売していた上位機種であるRADEON R9 Fury X・R9 Fury・R9 Nanoの3機種は搭載されている“Fiji”コアの性能的には搭載シェーダー数が3584基あるいは4096基で2048基搭載のPolaris 10・20を大きく上回っていたものの製造プロセスの関係で発熱量もまた大変に大きく、上位製品では標準で簡易水冷ユニットが装着されるという前代未聞の構成で、さらにHBM(High Bandwidth Memory:オンパッケージ高帯域幅メモリ)と呼ばれる新しいメモリインターフェイス規格※注4を採用した結果、GPUに接続されるローカルメモリとして4GBしか搭載できないという問題も抱えていました。

    ※注4:従来のGDDR5 SDRAMではDRAMチップが個別のパッケージに収められ、そこからそれぞれ32ビット幅の信号配線経由でGPU内蔵のメモリコントローラと接続されていた(つまり256ビットバスでは8枚、512ビットバスでは16枚のチップを並列に接続していた)のを改め、GPUと同じパッケージ内のインターポーザと呼ばれる小さなサブ基板上にメモリチップを(インターフェイスコントローラチップと共に)積み重ねて搭載し、さらにそれぞれのメモリチップにTSV(Through-Silicon Via:シリコン貫通ビア)と呼ばれるチップの上下面を貫通する配線を設けてこれを積み重ねられたチップ同士で接合してその名のとおり上下に貫通するデータバスを形成、1つの積層されたチップ群(これをスタックと呼びます)ごとにGPUチップとの間を1024ビット幅で接合する規格です。このHBMではGPUと同じパッケージにDRAMチップを積層搭載するためDRAMを含めた基板面積を同等設計で従来比5パーセントにまで縮小可能とされ、消費電力低減や広帯域バスでの接続によるメモリアクセスの高速化などもあって飛躍的な性能向上が得られるとされます。もっともこのHBMはインターポーザ上にチップを積層するという新技術を採用することから製造の難度が非常に高くコスト的にも割高で、改良版にあたるHBM2を含め採用例はごく僅かにとどまっています。

    こうした事情もあって、今回の発表前の時点で同社がラインナップしていたGPUでは事前に噂されていた新機種のスペックを満たすのが難しい状況でしたから、一体どのようなGPUが搭載されるのか筆者を含め興味津々でした。

    そしていざ蓋を開いてみると、驚いた事には「iMac Pro」についてはWindowsパソコン向けで未発表の最新機種であるAMD RADEON Pro Vega 56・64の2機種からの選択となりました。

    iMac Proは本体内蔵を含め3台の5K解像度ディスプレイ接続に対応する。ディスプレイ一体型パソコンとしては破格の最新高性能GPU内蔵はこの機能のためにあると言っても過言では無い

    iMac Proは本体内蔵を含め3台の5K解像度ディスプレイ接続に対応する。ディスプレイ一体型パソコンとしては破格の最新高性能GPU内蔵はこの機能のためにあると言っても過言では無い

    現状ではその詳細は明らかにされていませんが、メモリインターフェイスに最新のHBM2を採用し、これにより8GB(Vega 56)あるいは16GB(Vega 64)のメモリを積層搭載、さらに型番から64=64 Compute Unit=4096シェーダプロセッサ搭載、56=56 Compute Unit=3584シェーダプロセッサ搭載と推測されるこれらのGPUは、端的に言ってしまえばPolaris 10での設計改良を反映しHBMをHBM2にアップグレードして搭載メモリ量を増やし帯域性能を向上させた“Fiji”の正常進化バージョンとなると推定されます。

    “Polaris 20”のフルスペック版であるRADEON 580 8GBは搭載シェーダ数はRADEON R9 290比で90パーセント(2,304基)、メモリバス幅が半減となる256ビットのGDDR5メモリという構成で単精度浮動小数点演算能力が6.2TFLOPSを公称、これでVRレディを実現していましたから、それと同じく14nm FinFETプロセスで製造され、大容量かつ転送帯域性能が最大400GB/sと超高速※注5のHBM2メモリを搭載し、単精度浮動小数点演算能力が最大で11TFLOPSに達するとされるこれらRADEON Pro Vega 56・64については、かなりの性能が期待できるでしょう。

    ※注5:GDDR5メモリの512ビット接続を行うRADEON R9 390Xで動作周波数などでかなり無理をしても最大384GB/sですから、これをあっさり上回るというだけでもかなり期待できます。

    なお、iMac Pro発表後にAMDが発表した同系の「RADEON Vega Frontier Edition」ではメモリがHBM2 16GBかつ64 Compute UnitのGPUコア搭載とRADEON Pro Vega 64に相当すると考えられる仕様ながら単精度浮動小数点演算性能が13.1TFLOPSと2割近く向上しており、RADEON Pro Vega 64では冷却の都合か何かで性能に制限がかかっていることが推定出来ます。

    後編に続きます。

    ▼参考リンク
    Oculus’ Palmer Luckey will consider Mac support if Apple ‘ever releases a good computer’ | Shacknews
    これまでで最もパワフルなMacとなるiMac Proが12月に登場 – Apple (JP)
    Apple、iMacのグラフィックス、プロセッサ、ディスプレイをアップデート – Apple (JP)
    iMac Pro – Apple(日本)
    iMac – Apple(日本)

    PageTopへ