NVIDIA Quadro P6000「Pascal」アーキテクチャによるVR対応ハイエンドグラフィックスカード。24GBものGDDR5Xによるローカルメモリを内蔵し、Quadro P5000の1.5倍の性能を発揮するモンスターGPUを搭載する

VRクリエーターの強力なツール ~NVIDIA、Quadro P5000・P6000をみる~ 前編

  • このエントリーをはてなブックマークに追加

by [2016年10月31日]

NVIDIA Quadro P6000「Pascal」アーキテクチャによるVR対応ハイエンドグラフィックスカード。24GBものGDDR5Xによるローカルメモリを内蔵し、Quadro P5000の1.5倍の性能を発揮するモンスターGPUを搭載する

NVIDIA Quadro P6000
「Pascal」アーキテクチャによるVR対応ハイエンドグラフィックスカード。24GBものGDDR5Xによるローカルメモリを内蔵し、Quadro P5000の1.5倍の性能を発揮するモンスターGPUを搭載する

VRという新しい技術の普及にあたって、一番のネックになっているのは、そのディスプレイ表示に必要とされるグラフィックス表示デバイスに要求される性能のレベルが非常に高くコストも高くつくことです。

パソコンでVR機能を利用できるようにし満足にコンテンツを遊べる環境を整えるだけでさえ、最低でも3万円クラスの高性能グラフィックスカード(あるいはそれに相当するハードウェア)を備えた10万円クラス以上の価格帯の高性能パソコンを用意するのが望ましく(※注1)、VR対応ヘッドマウントディスプレイ本体でも9万~10万円ほどかかるというのですから、相当にハードルが高いと言えます。

 ※注1:最近のOculusソフトウェアのバージョンアップでハードウェアの最低要件、特にGPUのそれはかなり引き下げられてGeForce GTX 960クラスでも動作する事が発表されましたが、それはゲームなどのコンテンツを快適にプレイできる事を保証するものではありません。

更に言えば、これはあくまでゲームなどのコンテンツを「プレイ」する側の環境の話で、例えばVRコンテンツを制作するクリエーターやミッションクリティカルな分野の業務用途で使用することを考えると、これでもまだ性能的に足りない/より高機能・高性能な環境が欲しい、というニーズが存在しています。

最適化されていない開発段階では実際の製品段階より「重い」、あるいはより複雑なモデリングで3Dオブジェクトが作成されることがありますし、開発効率を高め開発期間を短縮するには、より高性能で処理の「軽い」グラフィックスカードが求められることになります。

元々、パソコン向け3Dグラフィックスの分野では業界最大手のNVIDIAも2位のAMDも、共にOpenGLと呼ばれる3D CADなどで多用されるAPIに最適化された業務用途向け高性能グラフィックスカードを発売してきたのですが、これらのVR版が欲しい、という声が出てくるのはある意味必然だったのです。

そしてこのほど、NVIDIAから「Quadro P6000」「Quadro P5000」としてVRをその用途に含む業務用グラフィックスカードが発表されました。

今回はこれら2機種について考えてみたいと思います。

Quadro P6000・P5000の主な仕様

まずは上位機種であるQuadro P6000から。

  • GPUアーキテクチャ:Pascal
  • CUDAコア数:3840
  • メモリ:24 GB GDDR5X
  • メモリインターフェイスバス幅:384ビット
  • メモリ帯域幅:最大432GB/s
  • システムインターフェイス:PCI Express 3.0
  • ディスプレイコネクタ:Display Port 1.4 ×4 + DVI-D × 1
  • 最大消費電力:250W
  • 電源コネクタ:8ピン PCI Express ×1

さすがにNVIDIA自身が「World’s Fastest GPU」と呼ぶだけのことはあって、凄まじいスペックです。

ただ、Quadro P6000の最大消費電力だと電源コネクタが8ピン*1だと75(PCI Expressスロット給電) + 150(8ピン給電) = 225Wになるから25W足りない、という問題がある(※注2)のですが、それ以外は概ね最新ハイエンドグラフィックスカードらしい仕様と言えます。

 ※注2:搭載マシンの電源側で給電能力が充分余裕があれば、この程度の不足は補えてしまうという話があるのですが、PCI Expressの規格上はこうした給電系に電流量超過をもたらす消費電力は当然アウトで、よろしくない仕様です。素直に6ピン+8ピンとして給電能力に余裕を持たせるべきでは無いでしょうか。

次は下位モデルのQuadro P5000です。

  • GPUアーキテクチャ:Pascal
  • CUDAコア数:2,560
  • メモリ:16 GB GDDR5X
  • メモリインターフェイスバス幅:256ビット
  • メモリ帯域幅:最大288GB/s
  • システムインターフェイス:PCI Express 3.0
  • ディスプレイコネクタ:Display Port 1.4 ×4 + DVI-D × 1
  • 最大消費電力:180W
  • 電源コネクタ:8ピン PCI Express ×1

Quadro P6000の前で霞んでしまいますが、これとて現在一般に市販されている「VRに好適な性能を備えた」グラフィックカードの中で比較すれば充分トップを狙えるクラスの性能と言えます。

規模に1.5倍の差がある両機種

さて、先に挙げた両機種の主な仕様の内、GPUアーキテクチャの項目で唐突に「Pascal」とあることに戸惑う方がおられるかもしれません。

NVIDIAのGPUはユニファイドシェーダによるGPGPUの概念が導入された頃から、つまり製品で言えばGeForce 200シリーズ(製品名はGeForce GTX 285など)のあたりから、グラフィックスカードで言えば概ね2世代に1回程度、年数で言えば概ね2年に1回程度の割合でGPUの内部アーキテクチャの刷新・大幅改良が図られるようになっています。そしてその度にTesla、Fermi、Kepler、Maxwell、Pascalと歴史上著名な数学者・天文学者などの名がそのアーキテクチャに冠されるようになっていて、「Pascal」はその最新のものです。

つまり、製品名のモデル名を示す「P6000」「P5000」の「P」は搭載されているGPUチップがこの「Pascal」アーキテクチャに属する製品である事を示しています(※注3)。

 ※注3:前世代の「Maxwell」アーキテクチャ時代にはグレードの高い方から巡にQuadro M6000(CUDAコア数3,072)・M5000(同2,048)・M4000(同1,664)・M2000(同768)と4製品が存在しました。つまり、少なくともここ何年かのNVIDIA Quadroシリーズのメインストリームに位置するデスクトップモデルでは「世代名を示す接頭辞+製品グレードを示す数字」という組み合わせの型番が採用され続けている訳です。

それぞれの世代のアーキテクチャでどのような改良が加えられてきたかの詳細についてはここでは扱いませんが、おおざっぱに言ってしまえば複数のCUDAコアをどう組み合わせて大きめの処理の単位であるクラスタを構成すればより効率的な処理を行えるか、という問題についての試行錯誤の積み重ねがこれらのアーキテクチャの世代更新の原動力となっています。また、チップの物理設計の改良や半導体製造プロセスのシュリンク(縮小)の恩恵によって搭載されるCUDAコア数が増えることも、アーキテクチャが1世代進むごとの性能向上に大きく寄与しています。

なお、このアーキテクチャの世代が同じGPUチップの間では、規模や速度の差こそあれど基本的に同じ設計のCUDA(Compute Unified Device Architecture)コア(※注4)が搭載されているため、その性能は搭載されるCUDAコア数とその動作クロック周波数、それに接続されるメモリインターフェイスの帯域性能でほぼ決定されます。

 ※注4:かつてはストリーミングプロセッサ(Streaming Processor:SP)と呼ばれていた、GPUの根幹をなす汎用シェーダーによる演算ユニットの最小単位をNVIDIAではこう呼んでいます。命名の由来は、C言語を用いたGPUを汎用プロセッサとして扱うための統合開発環境であるCUDAで最小計算単位となる=GPUの処理能力の基準となることによるものです。

そのことを踏まえてこれら2機種のハードウェア仕様を見ると、搭載されているCUDAコアの搭載数やメモリインターフェイスのバス幅にそれぞれ1.5倍の差があることから、Quadro P6000とQuadro P5000は同じ「Pascal」アーキテクチャながら全く異なる規模・設計のGPUチップを搭載していること(※注5)がわかります。

 ※注5:一般にNVIDIAのGPU製品では、例えばGeForce GTX 1080(CUDAコア数2,560)に対するGeForce GTX 1070(同1,920)のようにチップの良品率を上げるために同じ設計のチップの内、全てのCUDAコアが動作したものを最上位として、有効なCUDAコア数やメモリインターフェイスの性能などを変えた製品を出して、価格帯毎にラインナップを展開することが行われています。

しかし、これらQuadro P6000・P5000のようにCUDAコア数もメモリ帯域性能もメモリバス幅もことごとく1.5倍の差があるとなると、流石にチップの1/3の機能を殺して製品化するのは無駄になるチップ領域が大きすぎる≒それによる消費電力の増大も無視できないことになります。

また、そうしたハイエンド機種では他の機種ではできない「尖った」性能を達成していれば不良品率の問題を製品価格に転嫁できること、それにそうした歩留まり対策はCUDAコア数を若干減らした上でGeForceの上位機種にGPUチップを流用することでも対応できることから、最上位のビッグGPUチップは一般向けのハイエンドGPUチップとは設計を分けて専用とするのが普通です。

さらに、メモリ容量とその帯域、バス幅も2機種間で同じように1.5倍の差があることと、両機種とも同じGDDR5Xをメモリとして搭載していることから、Quadro P6000のGPUチップはQuadro P5000のGPUチップをメモリインターフェイス回りも含めて素直に1.5倍の規模に拡大・増量した設計であって、GPU全体としての演算性能も概ねQuadro P5000比で約1.5倍のレベルに達することが推定できます。

これはつまりQuadro P6000のGPUチップに集積されるトランジスタ数も単純計算でQuadro P5000のそれの1.5倍に達することを意味します。Quadro P6000がQuadro P5000よりも性能の高そうなGPUクーラーを搭載しているのも、恐らくこのためです。

NIVIDIA Quadro P5000プロセッサやメモリの規模が2/3であるためか、Quadro P6000と比較して幾分シンプルな形状のクーラーを備える。ソフトウェアはともかくハードウェア的には先行発売されたGeForce GTX 1080のメモリクロックを1割落として倍容量のメモリを搭載したと考えるとわかりやすい

NIVIDIA Quadro P5000
プロセッサやメモリの規模が2/3であるためか、Quadro P6000と比較して幾分シンプルな形状のクーラーを備える。ソフトウェアはともかくハードウェア的には先行発売されたGeForce GTX 1080のメモリクロックを1割落として倍容量のメモリを搭載したと考えるとわかりやすい

また、Quadro P5000のGPUはPascalアーキテクチャでCUDAコア数2,560基、メモリバス幅256ビット、メモリ帯域 最大288GB/sという仕様から、一般向けのGeForce GTX 1080に搭載されているGP104-400のGDDR5Xメモリインターフェイスの基準動作クロック周波数を1割落として搭載メモリ容量を2倍に増やした(※注6)ものと考えられます。

 ※注6:近年のDDR SDRAM系高速メモリでは、容量増大のために同一メモリインターフェイスに接続されるメモリチップ数を増やすとそのままでは動作タイミングなどから信号の安定動作が難しくなる傾向があって、その場合メモリの動作クロック周波数を若干落として安定動作させるようにチューンすることが行われます。そのため、GeForce GTX 1080比で2倍のメモリを搭載しその帯域性能が9割に下がっているこのQuadro P5000ではそうしたチューンが行われている可能性がかなり高いと言えます。

これを踏まえるとQuadro P5000の搭載GPUは1チャネルあたりの帯域性能が144GB/sで128ビット幅GDDR5Xメモリインターフェイスを2基搭載し、Quadro P6000はそれと同じGDDR5Xメモリインターフェイスを3基搭載していて、両者の1チャネルあたり接続・搭載されるメモリチップの容量や仕様、それに動作速度は全て同一ということになります。

これはつまり、現在一般に市販されているVR対応を謳うグラフィックスカードに搭載されるGPUの中では最速級のGeForce GTX 1080とほぼ同じGPUで、メモリ帯域性能は9割に低下した代わりにVRコンテンツでは特に影響の大きな容量が2倍ということですから、なるほどQuadro P5000はNVIDIAの主張するとおりVRコンテンツ制作に適した設計となりますし、またそれをそのまま1.5倍にスケールアップしたGPUを搭載するQuadro P6000はかなり重いVRコンテンツでも充分大きな余裕をもって動作させられるということになる(※注7)でしょう。

 ※注7:NVIDIA自身が公表しているVRScoreベンチマーク(β版)による性能比較では、前世代のQuadro M6000 24GB比で同じメモリ容量24 GBながら180%の性能を叩き出しており、GPUチップの半導体製造プロセスのシュリンクや搭載メモリインターフェイスの高速化などの恩恵で飛躍的に性能が向上していることがわかります。

後編に続きます。

▼参考リンク
UNMATCHED POWER. UNMATCHED CREATIVE FREEDOM. NVIDIA® QUADRO® P6000(PDFファイル)
UNMATCHED POWER. UNMATCHED CREATIVE FREEDOM. NVIDIA® QUADRO® P5000(PDFファイル)
NVIDIA Quadro P6000
NVIDIA Quadro P5000
NVIDIA Ups Ante for VR, Design with World’s Fastest GPU
The New NVIDIA TITAN X: The Ultimate. Period. | The Official NVIDIA Blog
NVIDIA TITAN X Graphics Card with Pascal | GeForce

タグ:
PageTopへ