NVIDIAのCEOであるJensen Huang氏は、本日、同社の最新グラフィックカードであるコンシューマ向けのGeForce RTX 40シリーズ グラフィックプロセッシングユニット(GPU)を発表した。
ゲーマーやクリエイター向けのこのシリーズは、フラッグシップチップであるRTX 4090 GPUを搭載し、前モデルの最大4倍のパフォーマンスを発揮するとのことだ。
これらのチップとグラフィックカードは、新しいNVIDIA Ada Lovelaceアーキテクチャを採用した最初のコンシューマ向けGPUだ。Huang氏は、リアルタイムレイトレーシングとAIを利用してピクセルを生成するニューラルレンダリングの新時代を象徴すると述べ、性能と効率における大規模な世代交代を約束した。
「RTXレイトレーシングとニューラルレンダリングの時代は本格化し、我々の新しいAda Lovelaceアーキテクチャはそれを次のレベルに引き上げる。Adaは、ゲーマーに飛躍的な進歩をもたらし、完全にシミュレートされた世界のクリエイターに道を開くものです。前世代の最大4倍の性能を持つAdaは、業界に新たな標準を打ち立てます。」と、Huang氏は発表の中で述べている。
同社は、Taiwan Semiconductor Manufacturing Company(TSMC)と協力して、新しい「4N」製造プロセスを共同開発し、NVIDIAは、30シリーズカードに使用した8nmプロセスよりも最大2倍電力効率が高いとしている。
フラッグシップの NVIDIA RTX 40 GPU は、760 億個のトランジスタを搭載し、第 3 世代のRTコアと第4世代の Tensor コアが導入されている。
レイトレーシングの性能は、NVIDIAの新しい第3世代RTコアを搭載したAda Lovelaceと、Shader Execution ReorderingおよびDLSS 3.0という新しいレンダリング技術の搭載により大幅に改善されている。ゲームによっては、Ampere GPUのレイトレーシング性能と比較して2~3倍が期待できるとのことだ。同社は、『サイバーパンク2077』を、ゲームのレイトレーシング機能をすべて最大に設定した状態で、ほぼ一貫して100フレーム/秒で動作させるデモを行った。新しいアーキテクチャのおかげで、ラスタライゼーションのパフォーマンスが最大2倍高速化されていることも報告している。
DLSS 3はフレーム全体を生成し、より高速なゲームプレイを実現
また、同社の超解像技術「ディープラーニング・スーパーサンプリング(DLSS)」の最新版である、「NVIDIA DLSS 3」も発表された。詳しくは、別記事でご紹介するがAIを用いたこの技術は、フレーム全体を生成してゲームプレイを大幅に高速化することができる。GPUが独立してフレーム全体を生成することで、ゲームにおけるCPUの性能限界を克服することが可能となる。AIは、動いているシーンにおいて、どのような種類のピクセルをより速く埋めるべきかを予測することができるのだ。
この技術は、UnityやUnreal Engineといった世界で最も人気のあるゲームエンジンに搭載され、世界有数のゲーム開発者の多くから支持を得ており、35以上のゲームやアプリが間もなく登場すると、NVIDIAは述べている。
さらに、RTX 40シリーズGPUは、以下のような新たな技術革新を搭載している。
- 最大83TFLOPSのシェーダー能力を持つストリーミング・マルチプロセッサ(前世代の2倍)。
- 第3世代のRTコアは、前世代の2.8倍となる最大191TFLOPSのレイトレーシング有効演算能力を備えている。
- 第4世代のTensorコアは、最大1.32 Tensorペタフロップスで、FP8アクセラレーションを使用して前世代比5倍となる。
- シェーディングワークロードをオンザフライで再スケジュールすることにより実行効率を向上させ、GPUのリソースをより有効に活用するShader Execution Reordering (SER) 。SERは、CPUのアウトオブオーダー実行と同じくらい重要な革新的技術で、レイトレーシングのパフォーマンスを最大3倍、ゲーム内のフレームレートを最大25%向上させる。
- 2倍高速化されたAda Optical Flow Acceleratorは、DLSS 3がシーン内の動きを予測し、ニューラルネットワークが画質を維持したままフレームレートを向上させることを可能にする。
- TSMC 4Nプロセス技術と緊密に結びついたアーキテクチャーの改善により、電力効率が最大2倍まで飛躍的に向上している。
- デュアルNVIDIAエンコーダ(NVENC)は、エクスポート時間を最大で半分に短縮し、AV1をサポートしている。NVENC AV1エンコードは、OBS、Blackmagic Design DaVinci Resolve、Discordなどで採用されている。
NVIDIAは今後NVIDIA RTXに特化した最適化を行うタイトルをいくつか紹介ししたが、最大のものは間違いなくMicrosoft Flight Simulator 2020だろう。DLSS 3と組み合わせた場合、MSFSは、ゲームの最も忙しいシーンでもフレームレートが容易に100台を維持できることを実証した。詳しくは下の動画をご覧いただきたい。
新しいレイトレーシング
物理的に正しい照明でレイトレースされたシーンをリアルタイムにレンダリングすることは、グラフィック表現の向上に最も効果的であり、コンシューマ向け3DゲームにおいてはNVIDIAがその嚆矢となってから、常に追求し続けていた分野でもある。ただし、グラフィックスが複雑になればなるほど、その計算量もそれに伴い膨大な計算能力が必要となってくる。
特に、『サイバーパンク2077』のような最新のレイトレーシング・ゲームでは、ライティングを決定するためだけに、各ピクセルに対して600以上のレイトレーシング計算が実行されるが、これは4年前に登場した最初のレイトレーシング・ゲームの16倍にもなるという。
今回、RTX 40シリーズで導入された新しい第3世代RTコアは、レイトライアングル交差テストを2倍高速化し、2つの重要なハードウェアユニットを搭載するよう強化されている。不透明度マイクロマップエンジンはアルファテストジオメトリのレイトレーシングを2倍に高速化し、マイクロメッシュエンジンはオンザフライでマイクロメッシュを生成し、追加のジオメトリを生成する。マイクロメッシュエンジンは、従来のようなパフォーマンスやストレージのコストをかけずに、ジオメトリの複雑性を向上させるメリットを提供する。
「NVIDIAのエンジニアは、あらゆる面で技術を押し進めました。」とHuang氏は述べている。
RTX Remix
NVIDIAはRTX Remixと名付けられた新しいツールセットを、改造可能な多くのクラシックゲームに適用する方法を示し、MOD市場に訴求している。Elder Scrolls III: Morrowindに適用したビフォーアフターのデモでは、RTX GPUテンソルコアを使用して、ゲームのテクスチャと物理マテリアルのプロパティをプログラムによって更新している。NVIDIAが11月にファン向けにリリースする、PCゲームの名作『Portal 1』の無料DLCパッケージでも、同様の結果が期待されている。
GeForce RTX 4090 / RTX 4080
NVIDIA GeForce RTX 4090
RTX 4090は、驚異的なパワー、音響、温度特性を持つ世界最速のゲーミングGPUだ。フルレイトレースゲームでは、DLSS 3を搭載したRTX 4090は、DLSS 2を搭載した前世代のRTX 3090 Tiと比較して最大4倍高速化されているという。
760億個のトランジスタ、16,384個のCUDAコアを備えた AD102-300 GPUは、最大2,520MHzのクロック周波数を実現する。また24GBの高速Micron製GDDR6Xメモリを搭載し、4K解像度のゲームでは常に100フレーム/秒以上のパフォーマンスを発揮することができる。RTX 4090は10月12日に発売され、価格は1,600ドルからだ。
同社は、ZOTAC、Inno3D、Colorful、Palit、Gainward、Gigabyte、MSI、ASUS などのボード パートナーから複数のデザインを発表した。当然のことながら、EVGA カードはない。
NVIDIA GeForce RTX 4080
また、モデル番号は同じでメモリと GPU の仕様が異なる 2 枚のグラフィックス カードも発表した。RTX 4080 16GB は、9,728 個の CUDA コアを備えた AD103 GPU、22.5 Gbps でクロックされる合計16 GBの Micron製GDDR6X メモリ、および 320 WのTDPとなる。このモデルは、1,199ドルで 11 月に発売される予定だ。
RTX4070であるはずだったものが、RTX 4080 12GBとして導入されている。このSKU には、7,680 CUDA コアを搭載するAD104GPUが用いられる。名前が示すように、このモデルには 12GBのGDDR6Xメモリと 285WのTDPとなる。NVIDIA は、この SKU に 899ドルの価格を設定した。
RTX 40 GPU には NVLink がなく、PCIe Gen4 x16 インターフェイスを使用している。
コメントを残す