NVIDIAの次世代RTX40シリーズはPCI Express 4.0対応に留まる可能性

NVIDIAは、今年後半に、まったく新しいAda Lovelace GPUアーキテクチャに基づくGeForce RTX40シリーズグラフィックスカードを発売する予定だが、このRTX40シリーズについて、PCI Express 4.0準拠の情報が浮上している。

Source

kopite7kimi : Twitterへの投稿

この記事の要点

NVIDIA GeForce RTX 40シリーズグラフィックスカードはPCI Express 4.0準拠に留まり、PCI Express 5.0は採用しない見通し
PCI Express 5.0の帯域幅は、PCI Express 4.0の実質2倍になるが、現行のグラフィックスカードでもPCI Express 4.0の帯域幅を使い切れていない

NVIDIA GeForce RTX 40「AD102 GPU」グラフィックスカードがPCI Express 4.0準拠を維持

これまで、NVIDIA GeForce RTX 40シリーズグラフィックスカードは、新しいPCI Express 5.0インタフェースを介して、最大600Wの消費電力を引き出すことができる新しいATX 3.0準拠の12VHPWR 16ピンコネクタを採用することが分かっている。この電源コネクタは、すでにGeForce RTX 3090 Tiグラフィックスカードに採用されており、現在、トリプル8ピンアダプタを通じて最大450Wの電力消費が可能となっている。

現在、最新のグラフィックカードは、PCI Express 4.0 プロトコルを介してCPUと通信をおこなっている。PCI Express 4.0プロトコルは、合計64GB/秒、双方向32GB/秒の帯域幅を可能にする。しかし、IntelとAMDの最新プラットフォームは、全く新しいPCI Express 5.0インターフェイスプロトコルをサポートしている。この新しい規格では、合計で最大128GB/秒、双方向で最大64GB/秒の帯域幅を実現できます。これにより、実質的に帯域幅は2倍になるが、NVIDIAでは少なくともAD102 GPUをベースにしたハイエンドのGeForce RTX 40グラフィックスカードでは、まだPCI Express 5.0インターフェイスを搭載しないようだ。

PCIe Gen4
— kopite7kimi (@kopite7kimi) April 24, 2022

Kopite7kimi氏のツイートによると、次期GeForce RTX 40のラインナップは、PCI Express 4.0準拠を維持するとのことだ。これは、HPCセグメントでHopper GPUがPCI Express 5.0を利用することになっているにもかかわらず、次世代規格を採用しないというNVIDIAの大胆な行動だ。ただ、サーバーは多くの帯域幅を必要とし、PCI Express 5.0の採用は実際に需要を満たすことにも繋がるが、コンシューマ向けには、PCI Express 5.0インターフェイスは帯域が広すぎるのが現状だ。実際、現在のGPUはまだPCI Express 4.0インターフェイスですらも完全に使い切れていない。

Radeon RX 6500シリーズやRX 6400シリーズでは、PCI Express 3規格に切り替えるとグラフィック帯域幅が必要以上に狭くなり、PCI Express 4.0準拠の規格に対してパフォーマンスが低下していたが、PCI Express 4.0は低レーンを搭載していればボトルネックを心配する必要がないため、エントリレベルのラインナップには良い兆しが現れている。ハイエンドのラインナップがPCI Epxress 4.0規格を求めていないとすれば、ローエンドのラインナップは、最大限の閾値を満たすには程遠いということになる。今のところ、NVIDIAが次期RTX 40シリーズカードでPCI Epxress 4.0を本当に維持するかどうかは断言できないが、新しいカードにPCI Epxress 5.0のロゴをつけるようなマーケティングを行っているので、変わる可能性はあるようだ。

PCI Epxress 5.0とPCI Epxress 4.0のサポート以外にも、NVIDIAは、Ada Lovelaceアーキテクチャ内のCUDAコアの配置方法を大きく変更する予定であるようだ。GeForce RTX 40シリーズのGPUは、単純にCUDAコアがAmpereから増えるだけでなく、まだ詳細が明らかになっていない新しい混合精度コアの数々が含まれる可能性があるという。ラインナップは導入までまだ数カ月あるので、いろいろと変わる可能性はありるが、都度最新情報をお伝えできればと思う。

NVIDIA CUDA GPU（一部リーク情報による）暫定版

	TU102	GA102	AD102
フラッグシップSKU	RTX 2080 Ti	RTX 3090	RTX 4090？
アーキテクチャ	Turing	Ampere	Ada Lovelace
プロセス	TSMC 12nm NFF	Samsung 8nm	TSMC 4N？
ダイサイズ	754mm2	628mm2	〜600mm2
グラフィックス処理クラスター（GPC）	6	7	12
テクスチャ処理クラスター（TPC）	36	42	72
ストリーミングマルチプロセッサ（SM）	72	84	144
CUDAコア	4608	10752	18432
L2キャッシュ	6 MB	6 MB	96 MB
理論上のTFLOP	16.1	37.6	〜90 TFLOP？
メモリタイプ	GDDR6	GDDR6X	GDDR6X
記憶容量	11 GB（2080 Ti）	24 GB（3090）	24 GB（4090？）
メモリバス	384ビット	384ビット	384ビット
メモリ速度	14 Gbps	21 Gbps	24 Gbps？
メモリ帯域幅	616 GB / s	1.008 GB / s	1152 GB /秒？
PCI Expressインターフェース	PCI Express 3.0	PCI Express 4.0	PCI Express 4.0
TGP	250W	350W	600W？
リリース	2018年9月	9月20日	2022第2四半期（予定）