NVIDIAは、今年後半に、まったく新しいAda Lovelace GPUアーキテクチャに基づくGeForce RTX40シリーズグラフィックスカードを発売する予定だが、このRTX40シリーズについて、PCI Express 4.0準拠の情報が浮上している。
- NVIDIA GeForce RTX 40シリーズグラフィックスカードはPCI Express 4.0準拠に留まり、PCI Express 5.0は採用しない見通し
- PCI Express 5.0の帯域幅は、PCI Express 4.0の実質2倍になるが、現行のグラフィックスカードでもPCI Express 4.0の帯域幅を使い切れていない
NVIDIA GeForce RTX 40「AD102 GPU」グラフィックスカードがPCI Express 4.0準拠を維持
これまで、NVIDIA GeForce RTX 40シリーズグラフィックスカードは、新しいPCI Express 5.0インタフェースを介して、最大600Wの消費電力を引き出すことができる新しいATX 3.0準拠の12VHPWR 16ピンコネクタを採用することが分かっている。この電源コネクタは、すでにGeForce RTX 3090 Tiグラフィックスカードに採用されており、現在、トリプル8ピンアダプタを通じて最大450Wの電力消費が可能となっている。
現在、最新のグラフィックカードは、PCI Express 4.0 プロトコルを介してCPUと通信をおこなっている。PCI Express 4.0プロトコルは、合計64GB/秒、双方向32GB/秒の帯域幅を可能にする。しかし、IntelとAMDの最新プラットフォームは、全く新しいPCI Express 5.0インターフェイスプロトコルをサポートしている。この新しい規格では、合計で最大128GB/秒、双方向で最大64GB/秒の帯域幅を実現できます。これにより、実質的に帯域幅は2倍になるが、NVIDIAでは少なくともAD102 GPUをベースにしたハイエンドのGeForce RTX 40グラフィックスカードでは、まだPCI Express 5.0インターフェイスを搭載しないようだ。
Kopite7kimi氏のツイートによると、次期GeForce RTX 40のラインナップは、PCI Express 4.0準拠を維持するとのことだ。これは、HPCセグメントでHopper GPUがPCI Express 5.0を利用することになっているにもかかわらず、次世代規格を採用しないというNVIDIAの大胆な行動だ。ただ、サーバーは多くの帯域幅を必要とし、PCI Express 5.0の採用は実際に需要を満たすことにも繋がるが、コンシューマ向けには、PCI Express 5.0インターフェイスは帯域が広すぎるのが現状だ。実際、現在のGPUはまだPCI Express 4.0インターフェイスですらも完全に使い切れていない。
Radeon RX 6500シリーズやRX 6400シリーズでは、PCI Express 3規格に切り替えるとグラフィック帯域幅が必要以上に狭くなり、PCI Express 4.0準拠の規格に対してパフォーマンスが低下していたが、PCI Express 4.0は低レーンを搭載していればボトルネックを心配する必要がないため、エントリレベルのラインナップには良い兆しが現れている。ハイエンドのラインナップがPCI Epxress 4.0規格を求めていないとすれば、ローエンドのラインナップは、最大限の閾値を満たすには程遠いということになる。今のところ、NVIDIAが次期RTX 40シリーズカードでPCI Epxress 4.0を本当に維持するかどうかは断言できないが、新しいカードにPCI Epxress 5.0のロゴをつけるようなマーケティングを行っているので、変わる可能性はあるようだ。
PCI Epxress 5.0とPCI Epxress 4.0のサポート以外にも、NVIDIAは、Ada Lovelaceアーキテクチャ内のCUDAコアの配置方法を大きく変更する予定であるようだ。GeForce RTX 40シリーズのGPUは、単純にCUDAコアがAmpereから増えるだけでなく、まだ詳細が明らかになっていない新しい混合精度コアの数々が含まれる可能性があるという。ラインナップは導入までまだ数カ月あるので、いろいろと変わる可能性はありるが、都度最新情報をお伝えできればと思う。
NVIDIA CUDA GPU(一部リーク情報による)暫定版
TU102 | GA102 | AD102 | |
---|---|---|---|
フラッグシップSKU | RTX 2080 Ti | RTX 3090 | RTX 4090? |
アーキテクチャ | Turing | Ampere | Ada Lovelace |
プロセス | TSMC 12nm NFF | Samsung 8nm | TSMC 4N? |
ダイサイズ | 754mm2 | 628mm2 | 〜600mm2 |
グラフィックス処理クラスター(GPC) | 6 | 7 | 12 |
テクスチャ処理クラスター(TPC) | 36 | 42 | 72 |
ストリーミングマルチプロセッサ(SM) | 72 | 84 | 144 |
CUDAコア | 4608 | 10752 | 18432 |
L2キャッシュ | 6 MB | 6 MB | 96 MB |
理論上のTFLOP | 16.1 | 37.6 | 〜90 TFLOP? |
メモリタイプ | GDDR6 | GDDR6X | GDDR6X |
記憶容量 | 11 GB(2080 Ti) | 24 GB(3090) | 24 GB(4090?) |
メモリバス | 384ビット | 384ビット | 384ビット |
メモリ速度 | 14 Gbps | 21 Gbps | 24 Gbps? |
メモリ帯域幅 | 616 GB / s | 1.008 GB / s | 1152 GB /秒? |
PCI Expressインターフェース | PCI Express 3.0 | PCI Express 4.0 | PCI Express 4.0 |
TGP | 250W | 350W | 600W? |
リリース | 2018年9月 | 9月20日 | 2022第2四半期(予定) |
コメントを残す