NVIDIAが中国市場向けに特別に設計した新型RTX 4090となる「RTX 4090D」を準備していることが報じられている。この動きは、最近の米国政府による中国への輸出規制を回避するためのものと見られる。新しいRTX 4090ダイの命名スキームはXでAD102-250として明らかにされ、既存のカードが使用するAD102-300とは大きく異なる。
VideoCardzによると、GPUに小さな変更がある場合、ダイ番号は1桁変わることが一般的である。例えば、NVIDIAはRTX 4090をAD102-300ダイで発売し、その後3月にAD102-301に変更した。この新しいダイの大きな変更点は、カードの電圧を1.1Vから1.07Vに下げることだった。300から250への変更は、それが全く異なる製品であることを示している。
RTX 4090の性能は米国の定める輸出基準値を超えていたため、このカードは中国での販売が禁止された。新しいAD102-250搭載RTX 4090は、これらの規制に適合するために少し性能を抑えられると考えられている。
4090Dが満たすべき主な指標は、TPP(総処理能力)だ。これは、TFLOPS(整数演算の場合はTOPS)にビット数を掛けたもので、所定のビット深度に対する最大演算量で計算される。RTX 4090の場合、TPPはTensorコアで実行されるFP8演算で660.8*8=5,286となる。また、FP16でも同じ値である:330.4*16=5,286だ。許容限界は4,800なので、RTX 4090は約10%”強力”なことになる。
ちなみにRTX 4080はTPPは389.6*8=3,117で基準値以下なのでまだ中国で販売(製造/組み立て)できる。データセンターの部品には、性能密度(TPPをダイ面積で割ったもの)と呼ばれる二次指標があるが、消費者向けGPUには関係ない。NVIDIAのL4も、AD104の294mm2のダイサイズと1,936のTPP値を使用して、6.6のPD評価を持っているため、この制限に該当する理由だ。
では、NVIDIAがRTX 4090 Dを米国の輸出規制で許可するためには、どうすればいいのだろうか。技術的には4,800TPP以下であれば十分だが、NVIDIAはオーバークロックが問題にならないよう、多少の余裕を持たせるだろう。クロック速度を2.7GHzと仮定すると、SMの最大数は108となる。しかし、それでもTPPスコアは4,778となるため、NVIDIAは念のため、SM数100(TPP4,428)程度と、もう少し低いスコアを目指すことになるだろう。
この新しいGPUが、来年1月初旬に発売予定のRTX 4080 Superとどのように比較されるかが大きな疑問である。4080と4090の間にはかなりの性能差があり、Superはその差を多少縮めることであろう。また、これらのGPUはメモリ構成が大きく異なり、4090は384ビットのメモリバスを搭載しているのに対し、4080は256ビットのバスを使用している。
NVIDIAがこの動きを実現すれば、CEOのジェンセン・フアンが最近述べたコメントと一致する。彼は今週、NVIDIAは米国の制裁に準拠するGPUを構築する計画であると述べており、これらの制限を予測してずっとそうしていたようである。
Sources
コメントを残す