昨年、HEDT市場からの撤退を発表したAMDだが、前言を撤回し「Storm Peak」Threadripperプロセッサーの2つの新ファミリー、ハイエンド・デスクトップ(HEDT)市場向けのThreadripper 7000シリーズとワークステーション市場向けのThreadripper Pro 7000 WXシリーズを発表した。両チップラインは、AMDのZen 4チップレットとディスクリートI/Oダイを組み込んだ、AMDのEPYCサーバー・プロセッサーの派生製品で、AMDの試行錯誤を重ねたZen 4アーキテクチャをベースにしている。AMDは、同社の新しいHEDTチップは、競合するIntelのフラッグシップXeon w9-3495Xよりも最大94%、自社の前世代Threadripper Pro 5995WXよりも最大46%高い性能を提供すると主張しており、デスクトップPC市場におけるハイエンド性能の新たなベンチマークを打ち立てるものとしている。
AMDはこの2つの製品ラインで、デスクトップのRyzenプロセッサーよりも強力だが、AMDのサーバー製品まではいかない性能のCPUを必要とする顧客層をターゲットにしている。
Ryzen vs Threadripper vs Threadripper Pro
AMDのEPYC Genoaハードウェアをベースに、AMDはThreadripper製品を市場向けに2つのクラスで提供しており、それらはワークステーション(Pro)とHEDT(非Pro)パーツに大別される。実のところ、これはどちらかのバージョンのThreadripperがタスクに適していないというよりも、技術的な製品区分の問題が大きい。AMDは、より多くの機能(より多くのコア、より多くのI/O、より多くの帯域幅)をProパーツに確保する一方で、非ProのThreadripper 7000シリーズには、ハードウェアをさらに削減したバージョンを提供している。これはAMDにとって目新しいことではなく、Threadripper 3000シリーズでも同じやり方を踏襲していたからだ。
Ryzen | Threadripper | Threadripper Pro | EPYC (Genoa) | |
---|---|---|---|---|
コア | 6-16 | 24-64 | 12-96 | 16-96 |
アーキテクチャ | Zen 4 | Zen 4 | Zen 4 | Zen 4 |
フラッグシップ | R9 7950X | TR 7980X | TR Pro 7995WX | EPYC 9654P |
希望小売価格 | $550 | $4999 | 不明 | $10,625 |
TDP | 170 W | 350 W | 350 W | 360 W |
ベースクロック | 4500 MHz | 2500 MHz | 2500 MHz | 2400 MHz |
ターボクロック | 5700 MHz | 5100 MHz | 5100 MHz | 3700 MHz |
ソケット | AM5 | sTR5 | sTR5 | SP5 |
L3キャッシュ | 64 MB | 256 MB | 384 MB | 384 MB |
DRAM チャネル | 2 x DDR5-5200 | 4 x DDR5-5200 | 8 x DDR5-5200 | 12 x DDR5-4800 |
DRAM 容量 | 192 GB (UDIMM) | 1TB, ECC (RDIMM) | 2 TB, ECC (RDIMM) | 6 TB, ECC (RDIMM) |
PCIe | 5.0 x24 + chipset (x4) | 5.0 x48 + 4.0 x32 + chipset (x4) | 5.0 x128 + 4.0 x8 + chipset (x4) | 5.0 x128 |
Pro機能 | No | No | Yes | Yes |
機能と仕様に関して、Threadripper 7000 ProはEPYCの性能のほとんどをデスクトップ・ハードウェアにもたらす。AMDは、最高のGenoaチップに匹敵する最大96個のZen 4 CPUコアを搭載したチップSKUを提供している。同様に、Threadripper Proの全パーツには、EPYC 128レーンのPCIe 5.0コネクティビティが搭載されている(さらにPCie 3.0の「ボーナス・レーン」もある)。Threadripper 7000 ProとGenoaの最大の違いはメモリ・サポートだ。Genoaが12レーンのDDR5メモリをサポートするのに対し、Threadripper 7000 Proは8レーンをサポートする。デスクトップのRyzenと比較するなら、AMDの現行デスクトップ・プロセッサーの4倍のレーン数となる。
一方、非プロのThreadripper 7000シリーズは、もう少し制限されている。最大のSKUは、4つのCCDを使用する64 Zen 4コアだけだ。また、Pro版と比較すると、I/Oが大幅に変更されており、PCIe 5.0は48レーンしかなく、さらに32のCPU PCIeレーンが利用可能だが、PCIe 4.0の速度でしか動作しない。PCIe 5.0はわずか48レーンである。一方、メモリ・チャンネル数はProの半分で、HEDTに特化したThreadripperはDDR5を4チャンネル搭載している。
AMD Ryzen Threadripper 7000 Pro WXシリーズ:何が新しいのか?
AMDのRyzen Threadripper 7000 Pro WXシリーズの発表を見ていくと、Ryzen Threadripper Pro 7000シリーズが、1PソケットEPYC機能のスケーラビリティとコア数を高性能ワークステーション・コンピューティングに変換するというAMDのコミットメントを体現していることがわかる。いくつかの統合的な実装があり、基本的なアーキテクチャと機能を理解することが極めて重要です。この視点を持つことで、AMDの最新のワークステーションおよびHEDT製品の背後にある特性と思考プロセスを純粋に理解することができる。ではこのシリーズが一体ワークステーションセグメントに新たに何をもたらすのだろうか?
第1に、Zen 3ベースのRyzen Threadripper 5000 Pro WXシリーズからのアップグレードで、Zen 4コアを搭載するようにアップグレードされているため、世代を超えたIPC性能の向上、電力効率、コアクロック速度の向上能力など、多くの性能上の利点があるだろう。
AMDのRyzen Threadripper Pro 5000 WXシリーズと7000 Pro WXシリーズの世代間比較を詳しく見ると、設計とアーキテクチャの進化がわかる。より細かな部分を見ていくと、AMDは最新の7000 WXシリーズでコア数と周波数を大幅に向上させている。例えば、同シリーズのフラッグシップモデルである7995WXは、5995WXと比較して50%飛躍した96コア(192スレッド)という驚異的な性能を誇っている。ベースおよびブーストクロック周波数については、7995WXのベースコアクロックは2.5GHz、ブーストクロックは最大5.1GHzで、ターボ周波数では5995WXと比較して約13%のクロック速度の向上を示している。
その他の世代的な改善点としては、IODに組み込まれた最大128本のPCIe 5.0レーンや、上位SKUで利用可能なより多くのL3キャッシュが挙げられる。Ryzen Threadripper 7995WX Proチップには384MBのL3キャッシュが搭載されており、CCDごとに32MB(合計12MB)のL3キャッシュに分割されている。これは、前世代のRyzen Threadripper 5995WXと比較してL3キャッシュ量が50%向上しており、主にCCDの数が増えたことに起因している。
しかし、7975WXのような中位クラスのチップでも、ベースコアクロックが4.0GHz、ブーストクロックが最大5.3GHzと、コア周波数が著しく向上している。同様に、エントリーレベルのチップである16C/32Tの7955WXと12C/24Tの7945WXも、それぞれ4.5GHzと4.7GHzのベースクロックを備えている。残念ながら、コア数が増加し、ベース周波数とブーストクロック周波数の両方が向上することには、Ryzen Threadripper Pro 7000 WXシリーズチップのすべてのTDPが350Wと大きいという注意点がある。
AMDのRyzen Threadripper 7000 Pro WXシリーズ・プロセッサーは、Intelの最新ワークステーション・プラットフォームであるIntel Xeon W-3400シリーズに代わるものとして設計されており、同社のSapphire Rapidsアーキテクチャをベースにしている。AMDが競合製品との違いをアピールする主なポイントは、Threadripper 7000 Pro WXは、7995XをIntelのXeon W9-3495Xと比較した場合、コア数が1.7倍で、ブーストクロックも高速であり、利用可能なL3キャッシュ量も3倍以上であることだ。
Ryzen Threadripper 7000 Pro WXシリーズが前モデルを上回るもう1つの利点は、コアに採用されたZen 4アーキテクチャがAVX-512命令セットを正式にサポートすることだ。デスクトップ向けのRyzen 7000シリーズと同様に、Zen 4コアはAVX-512のイントリンシックと2つの256ビット経路を介した実行を可能にする。これは、AVX-512命令セットを使用するワークロードで明確な性能上の利点をもたらすように設計されており、AMDのAVX-512の実装は8ビット値で行われるため、INT8推論が改善される。AMDのAVX-512サポートの実装は、基本的に512ビット命令を2つの256ビット・ベクトル・パスに供給される2サイクルにわたって広げる。
Threadripper 7000 Proの設計でより興味深い要素の1つは、「スレッド・ピニング」を可能にすることだ。AMDはチップレットベースの設計を採用しているため、OSのデフォルト・スケジューリングをオーバーライドし、どのCCDにスレッドをロード/ピニングするかを制御するツールを開発した。
そうすることで、AMDはスレッドの位置を操作してワークロードに最適なパフォーマンスを実現し、チップレットアーキテクチャの比較的高いダイ間レイテンシ・ペナルティを回避しようとしている。最大12個のCCDを使用することで、キャッシュに制約のあるワークロードを助けることができる大量のL3キャッシュが利用できる。その結果、Threadripperでは、AMDはスレッドの着地点を制御するツールを提供することになる。
7995WXを例にとると、AMDのスレッド・ピニングは、ワークロードが12個のスレッドを使用する場合、スレッド・ピニングによる最適化によって各スレッドを異なるCCDに配置できることを意味し、ワークロードは384MBのL3キャッシュをすべて効果的に使用できる。逆に、ワークロードによっては、できるだけ少数のCCDにまとめて配置する必要がある場合もあり、これはより伝統的なOSのスケジューリング動作である。
重要なことは、AMDはスレッド・ピニングの使用方法に注意する必要があるということだ。レイテンシで発生するペナルティは、より多くのL3キャッシュを使用するメリットを上回らなければならないからだ。すべてのワークロードや命令セットがL3キャッシュの恩恵を受けられるとは限らないため、8個または12個のCCDにまたがるスレッドを使用してL3キャッシュの恩恵をカプセル化できるかどうかは微妙なラインだ。AMDが、特定のワークロードでL3キャッシュを増やすとレイテンシ・ペナルティが発生し、それによってパフォーマンスが低下する可能性があることを、どのように区別しているのかは興味深いところだ。
より多くのL3キャッシュを持つことで恩恵を受けるユースケースの1つは、Anysys Fluent 2022 R1です。私たちはAMDに連絡を取り、スレッド・ピニングがどのように有効化されるのか、これがソフトウェア・アプリケーション固有の最適化なのか、あるいはコア・アフィニティを設定する特定の実行ファイルをバックグラウンドで実行する必要があるのかなどを確認しました。しかし、L3キャッシュのスループットを向上させるためにスレッドピニングを使用した場合、12%の向上は良いことです。
Ryzen Threadripper 7000 Pro WXシリーズの登場にあたり、待望の改良が施されたAMDのハイエンドIODは、EPYCラインアップから引き継がれたもので、TSMCのN6ノードを使用して製造されている。最大12個のCCDを接続するポートを備え、Ryzen Threadripper 5000 Proで使用されたIODと比較して、改良された低消費電力のダイ間チップレット・インターフェースを提供する。AMDは、プローブのスループットが2倍になったとしているが、20:1のクロック比で最大36Gbpsを実現し、FCLKは最大1.8GHzに達する。
AMD社内のパフォーマンス数値を用いた例を見ると、設計や製造などの分野で信じられないようなパフォーマンスの向上が見られる。例えば、SolidWorksを使用したRyzen Threadripper 7000 Pro 7975WX(32/64)の設計性能は最大45%高速化し、Luxion Keyshotのレンダリング性能はIntelのXeon W9-3475フラッグシップ56コアチップと比較して最大44%高速化するとしている。これは、AMDの最上位SKUである96C/192T 7995WXチップを選択した場合の性能上のメリットは考慮していない。
AMD Ryzen Threadripper 7000:HEDTを復活させる
AMDが発表するもう1つのチップは、通常のRyzen Threadipper 7000シリーズで、前述の通り、Ryzen Threadripper 3000シリーズで2019年以来のコンシューマー向けHEDTプラットフォームとなる。Ryzen 5000/Zen 3世代ではスキップされたが、AMDはHEDTを再び市場に投入する意向を示している。デスクトップ・プロセッサーのコア数と性能の向上は、過去10年間、HEDTプラットフォームの主なセールスポイントに同等性をもたらした。
そのコア/スレッドのパリティ・レベルを達成することで、IntelのX299のようなHEDTプラットフォームに対する需要は、Cascade Lake Intel Core i9-10980XE (18C/36T) Extremeプロセッサーによって、やや失われた。Intelの現在のフラッグシップであるCore i9-14900K(24C/32T)やAMDのRyzen 9 7950X(16C/32T)は、旧来のHEDTプラットフォームに匹敵するか上回るだけでなく、世代改良によるIPCの向上がデスクトップ市場をより魅力的なものにしている。AMDのThreadripper 7000シリーズは、デスクトップよりも高いコア数を復活させ、4つのメモリチャネルでより広い帯域幅を提供する。
この恩恵を受けられるアプリケーションやワークロードでは、ユーザーはより洗練されたHEDTオプションを手に入れることができ、AMDはHEDTとは何かを以前からアップデートしている。また、AMDがThreadripper 7000の機能として、前世代で見られたようなゲーミングを売りにしていないことも興味深い。AMDはZen 2ベースのRyzen Threadripper 3990Xプロセッサーを発売した際、チップの半分を無効にする「ゲームモード」を搭載して販売したが、これは最適化されていないコードを使用するゲームでの互換性とより高いパフォーマンスを確保するためのものだった。ユーザーがThreadripper 7000でゲームをできないという意味ではなく、Ryzen 7000がこの分野を主なターゲットとしているという意味だ。
最上位SKUであるRyzen Threadripper 7980Xに焦点を当てると、最新のZen 4コアを搭載した64C/128Tを備え、最大5.1GHzのターボクロック速度を誇り、ベースコアのクロック周波数は2.5GHzである。その下のThreadripper 7980Xは32C/64Tで、ベース周波数がより高い3.2GHz、ターボクロック速度は同じ5.1GHzです。同プラットフォームの「エントリーレベル」SKUとして提供されるThreadropper 7960Xは、24C/48Tでクロックは3.2GHz、ターボコア周波数は最大5.3GHzとわずかに高い。
Threadripper 7000 Proと非プロのThreadripper 7000の主な違いは、I/Oとメモリの制限という形で現れる。TR 7000は7980Xを通じて64C/128Tまで対応するが、同プロセッサがサポートするメモリはわずか4チャネル、CPUからのPCIeレーンは80本で、48本は最新のPCIe 5.0規格に準拠している。特定のセグメントに分けたもう1つの明らかな理由は、AMDがよりプロフェッショナル向けのPro WXチップと通常のThreadripper 7000 SKUの間に明確な違いを作り出し、HEDT市場への入り口とするためだ。
Ryzen Threadripper 7000シリーズは、AM5上のデスクトップ向けRyzen 9 7950X 16C/32Tプロセッサーよりもコア数とスレッド数が増加した24C/48Tチップの7960Xから始まる。これは実質的に、より多くのZen 4コア、より多くのスレッド、より多くのL3キャッシュ、およびクアッドチャネルメモリのサポートをコンシューマーに提供するもので、使用されない、または必要とされないプロフェッショナルな機能に追加費用を費やす必要はない。
AMD WRX90とTRX50プラットフォーム:ワークステーションとHEDTの違い
Ryzen Threadripper 7000 Pro WXおよび7000シリーズの発売を補完するために、2つの新しい、しかし区別できるマザーボードプラットフォームがあります。これには、ワークステーション向けに設計されたWRX90プラットフォームと、HEDTの機能とコストにより近い設計を提供するために設計されたTRX50プラットフォームが含まれる。
前述したように、両プラットフォームとも4844ピンを使用する同じsTR5ソケットを使用している。これは、AMDが低価格のEPYC 8004(Siena)プロセッサー用に導入したソケットであるSP6と同じピン数である。Threadripper 7000のラインナップはEPYCの派生製品であるため、TRX50とWRX90マザーボードが派生ソケットを使用しているのは当然のことだ。ただし、sTR5とSP6がピン互換性がないことは言うまでもないが、旧ソケットのsTRX4 Threadripperクーラーが58.5mm x 75.4mmのソケットにまだ適合することは理解している。
この2つのうちハイスペックなのはWRX90で、Ryzen Threadripper 7000 Pro WXシリーズ専用に設計されている。WRX90ボードは8チャンネルのメモリをサポートし、最大1 TBのDDR5-5200 RDIMMに対応する。一方、TRX50プラットフォームは、主に非Pro Threadripperチップで使用されるように設計されており、これらのボードは4チャネルのメモリとわずか48 CPU PCIe 5.0レーン(プラス32 CPU PCIe 4.0レーン)をサポートしている。
WRX90はThreadripper Proチップ専用に設計されている。WRX90プラットフォームとProチップを組み合わせれば、最大128のPCIe 5.0レーンを利用でき、ユーザーはAMD Proシリーズの機能をフルに活用できる。そのため、TRX50は “格安”プラットフォーム設計となる。メモリ・チャネル数が少ないため、ボードはより安価に製造できるはずだ。同様に、マザーボードベンダーは、PCIe 5.0レーンを48本(残りはPCIe 4.0)だけ搭載したボードを簡単に組み立てることができるだろう。PCIe Gen5は実装がより複雑で、スロットとデバイス間の長いトラックでは、再ドライバーが必要になり、コストがかさむ可能性があるからだ。
興味深いことに、Threadripper 7000 ProチップはTRX50マザーボードでも使用できる。しかしもちろん、同じメモリ・チャネルとI/Oの制限を受けることになる。基本的に、TRX50ボードはThreadripper Proチップ用の格安ボード・ペアとして使用できる。そうでなければ、逆は真ならず、非プロThreadripper 7000チップをWRX90ボードで使用することはできない。
それでも、両プラットフォームはDDR5-5200 RDIMMメモリーを総合的にサポートしており、以前のRyzen Threadripper 5000 ProシリーズはDDR4メモリーをサポートしていたため、もう1つの世代交代となる。WRX90は最大2 TBのDDR5-5200 RDIMMをサポートし、TRX50プラットフォームは1 TBのDDR5-5200 RDIMM容量に制限されている。
AMD Ryzen Threadripper 7000 Pro WXシリーズとRyzen Threadripper 7000 SKUのすべてが11月21日に小売店で発売される予定だ。本稿執筆時点では、Threadripper 7000(Pro以外)の価格のみが明らかにされており、7980Xは4999ドル、7970Xは2499ドル、エントリーレベルの7960Xは1499ドルとなっている。この発売をサポートするTRX50およびWRX90マザーボードも近日中に発表される見込みで、発売は11月21日になりそうだ。
コメントを残す