NVIDIAは、次世代のデータセンターとサーバーに搭載される予定のArmベースのGrace CPU Super Chipの新しいベンチマークを発表した。
Arm Neoverse N2コアを搭載したGrace CPUは、CPU+CPUとCPU+GPUの両方を備えたNVIDIAのスーパーチップで利用される。NVIDIAは最近、世界最速のHBM3eメモリーを搭載したGH200として知られるAIおよびコンピュート・ワークロード向けの最も強力なGPUを発表したが、これはGrace Hopper Superchipに採用される。
Graceの主な見どころは以下の通り:
- HPCおよびクラウドコンピューティング向け高性能CPU
- 最大144のArm v9 CPUコアを搭載するスーパーチップ設計
- 世界初のECC付きLPDDR5xメモリ、総帯域幅1TB/秒
- SPECrate2017_int_baseが740を超える(推定値)
- 900 GB/秒のコヒーレント・インターフェイス、PCIe Gen 5の7倍高速
- DIMMベースのソリューションの2倍の実装密度
- 今日の主要CPUのワットあたり性能の2倍
- RTX、HPC、AI、Omniverseを含む、すべてのNVIDIAソフトウェアスタックおよびプラットフォームを実行可能
Hot Chips 2023のプレゼンテーションでは、NVIDIAのチーフ・サイエンティストであるBill Dally氏が、NVIDIA Grace Superchipと競合他社のデュアルソケットx86ソリューションとの性能比較を発表した。これには、最速の96コア&192スレッドソリューションであるAMDのEPYC 9654や、56コア&112スレッドを特徴とするIntelのフラッグシップ、Xeon Platinum 8480+が含まれる。これらのソリューションはデュアルソケット構成で実行されているため、AMDのプラットフォームは合計192コア、Intelのプラットフォームは112コアということになる。
公式のNVIDIA Grace CPUスペックから、Grace Superchipは合計144コア(チップあたり72 Arm Neoverse V2)を提供し、最大960GBのLPDDR5Xメモリと最大1TB/秒の生帯域幅をサポートし、合計消費電力は500Wであることがわかっている。その他の仕様には、117MBのL3キャッシュ、58のGen5レーンが含まれ、TSMC 4Nプロセスノードを使用している。
NVIDIAが選択したベンチマークは、Weather WRF、MD CP2K、Climate NEMO、CFD OpenFOAM、Graph Analytics GapBS BFSなどの幅広いサーバーアプリケーションをカバーしています。すべてのベンチマークにおいて、NVIDIAのGrace Superchip CPUは、AMDのGenoa CPUよりも最大40%優れた性能を発揮し、IntelのSapphire Rapids CPUを大きく引き離しています。大半のベンチマークはGenoaと同等であり、Grace Superchipが500Wで動作するのに対して、これらのチップの2つのTDPは合計640W(EPYC 9654あたり320W)である。
しかし、実際の大規模データセンター・アプリケーションと比較すると、性能比較はさらに興味深いものになる。5MWデータセンターのスループット・ベンチマークによれば、NVIDIAのGrace Superchipは、同じベンチマーク内で圧倒的な効率を発揮しながら、最大2.5倍の性能を提供できることがわかります。これらのワークロードに投資しているデータセンターとサーバーのクライアントにとって、NVIDIAのTensor Core GPUがHPCとAIの分野を支配したように、Grace CPUは大きなゲームチェンジャーになり得る。
Sources
コメントを残す