Intelは、米国のアルゴンヌ国立研究所向けに設計されたスーパーコンピュータ「Aurora」の全仕様を公開した。
次世代Xeonとデータセンター向けGPUを搭載した1万台以上のブレードを「Aurora」スーパーコンピュータに提供
Intelのスーパーコンピュータ「Aurora」は、長らく開発が遅れていたが、ようやく形になりつつある。IntelのXeon CPU MaxとXeon GPU Maxシリーズを搭載したこのシステムは、当初の目標であった1エクサフロップから、2倍の性能となる2エクサフロップにアップグレードされた。これにより、現在地球上で最も高速なAMD搭載のスーパーコンピュータ「Frontier」と肩を並べることになる。
Intelは、最新の情報開示で、Auroraスーパーコンピュータが、Sapphire Rapids-SPファミリーベースの21,248個のXeon CPUとPonte Vecchioデザインベースの63,744個のGPUを含む合計10,624個のノードを搭載することを明らかにした。このシステムは、ピークインジェクション帯域幅2.12PB/s、ピークバイセクション帯域幅0.69PB/sのファブリックインターコネクトを搭載した性能を誇る。
さらに、Intelとアルゴンヌ国立研究所は、Auroraの設置状況、システム仕様、初期の性能結果について紹介した:
- Auroraのフルシステムは、HPE Cray EXスーパーコンピュータを使用して構築され、63,744個のGPUと21,248個のCPU、そして1,024個のDAUを搭載する予定だ。
- CPUと1,024台のDAOSストレージノードが搭載される。そして、HPE Slingshotハイパフォーマンスイーサネットネットワークを利用する。
- 初期段階では、実世界の科学技術ワークロードにおいて、AMD MI250 GPUの最大2倍の性能、QMPACK量子力学アプリケーションにおけるH100の20%の改善、数百ノードまでのほぼリニアなスケーリングなど、トップクラスの性能を示している。
メモリは、DDR5システムDRAMを10.9PB、CPUのHBM容量を1.36PB、GPUのHBM容量を8.16PB搭載している。システムDRAMのピークバンド幅は5.95PB/s、CPU HBMのピークバンド幅は30.5PB/s、GPU HBMのピークバンド幅は208.9PB/sを達成している。ストレージには、ピーク帯域幅31TB/sで動作する230PBのDAOSを搭載し、合計1024ノードで構成される。
最新のIntel Data Center GPU Max Series 1550を搭載したAuroraは、NVIDIA A100やAMD Instinct MI250Xアクセラレータを凌駕する最速のSimpleFOMP性能を実現している。また、核融合炉の予測、モンテカルロ法(最大化)、QMCPACK(量子力学的特性の計算)においても、これらのアクセラレータと比較して優れた相対性能を示している。
Intelによると、Intel Data Center GPU Max Seriesは、多様なワークロードにおいてNVIDIA H100 PCIeカードを平均30%上回っており1、独立系ソフトウェアベンダーAnsysは、AI加速HPCアプリケーションにおいてMax Series GPUがH100よりも50%高速化していることを示しているとのことだ。
また、Xeon Max Series CPUは、高帯域幅のメモリを搭載した唯一のx86プロセッサーで、より少ない電力で、HPCG(High Performance Conjugate Gradients)ベンチマーク1においてAMDのGenoaプロセッサーより65%の改善を示している。
スーパーコンピュータ「Aurora」は今年後半に発売されると言われている。また、このスーパーコンピューターでは、科学的な応用のために1兆個のパラメータを提供する最新のAurora gen AIモデルが動作する予定だ。
Auroraスーパーコンピュータに加えて、Intelはx8 UBBデザインで合計8個のPonte Vecchio GPUを搭載する全く新しいデータセンターGPU Max Subsystemも発表している。
Sources
コメントを残す