Intel Sapphire Rapids Xeon Scalable CPUは、AVX-512でAMD EPYC Genoaと比較して驚くべき結果を示した

masapoco
投稿日 2023年1月21日 6:07
Intel 4th Gen Xeon Scalable Family Sapphire Rapids gigapixel standard scale 4 00x Custom gigapixel very compressed scale 4 00x Custom gigapixel very com

Intelは先週、第4世代のXeon Scalableプロセッサ、通称「Sapphire Rapids」を発表した。新たなSapphire Rapidsでは、人工知能と機械学習の改善の拡大を支援するために、全く新しいISA、Advanced Matrix Extensionsなどが導入されたが、AIやHPC、MLでの利用もあるAVX-512命令セットについてのパフォーマンス向上については言及されていなかった。

この命令セットはIntelが開発したもので、これまでIntelの独自技術だったが、AMD Zen4アーキテクチャもライセンスを受けてRyzen 7000シリーズなどでのサポートを開始し、AMDの大きなセールスポイントにもなっている。

Linux関連の情報サイトPhoronixでは、この新しいプロセッサをAMDのGenoaプロセッサーや、Sapphire Rapidsの先輩であるIce Lakeと比較のベンチマークテストを行い、その真実を確かめてくれている。

Phoronixがテストを行ったのは、IntelのXeon 8380、Xeon 8490H、そして、AMDのEPYC 9654となる。

3つのCPUで実施されたテストは、すべて次のようなワークロードでAVXの性能をテストすることに基づいている。

  • Neural Magic DeepSparse – ニューラルネットワークに見られるスパース性を利用する CPU ランタイムは、計算量を減らすという副産物をもたらす。
  • LCzero – Leela Chess Zeroとしても知られているこのチェスソフトウェアはUCIプロトコルを実装しており、Arena Chess GUI, BanksiaGUI, Cutechess, Nibbler, Chessbaseに似たチェスGUIが必要となる。
  • Embree – Intelによって作成された Embree はレイトレーシングのカーネルセットで、フォトリアリスティックレンダリングアプリケーションのパフォーマンスを向上させるためにグラフィックアプリケーションエンジニアを支援するためのものだ。
  • OpenVKL -同じくIntelによって作成されたOpen VKLは、Open VDBで保存されたデータを理解し、変換せずにアクセスできるオープンソースソフトウェアで設計されている。
  • Open Image Denoise – Intel Open Image Denoise は Intel oneAPI Deep Neural Network Library (別名 oneDNN) 上に構築されている。リアルタイムで、Intel SSE4、AVX2、AVX-512のような最新の命令セットを悪用することができる。これは、exploitingが高いノイズ除去性能を達成するために行われる。
  • OSPRay (Studio) – Intel の OSPRay Studio は、オープンソースのインタラクティブなレイトレーシングとビジュアライゼーションのプログラムだ。
  • oneDNN – Intel oneAPI Deep Neural Network Library (または oneDNN) は、最適化されたディープラーニングのビルディングブロックのパフォーマンスを提供する。
  • Cpuminer-opt – Cpuminer-opt は CPU マイニングソフトウェアで、Raptoreum 暗号通貨に使われている Cpuminer-opt と Cpuminer-gr にフォークされている。
  • OpenVINO – Open Visual Inference and Neural network Optimization は、単一のフレームワークから深層学習モデルの最適化を支援し、推論エンジンを利用してIntelハードウェア上に展開する無料のツールキットで、Intelはこのツールキットを作成した会社だ。
  • miniBUDE – 他のHPCプログラミングモデルで見られるブリストル大学ドッキングエンジンのコアコンピュテーションだ。
  • SMHasher – SMHasherは、”非暗号化ハッシュ関数の分布、衝突、パフォーマンス特性をテストするために設計されたテストスイート”となる。

ほとんどのテストでAVX-512命令セットがアクティブになり、すべてのCPUで良好な上昇を示したが、Sapphire Rapids Xeon CPUはAVX-512で最大44%の性能向上を示し、EPYC Genoaは21%の性能向上を示した。

この結果に対し、Phoronixでは以下のように述べている。

幾何平均は、第4世代EPYC GenoaがHPCワークロードで第4世代Xeon Scalableに対して競争力を持つために、AVX-512がいかに重要であるかも示しています。もしZen 4がAVX-512を追加していなかったら、EPYC 9654 2P AVX-512無効の結果は、AVX-512有効のXeon Platinum 8490H 2Pにわずかに及ばない結果になっていた。AVX-512を搭載しないZen 4サーバープロセッサであれば、より多くのワークロードでSapphire RapidsとGenoaの首位争いが繰り広げられたことでしょう。しかし、AVX-512を搭載したEPYC 9654 2Pは、このセットのベンチマークで、Xeon Platinum 8490Hプロセッサよりも19%高速になりました。

Intelが第4世代Xeon Scalableの発売時にAVX-512の改良をもっとアピールしなかったことに、私はむしろ驚いています。しかしいずれにせよ、AVX-512がより高い性能を発揮しながら、前世代のAVX-512プロセッサで見られたような電力消費への大きな影響もないのは、良いことです。これは、AMXと新しいアクセラレータを使用するために適応しなければならないのと比較して、多くの既存のソフトウェアにすぐに利益をもたらすことができます。より効率的なAVX-512とSapphire Rapids、そしてAVX-512を搭載したAMD Zen 4 CPUの組み合わせにより、より多くのソフトウェア開発者が自分のソフトウェアにAVX-512の最適化を考慮するようになることを期待しています。

Phoronix

AMDがEPYC GenoaチップでAVX-512のマーケティングに力を入れたのに対し、IntelがSapphire RapidsチップでAVX-512についてあまり触れなかったことを考えると、IntelはAVX-512で大きな性能向上を実現しただけではなく、最高の効率性も実現したのは驚きだろう。AVX-512を有効にすると、Intel Sapphire Rapids CPUはGenoaチップと同等かそれ以上の性能を発揮し、AVX-512によってのみ、EPYCチップはブーストアップを実現することができたのだ。

Phoronixでは、開発者がすでに市場に出ているAVX-512互換のソフトウェアを引き続き利用し、より新しいAMX拡張セットに適応するための負担を軽減できると予測している。


Source



この記事が面白かったら是非シェアをお願いします!


  • google building
    次の記事

    Google、全世界で12,000人の人員削減を発表

    2023年1月21日 6:44
  • 前の記事

    Wi-Fiルーターの電波を使って部屋の中の人の動きを透視する画期的システム

    2023年1月20日 19:07
    1673979738273 untitled design 16

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • TSMC FAB18

    TSMCの3nmノードが急成長、2024年は収益の20%以上を占める可能性

  • what is ai pc

    Intel、「AI PC」の要件は40TOPS以上の性能を持つNPUが必要と述べる、ただしMeteor Lakeはこれを満たさず

  • intel ai pc developer program

    Intel、小規模ソフトウェア開発者のAI PC向けアプリ制作を支援する新プログラムを開始

  • UXL logo

    NVIDIAのAI市場支配からの脱却を目指しGoogle、Intel、Qualcommらが協力

  • us china

    中国、政府機関のコンピュータにIntelとAMDのプロセッサー使用を禁止へ

今読まれている記事