Intel、超高速AVX-512ソートライブラリを公開、Numpyが10〜17倍高速ソートに対応

masapoco
投稿日
2023年2月16日 16:35
Intel Xeon CPU Max Series Processor scaled 2

Intelは、SIMDベースの高速ソートを実現するオープンソースのC++ヘッダーファイルライブラリを公開した。これは当初、超高速のAVX-512クイックソート実装を提供することに重点を置いていた。今日現在、このコードはNumpyにマージされ、10倍から17倍のスピードアップを実現している。

昨年末、IntelはGitHubアカウントからx86-simd-sortをひっそりと公開した。これは高性能なSIMDソートのためのC++ヘッダーファイルライブラリだが、現在のところAVX-512クイックソートの実装にのみ焦点が当てられている。

このx86-simd-sortプロジェクトは取り上げられることが少ないが、現在、広く使われているNumpyのオープンソースプロジェクトを通じて、驚異的な結果を達成している。

新たにNumpyにマージされたPR 22315は、AVX-512を使用して16ビットおよび64ビットデータ型のクイックソートをベクトル化するためのものだ。Intel Tigerlakeシステムでは、16ビットint型のソートが17倍、64ビットfloat型のソートがランダム配列で10倍近く、32ビットデータ型が12~13倍高速化された。このNumpyの変更はIntelのエンジニアRaghuveer Devulapalliによって行われ、x86-simd-sortのコードを利用している。

AVX-512によるソートで10~17倍のスピードアップは、特に最近の世代のIntel CPUでより良いAVX-512効率を考慮すると、かなり驚異的なことだ。最新のXeon Scalableプロセッサでは、AVX-512は、大幅なCPUダウンクロックを引き起こすこともなく、むしろ良い状態になっている。一方、AMD側では、Ryzen 7000シリーズから第4世代EPYCサーバー・プロセッサーまでのZen 4プロセッサーで、ようやくAVX-512がサポートされるようになった。


Source



この記事が面白かったら是非シェアをお願いします!


  • quera
    次の記事

    新しいエンコーディング方式により、量子コンピュータはより多くのタスクを処理できるようになった

    2023年2月16日 17:12
  • 前の記事

    Roblox、予想を上回る成長を見せ「メタバース」の可能性を独自に示す

    2023年2月16日 14:18
    roblox feature

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • TSMC FAB18

    TSMCの3nmノードが急成長、2024年は収益の20%以上を占める可能性

  • what is ai pc

    Intel、「AI PC」の要件は40TOPS以上の性能を持つNPUが必要と述べる、ただしMeteor Lakeはこれを満たさず

  • intel ai pc developer program

    Intel、小規模ソフトウェア開発者のAI PC向けアプリ制作を支援する新プログラムを開始

  • UXL logo

    NVIDIAのAI市場支配からの脱却を目指しGoogle、Intel、Qualcommらが協力

  • us china

    中国、政府機関のコンピュータにIntelとAMDのプロセッサー使用を禁止へ

今読まれている記事