AMDが先日オープンソース化した「FidelityFX Super Resolution」は、NVIDIAのDLSSと比較した利点として、専用のML(機械学習)ユニットを必要としない、より汎用的なものであるにもかかわらず、FSR2.0ではそれに匹敵する程のパフォーマンスを発揮したことが大きく評価されているが、AMDはその更に上のクオリティを自社製GPU搭載マシンで実現する可能性が出てきたようだ。
Coelacant’s Dream : GFX11/RDNA 3 では行列積和演算命令、WMMA (Wave Matrix Multiply-accumulate) をサポート
The LLVM Compiler Infrastructure Project : [AMDGPU] gfx11 WMMA instruction support
AMD の開発者によって、LLVM に GFX11 の新機能、新命令のサポートを追加するパッチが続いて投稿されたとのことだ。これによると、GFX11 ハードウェアに WMMA (Wave Matrix Multi-Accumulate) 命令が導入されている。GFX11 というコードネームは、AMD の RDNA 3 GPU ファミリーに内部的に使用されているもので、次世代 Radeon RX 7000 および Radeon Pro グラフィックカードに搭載される予定だ。
WMMA命令はその名の通り、マトリックス(数字を含むテーブルの長方形の配列)を操作する。
// WMMA (Wave Matrix Multiply-Accumulate) intrinsics
//
// These operations perform a matrix multiplication and accumulation of
// the form: D = A * B + C .
このタイプのデータは、AI/MLアルゴリズムで大きな数値セットの乗算に多用されている。NVIDIAが最新のTensorコアアーキテクチャを通じて深層学習演算に行列乗算を使用する方法と同様に、AMD WMMA命令はハードウェアレベルで融合され、より優れた機械学習またはDNN演算の達成を支援する物と見られる。現在、多くの詳細は提供されていないが、このLLVMの最近の更新は、RDNA 3 GPUにおける主要なグラフィックス・パイプラインのオーバーホールを示唆するものである可能性がある。
FSRは、DLSSが3~4年で180以上のタイトルが対応したのに対し、わずか1年で113以上のゲームが対応するなど、競合他社に比べ1年ですでに2倍の採用率を記録している。AMDはこの技術をPCとコンソール(Microsoft Xbox)の両方にオープンソース化することで、さらなる採用の可能性を広げている。ただ、もしAMDが今後、FSRテクノロジーをハードウェアアクセラレーションに依存させることになるならば、NVIDIAがTuring世代のGPUの早い段階でゲームハードウェアにTensorコアを実装したことは正しい判断だったことになる。そこら辺、FSR2.0でTensorコアに依存しないという汎用性をアピールしたのは何だったのだろうかと思ってしまうが・・・・・・。
とはいえ、NVIDIAは、次世代GeForce RTX 4000に、DLSS 3.0のためにさらに優れた、より最適化されたTensorコアを実装すると見られているので、両社の対決を見てみたい気もする。
コメントを残す