Xbox Series X|Sのゲーム読み込み時間は驚異的な物で、これはMicrosoftがコンソール機に導入した革新的な「Velocityアーキテクチャ」による物だが、この恩恵をWindows PCにももたらしてくれるのが「DirectStorage」だ。
先日DirectStorage 1.1が公開され、GPUによるデータ解凍が実装されたことで、真にその実力が発揮されることになったが、その最適な実装は、AMD、Intel、NVIDIAなどの各GPUメーカーに委ねられていることから、実際にその処理を担うGPUによってどの程度パフォーマンスに差が出るのかは気になるところ。
今回、Compusembleが開発したベンチマークを利用し、PC Games Hardwareが実際のパフォーマンス測定を行い、結果を公表してくれている。
MicrosoftのDirectStorage 1.1には、パフォーマンスを向上させる重要な機能がいくつかあるが、このAPIの主な目的は、NVMeからのデータ処理に関するCPU負荷を軽減することだ。高度に並列化されたGPUを介してSSDからのゲームデータの解凍を、CPUの介入をほとんど必要とせず、処理することができ、結果的にCPU使用率を下げ、全体としてのパフォーマンスの向上も可能となる。さらに、DirectStorageのアセット圧縮・解凍アルゴリズムを使用することで、ストレージ媒体(SSDなど)の能力以上のデータを転送することができ、ロード時間を大幅に短縮することが出来るのだ。
一方、GPUのハードウェア側では、DirectStorage解凍アルゴリズムの取り扱いが異なるため、PCGHは、AMDのRadeon RX 7900 XT、IntelのArc A770、NVIDIAのGeForce RTX 4080という最新のGPUのうち、どれが実際のデータ解凍処理で優れているかを比較した。それぞれのグラフィックボードとIntelのCore i9-12900KのCPUで処理を行っている。
PCIe 4.0 x4 (7.9GB/s) | PCIe 3.0 x4 (3.9GB/s) | SATA (0.6 GB/s) | |
---|---|---|---|
Radeon RX 7900 XT | 14.6 GB/s | 12.6 GB/s | 1.47 GB/s |
Arc A770 16GB | 16.8 GB/s | 13.9 GB/s | 1.64 GB/s |
GeForce RTX 4080 | 15.3 GB/s | 12.7 GB/s | 1.47 GB/s |
Core i9-12900K @ 5.20 GHz | 5.2 GB/s | 5.2 GB/s | 1.47 GB/s |
やはり驚きなのは、どのGPUもCore i9-12900Kプロセッサーの2.4倍以上の解凍処理能力を持っていることだろう。一方、GPUによるデータ解凍に関しては、IntelのArc A770がAMDのRadeon RX 7900 XTやNVIDIAのGeForce RTX 4080よりも顕著に優れていることがわかる。A770は16.8GB/sのレートでアセットを転送/解凍できるのに対し、RX 7900 XTは14.6GB/sで3位(首位と13%差)である。
AMD、Intel、NVIDIAのいずれのGPUを使用した場合でも、PCGHによれば、実際のロード時間は5秒から0.5秒へと一桁短縮されているとのことで、GPU同士での差は実際には体感できるレベルではないようだ。したがって、どのGPUを使用するかはあまり重要ではなく、DirectStorageを用いることで、いかにゲームパフォーマンスが向上するかが重要であり、これからリリースされるゲームにおいて、この機能が広く実装されることが期待される。
最初にこのDirectStorageを実装して発売されるのは、SQUARE ENIXのRPG「FORSPOKEN」だ。
Source
- PC Games Hardware: Nie wieder Ladezeiten? Direct Storage im ersten Test mit Radeon, Geforce und Arc
- via Tom’s Hardware: DirectStorage Performance Compared: AMD vs Intel vs Nvidia
コメントを残す