AMDは、AMDブランドで初めて発売されるデータセンター向けの新しい専用メディアアクセラレータとビデオエンコードカード「Alveo MA35D」を発表した。このカードは、AMDがXilinx買収の一環として手に入れたXilinx製カードの初期ラインの後継で、専用ビデオエンコードカードの市場に参入するきっかけとなった。最新世代のAlveoメディア・アクセラレータ・カードは、最大同時ビデオストリーム数を4倍に増やすとともに、AV1および8K解像度エンコードのサポートを追加し、前世代よりも大幅な性能向上を約束する。
MA35Dは、その前身であるAlveo U30と同様に、データセンター向けに設計された純粋なビデオエンコードカードである。つまり、ASICはリアルタイム/インタラクティブなビデオエンコードのためだけに設計されており、Xilinxは特定用途での性能向上を目指している。この設計戦略は、GPUベースの製品であるIntel(GPU Flexシリーズ)やNVIDIA(T4 & L4)の競合製品が、ビデオエンコードカードやゲーミングカードなどの役割を果たすために、GPUの柔軟性と内蔵ビデオエンコーダを活用するのと対照的である。それに比べてMA35Dは、動画エンコードをより最適に、効率的に行うために、そのことだけに特化した、比較的わかりやすい製品だ。
これは、AMDがXilinx買収に伴って継承した製品群で、その結果生まれたAdaptive & Imbedded Computing Groupが開発しているため、Alveo MA35DはAMDにとって新しい製品であると同時に、馴染みのある製品でもある。AMDがこれまでリリースしてきたデータセンター向けビデオエンコード製品は、同社のGPUラインナップをベースにしていたため、今回の製品はXilinx買収後のチームによる最新のビデオエンコードカードだが、AMDがこのような形でビデオエンコード専用カードを発売するのは初めてで、AMDがXilinx買収で求めていた新しい市場機会の典型例と言える。
このカードのターゲット市場は、前作と同様、データセンター市場だ。AMDの主なクライアントは、ライブストリーミングサービスやその他のインタラクティブなビデオサービス(Twitch、クラウドゲーム、ビデオ会議などを想定)で、いずれもサーバー環境で大量のビデオストリームをリアルタイムにエンコードする必要がある。つまり、AMDのEPYCプロセッサーと同様に、これは極一部の企業を対象としたサーバー部品なのだ。
Alveo MA35Dのハードウェアは、AMDが前モデルから大幅に世代交代したことをアピールしている。Alveo U30は、最大8つの1080pストリームをエンコードできるH.264およびH.265エンコードカードだったが、Alveo MA35Dは、これを大幅に拡張して32の1080pストリームに対応した。また、従来のH.264、H.265に加え、最新世代のAV1コーデックをサポートし、最大ストリーム解像度も4Kから8Kへと、4倍以上に向上した。
このカードの中心には、AMDがVideo Processing Unit (VPU)と呼んでいる名称未定のビデオエンコードASICがある。MA35Dは2つのVPUを搭載し、それぞれが8GBのLPDDR5メモリとPCIe 5.0 x4でホストプロセッサに接続されている。このVPUは5nmプロセスで製造されているが、AMDは使用しているファブを明らかにしていないため、Samsungの5nmプロセスだと思われる。昨今の評判を見れば、TSMCならそれを明らかにしているだろう。
各VPUには、4つのビデオエンコードブロックと、チップとして完全に機能させるために必要なさまざまなアクセサリブロックが搭載されている。エンコードブロックのうち2つは、H.264、H.265、AV1をサポートするフル機能ブロックだが、残りの2ブロックはAV1専用で、新しいコーデックの計算の複雑さが強調されている。VPUの他のブロックには、トランスコード用のビデオデコーダブロック、メモリコントローラ、管理コントローラ、ビットレートスケーラー、合成エンジン、22TOPSスループットAIプロセッサがあり、カードのビデオエンコード品質をさらに向上させる。
ビデオエンコードブロックについては、AMDのエンジニアは、この部品とAMDのGPUの取り組みとの間に重複する類似点があるにもかかわらず、VPUのビデオエンコードブロックは独自の設計であり、AMDのGPUビデオエンコードブロックから引っ張ってきたものではない、とする。AMDが最終的に製品ライン全体でエンコーダIPを統合しても不思議ではないが、現世代の製品では、Alveo MA35DのVPUはXilinx買収が完了する前に開発されていたため、旧Xilinxスチームが始めたことを完成させている。そのため、VPUにはそれぞれ癖があるが、Alveoのチームには、より優れたビデオエンコーダを作ったという自負があるようだ。
また、エネルギー効率は、旧型のU30カードに対するもう1つの大きな進歩であり、AMDが競合他社に対する重要な優位性だと考えている点でもある。カードの正式なTDPは50Wだが、実際のところ、カードの典型的な消費電力は約35Wに近く、1080p60のストリームあたり1Wを少し超える程度であることがAMDの調査で分かっている。これは、1080pのシングルストリームで3W強だったU30に対して、ストリームごとのエネルギー消費を66%削減することになる。
一方、Alveo MA35DとそのVPUに新たに搭載されたのがAIアクセラレーションブロックだ。GPUベースの製品とは異なり、画像認識のような擬似的なAIタスクのためではなく、むしろAMDはAIアクセラレータを使用して、ビデオエンコーダに追加のデータを送り込み、エンコーディングの品質をさらに向上させるために使用している。22TOPSの性能を持つこのAIプロセッサーは、フレーム単位でストリームを評価し、その分析結果をもとに、チップの他の部分で使用するエンコードパラメーターを調整するために存在する。
AIプロセッサは、関心領域エンコードとアーティファクト検出の両方を使用することで、MA35Dがより単純なビデオエンコードよりも低いビットレートで済むようにする。一方、アーティファクト検出は、エンコーダーにブロック状の画像や劣化した画像(エンコードしにくい画像)が送られた場合に、それを検出し、フレームがエンコードされる前に除去/修正することが出来る。
H.264および H.265の画質は、それぞれx264 Mediumおよびx265 Mediumプリセットと同様である必要があるが、カードのAV1エンコード品質はx265 Slowに匹敵するはずだ。これらの比較は、VMAFのスコアと、同様のスコアを達成するために必要な設定に基づいている。また、ビットレート単位で考えると、AV1を使用した場合、MA35DはH.264モードでAlveo U30と同じ画質をビットレートの55%で提供できるとしている(1.8倍の効率改善です)。
最後に、MA35Dのビデオエンコード機能には関係ないが、VPUの管理プロセッサがArmからRISC-Vに移行していることは興味深い。U30のプロセッサがクアッドコアのCortex-A53コアを使用していたのに対し、MA35DのVPUはクアッドコアのRISC-Vコアのペアを使用している。RISC-Vアーキテクチャは、このような管理コントローラのために静かにArmを追い出しており、これはその移行が実際に行われているもう1つの例である。
2つのVPUを搭載するAlveo MA35Dカードは、シングルスロットのハーフハイトハーフレングスのフォームファクターで提供されるほど、まだ小さい。一方、50WのTDPは、PCIe x8コネクタ(VPUごとにx4コネクタに分岐)を介して接続されたPCIeスロットから完全に給電されることを意味する。また、データセンターのアクセラレータカードによく見られるように、MA35Dはパッシブ冷却されている。
AMDによると、Alveoは現在パートナーにサンプリング中。第3四半期に生産出荷を開始し、希望小売価格は1595ドルを予定している。
Source
コメントを残す