NVIDIAのCEO Jensen Huagn氏は、2024年SIEPR経済サミットで同社の次期DGXサーバーが「液冷式」になることを明らかにし、データセンターの領域で新たな機会を開くと述べている。
Huang氏は明確にDGXサーバーについて触れたわけではないが、最新のGPUとAIプロセッサーのパワーについてのコメントの中で、「我々のコンピューターの1つ 」であり、「間もなく登場する次のコンピューターは液冷式だ」と述べている。NVIDIAのAIに特化したコンピュータの唯一のラインナップがDGXであることから、おそらく彼がはDGXのことを指していると見られ、少なくとも一部のIT業界アナリストはそう見ている。
液冷は、データセンターとAIサーバーの分野でそのシェアを伸ばしており、企業はAI液冷装置の製造工場に莫大な投資を行っている。それに伴い、液冷データセンターには膨大な量の研究開発作業とそれを維持するための十分なインフラが必要になる。
データセンターにおける液冷の使用には長所と短所があり、主な利点としては、冷却プロセスがより高効率になることと、液冷によってラック内にサーバーを密に配置できるため、サーバーラックの密度が高くなることが挙げられる。しかし、初期コストが高く、機構全体のメンテナンスが複雑なため、これまで業界への導入が妨げられてきた。搭載機器の進歩に伴い、データセンターは最終的に独自の空冷よりも優れた冷却システムを必要とすることになり、液冷がその方法となるようだ。
サーバーは、たとえ大規模で最先端のデータセンターに設置されているものであっても、現世代のDGXを含め、CPUとGPUはいまだに主に空冷に頼っている。NVIDIAのハイエンド・グラフィックス・カードH100とH200でさえ、空冷で十分に機能するため、液冷への切り替えの推進力はそれほど大きくなかった。しかし、NVIDIAの次期Blackwell GPUは最大1,000ワットを消費するとDellが発表しているため、液冷が必要になるかもしれない。
プロセッサの消費電力が増せば増すほど、性能は向上するが、発熱量の課題も大きくなる。Intelの研究者は、2,000ワットの発熱に対応できる液体冷却装置の開発に取り組んでいる。長年にわたり、プロセッサの消費電力と発熱量は増加の一途をたどってきた。この傾向を維持するには、革新的な冷却ソリューションが必須となる。
ただし、消費電力が4桁に達することに対しては、批判の声も上がっている。アナリストのPatrick MoorheadはNVIDIAの液冷DGXを「これまでほとんどすべての手段を講じて、ある程度の発熱と消費電力を抑えてきたが、次は液体窒素を使うのか」と皮肉を述べ、このような技術の統合は持続可能ではないと指摘している。
確かに、いつかは消費電力を増やしても性能がそれ以上伸びない壁に行き当たるだろう。しかし過去10年を振り返ると、300ワットが異常に高い数値だった時代から、最新のCPU/GPUでは簡単にそれを超える状況となっている。根本的な技術革新がない限り、消費電力の増加トレンドは当面続くと予想される。
Sources
コメントを残す