NVIDIAは、データセンター規模の最新スーパーコンピューター「Eos」を紹介するビデオを公開した。
ギリシャ神話の女神の名にちなんで名付けられた「Eos」は、非常に大規模なNVIDIA DGX SuperPODであり、NVIDIAの開発者自身のために構築された。Eosは、高度なAI開発用に設計された最新のエンタープライズ向けスーパーコンピュータであり、高速化されたコンピューティング・インフラと完全に最適化されたソフトウェアを提供し、同社自身がイノベーションを生み出す場所として利用されている。
Eosは、NVIDIA DGX H100システム576台、NVIDIA Quantum-2 InfiniBandネットワーキングおよびソフトウェアで構築されている。各DGX H100システムには、8個のNVIDIA H100 Tensor Core GPUが搭載され、合計4,608個ものH100 GPUを搭載している。これにより、EosはHPCとAIでそれぞれRmax 121.4 FP64 PFLOPSと18.4 FP8 EFLOPSという驚異的な性能を達成する。
Eosは、FP64で測定される最新のトップ500リストでは世界第9位の高性能スーパーコンピュータにランクされており、純粋なAIタスクではおそらく最速と見られる。
「EOSは毎日、AI研究を行っている何千人ものNVIDIA社内開発者の課題に立ち向かい、これまで解決できなかった課題の解決を支援しています」とNVIDIAはビデオで述べている。
Eosの設計(DGX SuperPODアーキテクチャに依存)は、AIワークロードとスケーラビリティのために構築されており、NVIDIAのMellanox Quantum-2 InfiniBand with In-Network Computingテクノロジーを使用しています。
強力なハードウェアに加え、NVIDIAのEosは強力なソフトウェアも搭載しており、これもまたAIの開発と展開のために作られたものだという。その結果、NVIDIAのEosは、ChatGPTのような大規模言語モデル、レコメンダー・システム、量子シミュレーションなどを訓練するための最大規模のAIワークロードを処理することができる。
「Eosは、オーケストレーションとクラスタ管理、高速化されたコンピュート・ストレージとネットワーク・ライブラリ、AIワークロードに最適化されたオペレーティング・システムなど、AIの開発とデプロイメント・ソフトウェアを含む統合ソフトウェア・スタックを備えています。Eosは、Saturn 5やSeleneといった先行するNvidia DGXスーパーコンピューターで得られた知識を基に構築されたもので、NVIDIAのAIに関する専門知識が実際に活用されている最新の例です。EosのようなAIファクトリーを構築することで、企業は最も要求の厳しいプロジェクトに挑戦し、現在そして将来にわたってAIの願望を達成することができます」と、NVIDIAは述べている。
Source
コメントを残す