世界最速のスーパーコンピューターは、障害により丸1日の連続稼働ができないらしい

masapoco
投稿日 2022年10月11日 16:08
ORNL Frontier

オークリッジ国立研究所(ORNL)には、スーパーコンピュータ「Frontier」が設置されている。Frontierは、AMDのEPYC Trento CPUとInstinct MI250X compute Acceleratorsを使って作られた最初のエクサスケールレベルのシステムとして注目されている。システム全体には、HPEのSlingshotインターコネクトが使用されている。また、世界最速のスーパーコンピュータであり、世界で唯一稼働中のエクサスケールデザインであることが予定されている。

HPEによるCray EXアーキテクチャは、2023年から科学研究を支援するために研究者がアクセスできる大規模アプリケーションのために作られたものだ。しかし、このスーパーコンピューターは、ハードウェア内のいくつかの障害により、丸1日稼働させることができないという。

ORNL Frontierは、起動はするが、1.685 FP64 ExaFLOPSを実現するように設計されたシステムに対し、最大で1 FP64 ExaFLOPSしか出せないのだ。具体的な問題点については何も語られていないが、いくつかの噂が明らかになってきている。

まず、HPE Crayスーパーコンピュータ用に作られたネットワークであるSlingshotインターコネクトが、HPEクラスタと競合している。残念ながら、この問題の正確な特定は不明だ。次に、AMD Instinct MI250XコンピュートGPUとEPYC Trento CPUが、Slingshotインターコネクトと競合すると噂されている。ここでも、ORNL Frontierスーパーコンピュータのプロジェクトリーダーや研究者からの正式な発表はない。

米国エネルギー省(DOE)のExascale Computing ProjectのMike Bernhardt氏は、ORNL Frontierの完全統合は来年から研究者に提供されると述べているが、Frontierスパコンの完全立ち上げに懸念や問題があるとはしていない。

ORNLのエクサスケール構想のパートナーであるHPEとAMDは、このファルのために新しいFrontierシステムを予定より早くORNLに納品しました。Frontierのインストールと統合は巨大で複雑な作業ですが、現在の進捗状況を見ると、来年にはFrontierをオープンサイエンスのためにユーザーに提供できるように、すべてが予定通りに進んでいることがわかります。

Mike Bernhardt (DOE’s Exascale Computing Projectコミュニケーション・リード)

Bernhardt氏が「complex effort」と述べている配置は、このプロジェクトに関する噂が絶えない理由につながる可能性がある。また、AMDのMI250XコンピュートGPUは一部の顧客にしか提供されていないため、噂の裏付けとなるベンチマークが不足していることも指摘されている。DOEはFrontierに関して、Oak RidgeのLeadership Computing Facilityと密接に連携している。

ORNL Frontierスーパーコンピュータは、当初の2022年という期限に間に合わず、2023年1月1日までにフル稼働する予定である。



この記事が面白かったら是非シェアをお願いします!


  • loftid image widescreen copy
    次の記事

    NASA、地球低軌道上で巨大な膨張式熱シールドをテストする予定

    2022年10月11日 18:03
  • 前の記事

    スペースXの衛星インターネットサービス「スターリンク」日本での商用提供開始へ

    2022年10月11日 15:42
    star 10 o

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • Quantinuum Trap scaled 1

    理化学研究所、日本の大規模ハイブリッド量子スーパーコンピューティング・プラットフォームにQuantinuum H1を採用

  • artificial intelligence

    人間の脳を忠実に模倣した画期的なスーパーコンピューターが登場 – 心の秘密を解き明かし、AIを進化させる可能性も

  • Tianhe Xingyi

    中国、謎の国産チップを搭載したエクサフロップス級スパコン「天河新義」を発表

  • 4b3d567426f3b13b1bf1c86f0a551f3e

    中国の新型384コアCPUがスーパーコンピューティング能力を強化

  • NCC UK Isambard AI site

    英国政府、412億円を投じて国内史上最速のNVIDIA AIスーパーコンピューターを構築

今読まれている記事