Google DeepMind、これまでで最大となるロボティクス・データセットをオープンソースで公開

masapoco
投稿日 2023年10月5日 15:58
Open X Embodiment hero

GoogleのAI研究部門であるDeepMindは、33の学術研究所と提携し、汎用ロボット学習のための新しいリソース・セットを立ち上げた。

Open X-Embodiment」と名付けられたデータセットは、22種類のロボットから収集した情報を含む大規模なものだ。これらのロボットは、100万回以上のエピソードの間、527の異なることを行い、15万以上のタスクを完了した。特筆すべきは、このデータセットがこの種のものとしては最大であり、多くの異なるタイプのロボットを理解し制御できるコンピューター・プログラム、つまり一般化されたモデルを作るための一歩であるということだ。

ロボット工学は特にデータの問題を扱っているため、このデータセットは時代の要請である。一方では、大規模で多様なデータセットは、それぞれの専門分野で狭いデータセットを持つモデルよりも優れている。一方で、膨大なデータセットを構築するのは、面倒なリソースと時間のかかる手順である。さらに、その品質と関連性を維持することは困難である。

NVIDIA AIのリサーチ・サイエンティストであるJim Fan氏は、「今日は、ロボット工学にとってのImageNetの瞬間かもしれない」とXにポストしている。彼はさらに、11年前にImageNetがディープラーニング革命を起こし、最終的に最初のGPTと拡散モデルにつながったと指摘した。「2023年はついにロボティクスがスケールアップする年だと思います」と彼は付け加えた。

研究者たちは、最新のOpen X-Embodimentデータセットを使って、2つの新しいジェネラリスト・モデルを訓練した。ひとつはRT-1-Xと呼ばれるもので、ロボットを制御するために設計されたトランスフォーマーモデルである。このモデルは、ドアを開けるなどのタスクを、そのためだけに作られたモデルよりも50%高い平均成功率で実行する。

もう1つのRT-2-Xは、視覚言語行動モデルで、見聞きしたことを理解し、インターネットからの情報もトレーニングに利用する。これらのプログラムは、基本的なアーキテクチャは同じでも、前身のRT-1やRT-2よりも優れている。重要なのは、以前のモデルはより狭いデータセットで訓練されていたことだ。

ロボットはまた、これまで一度も訓練されたことのないタスクの実行を学習した。これらの創発的なスキルは、他のタイプのロボットから取り込まれた経験の範囲にエンコードされた知識によって学習された。実験中、DeepMindチームは、より優れた空間理解を必要とするタスクに関して、これが当てはまることを発見した。

同チームはデータセットと学習済みモデルの両方をオープンソース化し、他の研究者がこの研究を継続できるようにしている。


論文

参考文献

研究の要旨

多様なデータセットで訓練された大規模で大容量のモデルは、下流のアプリケーションに効率的に取り組む上で顕著な成功を示している。NLPからコンピュータビジョンに至る領域において、これは事前学習済みモデルの統合につながり、一般的な事前学習済みバックボーンは多くのアプリケーションの出発点として機能している。このような統合はロボット工学でも実現できるのだろうか?従来、ロボットの学習手法は、アプリケーションごと、ロボットごと、さらには環境ごとに個別のモデルを訓練していた。その代わりに、新しいロボット、タスク、環境に効率的に適応できる「汎用的な」Xロボットポリシーを訓練することはできるだろうか?本論文では、ロボット操作の文脈でこの可能性を探ることを可能にする標準化されたデータ形式とモデルのデータセットを、効果的なXロボットポリシーの例を示す実験結果とともに提供する。我々は、21の研究機関の協力により収集された22の異なるロボットから、527のスキル(160266タスク)を示すデータセットを組み立てる。我々は、RT-Xと呼ぶ、このデータに基づいて訓練された大容量モデルが、肯定的な転移を示し、他のプラットフォームからの経験を活用することによって、複数のロボットの能力を向上させることを示す。


Sources



この記事が面白かったら是非シェアをお願いします!


  • Pixel 8 and Pixel 8 Pro
    次の記事

    ベンチマークテストの結果ではPixel 8はPixel 8 Proより11%遅い事が判明

    2023年10月5日 16:22
  • 前の記事

    iPhone 15 Proモデルのオーバーヒート問題に対処したiOS 17.0.3がリリースされたが、処理性能は低下するのか?

    2023年10月5日 13:55
    Apple iPhone 15 Pro lineup hero 230912

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事