「羊の毛を刈って」のように指示を出すと、その通りにマイクラ内で動いてくれるAI「MineDojo」についての論文が機械学習カンファレンスの賞を受賞

masapoco
投稿日
2022年11月29日 12:02
clip

NVIDIAによると、同社が開発した「MineDojo」という、書かれたプロンプトから人気サンドボックスゲーム『Minecraft』のアクションを実行できる汎用AIエージェントについて、これを解説した論文が、2022年のNeurIPS(神経情報処理システム)カンファレンスで「Outstanding Datasets and Benchmarks Paper Award」を獲得したとのことだ。

以前も、OpenAIが『Minecraft』を人間以上のテクニックでプレイするAIを発表していたが、AI界隈ではこのゲームをAIにプレイさせるのがホットなようだ。

MineDojoフレームワークにMinecraftをプレイさせるために、73万本のMinecraft YouTubeビデオ(22億語以上が書き起こされた)、Minecraft wikiからかき集めた7000のウェブページ、Minecraftゲームプレイに関する34万のReddit投稿と660万のRedditコメントなど、膨大なデータを与え、学習させている。

このデータから、研究者はMineCLIPと呼ばれるカスタム変換モデルを作成した。これは、人間の手によるラベリングなしに、YouTube動画からMinecraftの概念と動作を学習する。YouTuberは通常、ゲームプレイ動画を配信する際に何をしているのかナレーションを入れるため、MineCLIPは、ビデオクリップとそれに対応する英語のトランスクリプトを関連付けることを学習するのだ。

その結果、誰かがMineDojoエージェントに、プログラミングの様な命令ではなく、「砂漠のピラミッドを見つけろ」「ネザーポータルを作ってそこに入れ」といったような、我々が普段使うような高度な自然言語でゲーム内の行動を指示すると、MineDojoは、Minecraftのゲーム内で、指示通りの動作を行う事が可能になったとのことだ。

MineDojoは、学習した行動を汎化し、ゲーム内のさまざまな行動に適用できる柔軟なエージェントを作ることを目的としている。NVIDIAは、「StarCraft、Dota、Goなどのビデオゲーム環境において、研究者は長い間、自律型AIエージェントを訓練してきましたが、これらのエージェントは通常、いくつかのタスクのスペシャリストにすぎませんでした。そこで NVIDIAの研究者は、世界で最も人気のあるゲームである Minecraft に着目し、ジェネラリスト エージェント (さまざまなオープンエンドのタスクをうまく実行できるエージェント) のためのスケーラブルなトレーニング フレームワークを開発しました。」と述べている。

現在はまだ複雑な自然言語処理は難しいようだが、将来的には、「家の前に青い花を一列に植える。」「ドアの枠に金の飾りをつける。」「川の横にある洞窟を探検しに行こう」と言った複雑な動作も行えるようになるという。

MineDojoは公式サイトで動作例を見ることができる。また、MineDojoMineCLIPのコードはGitHubで公開されている。

研究の要旨

自律エージェントは、アタリゲームや囲碁のような専門的な領域で大きな進歩を遂げてきた。しかし、自律型エージェントは通常、限られた手動で設定された目標に対して、孤立した環境でタブラ・ラサ的に学習するため、幅広いタスクや能力に対して汎化することができない。我々は、人間がオープンワールドで継続的に学習し適応していくことにヒントを得て、汎用的なエージェントを構築するための三位一体の要素を提唱している。1) 多様なタスクと目標をサポートする環境、2) マルチモーダルな知識の大規模データベース、3) 柔軟でスケーラブルなエージェントアーキテクチャです。このフレームワークは、何千もの多様なオープンエンドタスクを含むシミュレーションスイートと、Minecraftのビデオ、チュートリアル、Wikiページ、フォーラムでの議論を含むインターネット規模の知識ベースを特徴としている。MineDojoのデータを用いて、我々は事前に学習した大規模なビデオ言語モデルを学習報酬関数として活用する新しいエージェント学習アルゴリズムを提案する。本エージェントは、自由形式の言語で指定された様々なオープンエンドのタスクを、報酬を形成するために手動で設計することなく解決することができる。我々は、シミュレーションスイート、知識ベース、アルゴリズム実装、および事前学習済みモデル(https://minedojo.org)をオープンソース化し、一般的に有能な具象化エージェントの目標に向けた研究を促進する。



この記事が面白かったら是非シェアをお願いします!


  • iphone 14 pro lead
    次の記事

    iPhone 15 に白飛びや黒つぶれを抑える新型Sony製センサーが採用される可能性

    2022年11月29日 12:22
  • 前の記事

    Intelの次世代14コアモバイルCPU「Core i7-1370P」がクロック周波数5.0GHzで登場

    2022年11月29日 10:18
    Intel Mobile CPU
この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事