Meta社の副社長兼AIチーフであるYann LeCun氏が、現在の機械学習モデルよりも人間に近い方法で世界を学び、経験できる「自律型」AIのビジョンを示す新しい論文を発表した。
初めて、AIが囲碁で人類に勝利した日から、我々は機械学習により驚くほどのスピードで成長し、今では人が入力した言葉を理解し絵を描いたり動画を作ったりするAIが現れるなど、その進化はとどまるところを知らない。その進化を見て、人々はきっとこう思うだろう「そのうち人類を凌駕する知能を獲得するのではないだろうか」
最近、元Googleのエンジニアが、チャットボットが解雇される前に感情をを獲得したと主張するなど、その真偽については疑問の残る主張もあるが、実際の所、AIが人類に匹敵、凌駕する知能を備えているとはまだまだ言えないのが現状だ。Google傘下のDeepMindが、長年の数学の難問であった行列乗算について、人間よりも優れたアルゴリズムをAIが導き出したように、ある特定の分野では確かに人類を追い越す能力を備えてきている。
だが、人間や動物の仲間が、観察を通じて、また、物理的なインタラクションをほとんど必要とせずに、世界がどのように機能しているかについて、自発的に膨大な量の知識を得ることができるように自ら考え、様々に成長していくような「自律型」の機械知能システムは、まだその片鱗すら見えていない。では果たして、夢の自立型機械知能は登場するのだろうか?
LeCun氏がOpen Review.netに発表した新しい研究は、学習アルゴリズムをより効率的に学習するように訓練することで、この問題を解決する方法を提案している。
LeCun氏は、Meta社のAI開発を率いる傍ら、ニューヨーク大学の教授でもあり、キャリアのほとんどを、今日の多くのAIアプリケーションに依存する学習システムの開発に費やしてきた。2013年、彼はFacebook AI Research(FAIR)グループを設立し、Metaが初めてAI研究の実験に乗り出し、その数年後に同社のチーフAIサイエンティストに就任した。
それ以来、Metaは成長し続けるこの分野を支配しようと、さまざまなレベルの成功を収めてきた。2018年、同社の研究者は、ユーザーがデジタル写真を簡単に編集できるようにすることを期待して、目玉を複製するAIを訓練した。今年初めには、MetaのチャットボットBlenderBot3(作成者に対して驚くほど悪意があることが判明)が、AIの倫理と偏ったデータに関する議論を巻き起こした。最近では、MetaのMake-a-Videoツールが、テキストだけでなく、単一またはペアの画像を動画にアニメートできるようになり、かつて期待されたAI生成アートの台頭にさらに悪いニュースがもたらされることになった。
例えば、自動車の運転を人間がマスターしようとすれば、数十時間練習を繰り返すだけで、自分で衝突を試さなくても、運転を学ぶことができる。一方、機械学習システムは、同じタスクを達成する前に、非常に大量のデータで訓練する必要がある。
「車は、それが悪い考えだと理解する前に、何度も崖から走り出さなければならないだろう。そして、崖から飛び降りない方法を理解するまでに、さらに数千回走らなければならないのです。その区別は、人間と動物が常識的な能力を持つことにある」と、カリフォルニア大学バークレー校で発表した際にLeCun氏は言った。
常識という概念は、実用的な判断力を持つということに集約されるが、ルカン氏は論文の中で、常識とは、生き物が、ありそうなこと、可能なこと、不可能なことの違いを推論するのに役立つモデルの集合体である、と説明している。このような能力があれば、人は自分の環境を探索し、不足している情報を補い、未知の問題に対する新しい解決策を想像することができる。
しかし、科学者がAIや機械学習のアルゴリズムにこのような能力を持たせることがまだできないため、私たちは常識という才能を当たり前のように感じているようだ。また、LeCun氏は、強化学習(好ましい行動には報酬を、好ましくない行動には罰を与えるという学習方法)のような最新の学習プロセスの多くが、実世界のタスクにおける人間の信頼性にマッチしていないことも指摘した。
「私たちは、常識のある機械が欲しいのですから、これは現実的な問題です。自動運転車も、家庭用ロボットも、知的なバーチャルアシスタントも欲しいのです」とLeCun氏は言う。
そこでLeCun氏の論文は、今後10年間でAI研究を発展させることを目的に、システムが学習し、与えられたタスクを遂行するために必要なアクションの数を最小限に抑えるアーキテクチャを提案している。
脳のさまざまな部位が身体のさまざまな機能を担っているように、LeCun氏は、5つの独立した、しかし設定可能なモジュールで構成される自律知能を生み出すモデルを提案しているのである。提案されているアーキテクチャの中で最も複雑な部分の1つである「ワールドモデルモジュール」は、世界の状態を推定し、想像上の行動や他の世界のシーケンスを予測する、シミュレーターのような働きをする。しかし、この単一の世界モデルエンジンを使用することで、世界の動きに関する知識を異なるタスク間で簡単に共有することができる。ある意味、“記憶”と似ている物と言えるかもしれない。
とはいえ、自律システムが不確実な状況に対処できるようになるには、まだ多くのハードワークが必要だが、私たちのように混沌として予測不可能な世界では、遅かれ早かれ対処しなければならない問題であることは間違いない。しかし、今のところ、そのカオスに対処することが、私たちを人間たらしめている要素の一部なのだ。
論文
- Open Review.net: A Path Towards Autonomous Machine Intelligence Version 0.9.2, 2022-06-27(PDF)
参考文献
研究の要旨
どうすれば機械は人間や動物と同じように効率よく学習できるのだろうか?機械はどのようにして推論と計画を学ぶことができるのだろうか?どのようにすれば、機械は知覚と行動計画の表現を複数の抽象度で学習し、複数の時間軸で推論、予測、計画することができるのだろうか?このポジションペーパーでは、自律型知的エージェントを構築するためのアーキテクチャとトレーニングパラダイムを提案する。これは、設定可能な予測世界モデル、内発的動機による行動、自己教師付き学習で訓練された階層的結合埋め込みアーキテクチャなどの概念を組み合わせたものである。
コメントを残す