インターネットを熱狂させる「Auto-GPT」とは何か?

masapoco
投稿日 2023年4月23日 13:11
ai chip image 1

GPT-4のリリース後、しばらくその話題を聞かない日はないくらいだったが、最近AI界隈も少し落ち着いたと思ったら、新たなブームが起こっているようだ。GPT-4を使って、自分の代わりにタスクをこなしてくれる人工知能(AI)エージェントを作ることができるツール「Auto-GPT」がSNSで話題になっている。

ゲーム開発者のToran Bruce Richards氏が作成したAuto-GPTは、オープンソースのアプリケーションであり、GPT-4の能力をアピールするためのツールとも言える実験だ。これは、OpenAIのテキスト生成モデル、主にGPT-3.5とGPT-4を使って、”自律的に”行動するのだ。

とはいえ、その自律性に魔法はない。Auto-GPTは、OpenAIのモデルによる最初のプロンプトに対するフォローアップを、タスクが完了するまで質問と回答の両方を処理するだけだ。

Auto-GPTは、GPT-3.5とGPT-4に指示を出すボットで構成されている。ユーザーがAuto-GPTに目標を伝えると、ボットはGPT-3.5とGPT-4といくつかのプログラムを使って、設定した目標を達成するために必要なすべてのステップを実行する。

Auto-GPTが合理的に機能するのは、Webブラウザやワープロのようなオンラインとローカルの両方のアプリ、ソフトウェア、サービスと対話する能力だ。例えば、「3Dプリントのビジネスを成長させる手助けをしてください」という指示があれば、Auto-GPTはある程度妥当な広告戦略を立て、基本的なWebサイトを構築することが出来る。

そのためには、まずアプリ上でAIエージェントを作成し、その役割を説明した上で、AIが果たすべき5つの目標を提示する必要がある。例えば、以下のような感じだ:

  • 名称:新しいスマートフォンGPT
  • 役割を果たす:最適なスマートフォンを見つけるために設計されたAI
  • 目的:市場で最も優れたスマートフォンを見つける
  • 目標1:現在発売されているさまざまなスマートフォンの市場調査を行う。
  • 目標2:スマートフォンの上位5機種を入手し、その長所と短所をリストアップする。

その裏では、Auto-GPTは、テキスト生成、ファイル保存、要約のためのGPT-4とGPT-3.5とともに、メモリ管理などの機能に依存してタスクを実行する。

Auto-GPTは、イレブンラボのような音声合成装置と接続することで、例えば電話を「かける」ことも可能だ。

また、ユーザーが途中のステップごとに結果を確認したい場合、次のステップに進む前にツールに許可を求めることも可能だ。このようなツールの用途は数多く、極端な話、AIを働かせてお金を稼ぐことにも利用できるのではないかという意見も出ている。

実際、そのような意図でエージェントを作ろうとする人が後を絶たず、ソーシャルメディア上で流行したこともあるようだ。

Auto-GPTはGitHubで公開されているが、稼働させるためにはいくつかの設定やノウハウが必要だ。Auto-GPTを使うには、Dockerなどの開発環境にインストールする必要があり、OpenAIのAPIキーで登録する必要がある – これには有料のOpenAIアカウントが必要だ。

だがここ数週間で、AgentGPTやGodModeのように、Auto-GPTをさらに使いやすくする新しいアプリが登場し、ユーザーが達成したいことをブラウザページ上で直接入力できるシンプルなインターフェイスが提供されている。なお、Agent-GPTと同様に、両者ともその機能をフルに発揮させるにはOpenAIのAPIキーが必要だ。

agentgpt screenshot3
AgentGPT

しかし、どんな強力なツールでもそうであるように、Auto-GPTにも限界があり、リスクがある。

ツールの提供する目的によっては、Auto-GPTは予想外の行動をとることがある。あるRedditユーザーは、サーバーインスタンス内で使える100ドルの予算を与えられたAuto-GPTは、猫に関するwikiページを作成し、インスタンスの欠陥を悪用して管理者レベルのアクセスを獲得し、実行中のPython環境を乗っ取り、その後「自殺」したと主張している。

また、Auto-GPTを改良したChaosGPTも存在し、「人類を滅ぼす」「世界支配を確立する」といった目標を掲げている。当然のことながら、ChaosGPTはロボットの黙示録をもたらすまでには至っていないが、人類についてかなり不愉快なツイートをしている。

Auto-GPTが「人類を滅亡させる」ことよりも危険なのは、そうでなければ完全に正常なシナリオで発生しうる予期せぬ問題だ。OpenAIの言語モデルをベースに構築されているため、他の言語モデルと同様、不正確になりやすいモデルであり、エラーを起こす可能性がある。

問題はそれだけではない。Auto-GPTは、あるタスクを成功させた後、そのタスクを実行する方法を後で思い出すことが出来る、また、思い出したとしても、そのプログラムを使うことを思い出せないことがよくある。また、複雑なタスクをよりシンプルなサブタスクに分割したり、異なるゴールがどのように重なり合っているかを理解することも困難だ。

Auto-GPTは、人々が独自のAIエージェントを作成できるようになった多くのツールの1つに過ぎない。そして、GPT-4には限界があり、ある種のタスクをこなすだけの非常に狭いAIであることを考えると、これが自律型AIの台頭には繋がらないだろう。

研究者たちは今、AIシステムが特別に訓練されていない問題を解決できる人工知能(AGI)を目指しているが、まずは何より最初からセーフガードを持っている事が求められるだろう。


Source



この記事が面白かったら是非シェアをお願いします!



コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です