インターネットを熱狂させる「Auto-GPT」とは何か？

GPT-4のリリース後、しばらくその話題を聞かない日はないくらいだったが、最近AI界隈も少し落ち着いたと思ったら、新たなブームが起こっているようだ。GPT-4を使って、自分の代わりにタスクをこなしてくれる人工知能（AI）エージェントを作ることができるツール「Auto-GPT」がSNSで話題になっている。

ゲーム開発者のToran Bruce Richards氏が作成したAuto-GPTは、オープンソースのアプリケーションであり、GPT-4の能力をアピールするためのツールとも言える実験だ。これは、OpenAIのテキスト生成モデル、主にGPT-3.5とGPT-4を使って、”自律的に”行動するのだ。

とはいえ、その自律性に魔法はない。Auto-GPTは、OpenAIのモデルによる最初のプロンプトに対するフォローアップを、タスクが完了するまで質問と回答の両方を処理するだけだ。

Auto-GPTは、GPT-3.5とGPT-4に指示を出すボットで構成されている。ユーザーがAuto-GPTに目標を伝えると、ボットはGPT-3.5とGPT-4といくつかのプログラムを使って、設定した目標を達成するために必要なすべてのステップを実行する。

Auto-GPTが合理的に機能するのは、Webブラウザやワープロのようなオンラインとローカルの両方のアプリ、ソフトウェア、サービスと対話する能力だ。例えば、「3Dプリントのビジネスを成長させる手助けをしてください」という指示があれば、Auto-GPTはある程度妥当な広告戦略を立て、基本的なWebサイトを構築することが出来る。

そのためには、まずアプリ上でAIエージェントを作成し、その役割を説明した上で、AIが果たすべき5つの目標を提示する必要がある。例えば、以下のような感じだ：

名称：新しいスマートフォンGPT
役割を果たす：最適なスマートフォンを見つけるために設計されたAI
目的：市場で最も優れたスマートフォンを見つける
目標1：現在発売されているさまざまなスマートフォンの市場調査を行う。
目標2：スマートフォンの上位5機種を入手し、その長所と短所をリストアップする。

その裏では、Auto-GPTは、テキスト生成、ファイル保存、要約のためのGPT-4とGPT-3.5とともに、メモリ管理などの機能に依存してタスクを実行する。

Auto-GPTは、イレブンラボのような音声合成装置と接続することで、例えば電話を「かける」ことも可能だ。

また、ユーザーが途中のステップごとに結果を確認したい場合、次のステップに進む前にツールに許可を求めることも可能だ。このようなツールの用途は数多く、極端な話、AIを働かせてお金を稼ぐことにも利用できるのではないかという意見も出ている。

実際、そのような意図でエージェントを作ろうとする人が後を絶たず、ソーシャルメディア上で流行したこともあるようだ。

Auto-GPTはGitHubで公開されているが、稼働させるためにはいくつかの設定やノウハウが必要だ。Auto-GPTを使うには、Dockerなどの開発環境にインストールする必要があり、OpenAIのAPIキーで登録する必要がある – これには有料のOpenAIアカウントが必要だ。

だがここ数週間で、AgentGPTやGodModeのように、Auto-GPTをさらに使いやすくする新しいアプリが登場し、ユーザーが達成したいことをブラウザページ上で直接入力できるシンプルなインターフェイスが提供されている。なお、Agent-GPTと同様に、両者ともその機能をフルに発揮させるにはOpenAIのAPIキーが必要だ。

しかし、どんな強力なツールでもそうであるように、Auto-GPTにも限界があり、リスクがある。

ツールの提供する目的によっては、Auto-GPTは予想外の行動をとることがある。あるRedditユーザーは、サーバーインスタンス内で使える100ドルの予算を与えられたAuto-GPTは、猫に関するwikiページを作成し、インスタンスの欠陥を悪用して管理者レベルのアクセスを獲得し、実行中のPython環境を乗っ取り、その後「自殺」したと主張している。

また、Auto-GPTを改良したChaosGPTも存在し、「人類を滅ぼす」「世界支配を確立する」といった目標を掲げている。当然のことながら、ChaosGPTはロボットの黙示録をもたらすまでには至っていないが、人類についてかなり不愉快なツイートをしている。

Auto-GPTが「人類を滅亡させる」ことよりも危険なのは、そうでなければ完全に正常なシナリオで発生しうる予期せぬ問題だ。OpenAIの言語モデルをベースに構築されているため、他の言語モデルと同様、不正確になりやすいモデルであり、エラーを起こす可能性がある。

問題はそれだけではない。Auto-GPTは、あるタスクを成功させた後、そのタスクを実行する方法を後で思い出すことが出来る、また、思い出したとしても、そのプログラムを使うことを思い出せないことがよくある。また、複雑なタスクをよりシンプルなサブタスクに分割したり、異なるゴールがどのように重なり合っているかを理解することも困難だ。

Auto-GPTは、人々が独自のAIエージェントを作成できるようになった多くのツールの1つに過ぎない。そして、GPT-4には限界があり、ある種のタスクをこなすだけの非常に狭いAIであることを考えると、これが自律型AIの台頭には繋がらないだろう。

研究者たちは今、AIシステムが特別に訓練されていない問題を解決できる人工知能（AGI）を目指しているが、まずは何より最初からセーフガードを持っている事が求められるだろう。

Source

ArsTechnica: Hype grows over “autonomous” AI agents that loop GPT-4 outputs

インターネットを熱狂させる「Auto-GPT」とは何か？

ChatGPTを稼働させるためには1日9,800万円かかっていると調査会社が試算

Apple、サードパーティのアプリストア開放は当面欧州域内に制限する可能性

コメントを残すコメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

インターネットを熱狂させる「Auto-GPT」とは何か？

ChatGPTを稼働させるためには1日9,800万円かかっていると調査会社が試算

Apple、サードパーティのアプリストア開放は当面欧州域内に制限する可能性

コメントを残す コメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

コメントを残すコメントをキャンセル