ChatGPTで世界に衝撃を与えたOpenAIは、その主戦場を単なるAIチャットボットから、より複雑な作業を自動化するためのAIエージェント開発に移している可能性がある。
The Informationによると、同社は既に2種類のAIエージェントの開発を進めているようだ。それによると、1つのタイプのエージェントは、文書やスプレッドシート間のデータ転送や経費報告書の記入などのタスクを実行するために、ユーザーのデバイスを引き継ぐことができる。エージェントはすべてのクリックを処理し、フォームに自動的に記入する機能を持つという。
2つ目のタイプのAIエージェントはWeb中心型で、公共データの収集、旅行日程表の作成、航空券の予約など、Webベースのタスクを実行するように設計されている。
これは、OpenAIがChatGPTを”仕事用の超スマートなパーソナルアシスタント”にする計画を進めているという以前の噂と一致している。
この高度なAIアシスタントは、個々の従業員やその職場について深い知識を持ち、従業員のスタイルに合わせて電子メールや文書を作成したり、最新のビジネスデータを取り入れたりといった個人的な支援タスクを実行することができる。
高度なAIアシスタントが単体でリリースされるのか、より包括的なソフトウェア・スイートの一部として販売されるのかは不明だ。
汎用AIアシスタントへのステップか
OpenAIは最近、異なるGPTの機能を組み合わせる機能を導入した。この機能は、ChatGPTをパーソナライズされた個別の汎用アシスタントにするというOpenAIの目標に向けた一歩である。次のステップは、基礎となるモデルが、どのGPTがどのリクエストに対応すべきかを自動的に学習することだろう。
最近発表されたアシスタントAPIも同様の方向性を持っている。OpenAIのCEOであるSam Altman氏によれば、アシスタントは本格的なAIエージェントへの第一歩であり、将来的には新たな機能を追加する予定だという。
AdeptやImbueのようなスタートアップも、Webブラウザの操作などができるAIエージェントに取り組んでいる。また、CES 2024で最も注目を集めているスタートアップのrabbitは、アクションに最適化された言語モデル(Large Action Model、LAM)に取り組んでおり、ユーザーの要求に応じてヒューマンインターフェース上でアクションを実行することができる。
Sources
コメントを残す