AIが今後奪うであろう職種の筆頭に、まさかソフトウェアエンジニアが挙げられるとは数年前には想像もしなかっただろう。だがそれがついに現実になりそうだ。Cognition Labsは、世界初のAIソフトウェア開発者である「Devin」を発表した。
Devinは、1,000ステップのタスクを自律的に計画し、ソフトウェアプロジェクト全体の構築とデプロイを一人で行うことができ、OpenAIのGPT-4よりも7倍優れたバグ調査と修正能力を有し、問題を解決するために独自のカスタムAIを訓練し、配備する事が可能だという。
Cognition Labsは、論理的思考を中心とした応用AIに特化した企業である。同社の目標は、人々をサポートし、彼らのアイデアを現実にすることだ。
Cognitionが発表したDevinは、現状この分野で最高のAIと考えられる。DevinはGithubプラットフォーム上のSWEベンチマークで13.86%の問題を自力で解決することに成功したという。比較として、これまでの最高のスコアは処理すべきファイルを正確に指定したClaude 2の4.8%であり、GPT-4ですら1.74%だった事からも、これら最先端モデルを大幅に上回っていることが分かる。ベンチマークテストの結果も重要だが、これまでの大規模言語モデルと異なるのは別の面にある。
GPT-4やAnthropicのClaudeのようなこれまでのLLMも、コードを書いて実行することができた。だが、Devinは、人間からの干渉や支援を受けず、それ自体が単体でソフトウェアチーム全体のように行動するように設計されている。あなたが望むものを伝えると、プロジェクト管理とビジネス分析を行い、計画を考案し、要件を構築する。そして、小さなAIのミニオンを作り、サンドボックス化された端末、コードエディター、ブラウザーの間を行き来しながら、特定のステップを実行させる。そして、アプリケーション全体の完成度を評価するまで、テスト、デバッグ、反復を行い、あなたのためにデプロイする。
必要であれば、何千もの意思決定ポイントを含む可能性のあるこのプロセス全体を完全に自律的に行い、最終的な成果物を見て変更を依頼するだけでいい。また、経験豊富なプログラマーは、このツールを共同作業者として扱い、意思決定や設計により深く関与することもできるし、コーディングやテストのための助手、あるいはドキュメンテーションのスペシャリストのチームとして使うこともできる。
Devinの特徴として際立っているのは、独自の配下となるAIを作成し、訓練する能力だ。下のビデオでは、DevinシステムはMetaの70億パラメータを持つオープンソースのLlama言語モデルのバージョンをクローンし、Readmeファイルをチェックしてセットアップ方法を学び、それを実行する。そしてトレーニングを開始し、数時間以内にタスク専用の新しいAIモデルをクローン化してトレーニングしている。
AIが自作のAIエージェントを産み出し、訓練する。これは非常に強力なアイデアであり、次世代の自律型プログラマーには絶対に必要なことだろう。ただ、AIが反乱を起こすと懸念を持っている人にとっては、分身を作り出し効率的に仕事をこなしていく様は不愉快にも映るかも知れない。
だが、こうした流れはもう止められないだろう。先日ドバイで開催された世界政府サミットで、子どもたちは最早コードを学ぶべきでないと語ったNVIDIAのJensen Huagn氏の言葉もあるが、コーダーの役割はこれからは監督者になっていき、それすらもいつかはAIに置き換えられるかも知れない。
Devinは現在早期アクセス中であり、Cognition Labsは潜在的な顧客に対し、直接連絡を取るよう求めている。
Source
- Cognition Labs: Introducing Devin, the first AI software engineer
- DevinAI
コメントを残す