あなたの好奇心を刺激する、テックと科学の総合ニュースサイト

Stability AI、コーディング補助アシスタント「StableCode」をオープンソースで発表

AIスタートアップの「Stability AI」は、画像生成AI「Stable Diffusion」で知られているが、同社は画像生成にのみ取り組んでいるのではなく、先日はChatGPTのようなAIチャットボットを実現する、大規模言語モデル「FreeWilly」を発表しており、その展開を広げている。

本日、同社は新たな取り組みの1つである「StableCode」を発表し、コード生成分野にも参入する。

Stability AIによると、StableCodeは3つのモデルに基づいている。

基本モデルは、Eleuther社のGPT-NeoXをベースに構築され、30億パラメータを持ち、BigCodeのスタック・データセット(v1.2)から多数のプログラミング言語で事前に訓練され、その後、Python、Go、Java、Javascript、C、Markdown、C++などのプログラミング言語を追加して拡張され、合計5,600億トークンのコードをHPCクラスタで学習した。

この基本モデルの上に命令モデルが構築され、Alpaca形式を用いて「複雑なプログラミングタスクを解く」ための具体的な応用例を用いて改良された。Stability AIは、合計12万組の命令とその解を使用した。

同じようなパラメータ数とトークン数でトレーニングされた他のモデルとのHumanEvalベンチマーク比較は以下の通りとなる。

image28529
HumanEvalベンチマーク 同規模モデルとの比較(3B)。

4Kのコンテキスト・ウィンドウを持つ標準モデルに加えて、StableCodeには16Kのバリエーションも存在する。より大きなコンテキスト・ウィンドウは、タスクを解決するために一度に多くのコードを表示することを可能にし、より良いコードを生成する可能性がある。

stable code alpha demo
Pytorchディープラーニングライブラリを利用した比較的複雑なPythonファイルを完成させるStableCode。グレーのテキストはStableCodeの予測表示 (Credit: Stability AI)

Stability AIによると、16Kモデルは、最大5つの中型Pythonファイルに相当するコードを一度に表示または編集できる。どちらのモデルも、1行または複数行のコードを生成し、完成させることができる。

「あらゆる背景を持つ人々が、AIを使って日常的な問題を解決し、生活を向上させるためのコードを作成できるようになる日は近い」と、Stability AIのCEOであるEmad Mostaque氏はまた、StableCodeの “非常に興味深いバリエーション”の登場も予告している。

SD XL画像モデルのバージョン1.0に加え、Stability AIは4月に初のオープンソース言語モデルStableLMと、MetaのLlama v2をベースに合成データセットで改良した言語モデルFreeWillyをリリースした。これらはオリジナルのモデルやGPT-3.5(ChatGPT)の性能と同等か、ある程度上回っている。

時を同じくして、Googleもコード生成機能を備えたAIベースの統合開発環境(IDE)である、Project IDXを発表しており、ソフトウェア開発分野でのAI競争も活況を呈しそうだ。

StableCodeは、Apacheライセンス、バージョン2.0のオープンソースソフトウェアとして公開される。


Source

Follow Me !

この記事が気に入ったら是非フォローを!

Share!!

スポンサーリンク

おすすめ記事

執筆者
Photo of author

masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

記事一覧を見る

コメントする

CAPTCHA