Google、次世代AIモデル「Gemini」の外部テストを開始、一般公開が近付く

Googleの次期マルチモーダルAIモデル「Gemini」は、OpenAIのGPT-4を打ち負かす事を目指しており、今秋にもその姿を現すと噂されているが、既にごく一部の企業に向けて外部テストが行われているようだ。

The Informationが、この件に直接関わっているとされる3人の匿名の情報筋から得た情報によると、Googleはごく少数の厳選した企業グループに対し、Geminiの限定チャット版へのアクセス権を与えたとのことだ。Geminiのフルバージョンはまだ内部で開発中である。

外部顧客との最初のテストは、Geminiのローンチが近づいていることを示すものかもしれない。既に先日、The Informationは同じく匿名の内部情報を引用し、今秋のローンチを伝えている。

Geminiはクラウドアクセスを通じて企業に提供され、Googleの消費者向け製品に統合される。Googleは、Bardのチャットボットからワークスペースの新しいAI機能まで、すべてのAIアプリケーションにGeminiを使用する予定だ。

また同社は、Vertex AIサービスを通じて、Googleはさまざまなサイズのモデルを提供する計画とも伝えられている。コストとパフォーマンスを天秤にかけ、顧客はより適切なモデルを選択する事が出来る。

Googleの持つ膨大なユーザーデータが大きな利点

あるテスターによると、大きな利点は、GoogleがWebからの公開情報に加えて、Google検索などの自社製品からのデータを処理できることだという。その結果、GeminiはGPT-4よりもユーザーの意図を理解できるようになるかもしれない。また、不正解が少なくなる可能性もあるという。

Geminiのコード生成は、GoogleがMicrosoftのGitHub Copilotと競合することを期待しているほど優れていると言われている。グラフの分析やデータの解釈、音声コマンドを使ったブラウザなどコンピューター上でのアクションの実行といった機能も検討されている。

また、The Informationによると、Geminiは「大規模言語モデルのセット」で、チャットボット、テキストの要約、コード、新しいテキストの生成など、さまざまなタスクを実行できる。Geminiが、OpenAIのGPT-4アーキテクチャのように、ネットワーク化されたエキスパートモデルに依存するかどうかは不明である。

Geminiは5月に正式に発表された。初期の噂では、モデルは少なくとも1兆個のパラメーターを持つとされている。トレーニングには、GoogleのTPU AIチップが数万個使われる見込みだ。

Geminiのリード・マネージャーであるDemis Hassabis氏は6月下旬、GeminiはAlphaGoシステムの長所と大規模モデルの言語能力を組み合わせたものだと語っている。

Sources