Google、2024年に多くの「次世代AIモデル」シリーズのリリースを計画

スポンサー広告

Alphabetは、決算報告の中で、同社の次世代AIモデル「Gemini」は、Googleが2024年に市場投入を計画している次世代AIモデルの第一弾に過ぎないとのことで、今後多くの次世代AIモデルを相次いで投入するようだ。

マルチモーダルAIモデル「Gemini」で、Googleは少なくともOpenAIのGPT-4に追いつきたいと考えている。このモデルは今年後半にリリースされる予定だ。先日の四半期決算説明会で、Alphabet CEOのSundar Pichai氏は、Googleは「モデルの準備を進めている」と述べた。

Geminiは異なるサイズと異なる機能でリリースされ、すぐにすべての社内製品に使用されるとPichai氏は述べた。そのため、GeminiはGoogleの現在の言語モデルPaLM-2に取って代わることになりそうだ。開発者とクラウドの顧客は、Vertex AIを通じてアクセスできるようになる。

最も重要なことは、Googleが「2024年を通して発表する次世代モデルの基礎固め」をしているということだ。

「イノベーションのペースは、見ていて非常に印象的です。私たちは、マルチモーダル、非常に効率的なツールやAPI統合、さらに重要なこととして、将来のイノベーションも可能にするプラットフォームを一から構築しています」とPichai氏は語った。

画像とテキストのプロンプトでプロトタイプアプリを作成

開発者のBedros Pamboukian氏は、Geminiが搭載される可能性が高い、「Stubbs」と呼ばれるGoogleの新しいAIツールについて報告している。Pamboukian氏は、StubbsがGoogleの最も重要なリリースになるかもしれないと考えている。

Stubbsは、テキスト記述または画像(またはその両方を組み合わせたもの)からプロトタイプを生成し、Figmaのプロトタイプのように公開・共有することで、アプリやAIモデルのプロトタイプを簡単に作成できるように設計されている。Pamboukian氏は、コード・スニペットから正確な機能を特定することはまだできないが、推定されるユーザー・インターフェースの最初のスクリーンショットを示している。

Pamboukian氏は研究中に、Geminiの亜種と思われる「マルチモーダルIT M」と呼ばれるAIモデルにも出会った。このモデルはテキストだけでなく、画像を処理したり、画像の字幕を書いたりすることもできる。これらの機能はGoogle BardやGPT-4Vでも提供されている。


Sources

面白かったらぜひシェアを!
masapoco
masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

記事本文: 6315

返信を残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です