Alphabetは、決算報告の中で、同社の次世代AIモデル「Gemini」は、Googleが2024年に市場投入を計画している次世代AIモデルの第一弾に過ぎないとのことで、今後多くの次世代AIモデルを相次いで投入するようだ。
マルチモーダルAIモデル「Gemini」で、Googleは少なくともOpenAIのGPT-4に追いつきたいと考えている。このモデルは今年後半にリリースされる予定だ。先日の四半期決算説明会で、Alphabet CEOのSundar Pichai氏は、Googleは「モデルの準備を進めている」と述べた。
Geminiは異なるサイズと異なる機能でリリースされ、すぐにすべての社内製品に使用されるとPichai氏は述べた。そのため、GeminiはGoogleの現在の言語モデルPaLM-2に取って代わることになりそうだ。開発者とクラウドの顧客は、Vertex AIを通じてアクセスできるようになる。
最も重要なことは、Googleが「2024年を通して発表する次世代モデルの基礎固め」をしているということだ。
「イノベーションのペースは、見ていて非常に印象的です。私たちは、マルチモーダル、非常に効率的なツールやAPI統合、さらに重要なこととして、将来のイノベーションも可能にするプラットフォームを一から構築しています」とPichai氏は語った。
画像とテキストのプロンプトでプロトタイプアプリを作成
開発者のBedros Pamboukian氏は、Geminiが搭載される可能性が高い、「Stubbs」と呼ばれるGoogleの新しいAIツールについて報告している。Pamboukian氏は、StubbsがGoogleの最も重要なリリースになるかもしれないと考えている。
Stubbsは、テキスト記述または画像(またはその両方を組み合わせたもの)からプロトタイプを生成し、Figmaのプロトタイプのように公開・共有することで、アプリやAIモデルのプロトタイプを簡単に作成できるように設計されている。Pamboukian氏は、コード・スニペットから正確な機能を特定することはまだできないが、推定されるユーザー・インターフェースの最初のスクリーンショットを示している。
Pamboukian氏は研究中に、Geminiの亜種と思われる「マルチモーダルIT M」と呼ばれるAIモデルにも出会った。このモデルはテキストだけでなく、画像を処理したり、画像の字幕を書いたりすることもできる。これらの機能はGoogle BardやGPT-4Vでも提供されている。
Sources
- Alphabet: 2023 Q3 Earnings Call
- Medium: Gemini is coming to Makersuite & so are Stubbs
コメントを残す