あなたの好奇心を刺激する、テックと科学の総合ニュースサイト

GoogleのGemini、さらに強力な技術を披露するも、人間を超えるAIにはまだ遠く及ばず

2023年12月、GoogleはGeminiと名付けられた新しい大規模言語モデル(LLM)のローンチを発表した。Geminiは現在、Google製品の人工知能(AI)基盤を提供しており、OpenAIのGPT-4の直接のライバルでもある。

しかし、なぜGoogleはGeminiをこのように重要なマイルストーンとして考えているのだろうか?また、一般的に言えば、現在のAIの超高速な発展という文脈では何を意味するのだろうか?

あらゆるところにAIを

Googleは、検索、Gmail、YouTube、オフィス生産性スイートなどのサービスにおいて、現在の機能を強化し、新たな機能を生み出すことで、自社製品のほとんどを変革するGeminiに賭けている。これにより、同社の主要な収益源であるオンライン広告ビジネスや、限られた容量のハードウェアで動作するGeminiの縮小版によるAndroidスマートフォン向けソフトウェアの改善も可能になるだろう。

ユーザーにとってGeminiは、Googleのサービスを敬遠しにくくする新機能や能力向上を意味し、検索エンジンなどの分野ですでに支配的な地位を強化している。Googleのソフトウェアの大部分が簡単にアップグレード可能なクラウドサービスであることを考えると、Googleにとっての可能性とチャンスは相当なものだ。

しかし、ChatGPTの予想外の大成功は多くの注目を集め、OpenAIの信頼性を高めた。Geminiによって、Googleは世間一般にAIにおける主要プレーヤーとして復権することができるだろう。GoogleはAIの強豪であり、大規模で強力な研究チームを擁し、過去10年間の多くの大きな進歩の原点となっている。

教育、デザイン、医療などの分野において、これらの新技術がもたらす利益と破壊の両方について、社会的な議論が行われている。

AIの強化

Geminiの核心はTransformerネットワークにある。もともとはGoogleの研究チームが考案したもので、GPT-4など他のLLMにも同じ技術が使われている。

Geminiの特徴的な要素は、テキスト、音声、画像、動画といった異なるモダリティのデータを扱えることである。これにより、AIモデルは、画像の内容に関する質問に答えたり、ポッドキャストで議論されている特定のタイプのコンテンツについてキーワード検索を行ったりするなど、複数のモダリティにわたってタスクを実行する能力を備えている。

しかし、より重要なのは、モデルが異なるモダリティを扱うことができるということで、各モダリティに対して独立して訓練された個別のモデルと比較して、グローバルに優れたAIモデルを訓練することができる。実際、このようなマルチモーダル・モデルは、同じ概念の異なる視点にさらされるため、より強いと考えられる。

例えば、鳥という概念は、鳥の文字による説明、発声、画像、動画をミックスして学習することで、より理解しやすくなるかもしれない。このマルチモーダル・トランスフォーマー・モデルのアイデアは、Googleの以前の研究でも探求されており、Geminiはこのアプローチの最初の本格的な商用実装である。

birds image
AIは、鳥のテキスト説明、発声、画像、動画をミックスすることで、鳥の概念をよりよく理解することができるだろう。

このようなモデルは、汎用人工知能(AGI)としても知られる、より強力なジェネラリストAIモデルの方向への一歩と考えられている。

AGIのリスク

AIの進歩の速さを考えると、近い将来、超人的な能力を持つAGIが設計されるのではないかという期待が、研究コミュニティやより広く社会で議論を呼んでいる。

一方では、強力なAGIが悪意ある集団の手に渡れば、大惨事が起こる危険性を予想し、開発のスピードを落とすよう求める声もある。

また、そのような実用的なAGIにはまだ程遠く、現在のアプローチでは、訓練されたデータを模倣した浅い知能のモデリングしかできず、人間レベルの知能を実現するために必要な効果的な世界モデル(現実の詳細な理解)が欠けていると主張する者もいる。

human brain digital

その一方で、実存的なリスクに話を集中させることは、偏見を永続させ、不正確で誤解を招くようなコンテンツを作り出し、GoogleにGemini画像ジェネレーターの一時停止を促し、環境への影響を増大させビッグテックの支配を強めるなど、最近のAIの進歩がもたらすより直接的な影響から注意を逸らしている、という見方もできる。

これらの考慮事項の中間に、従うべき一線がある。私たちは、実用的なAGIの出現にはまだほど遠い。象徴的モデリングと推論のためのより強力な能力の導入など、さらなるブレークスルーが必要である。

その一方で、現代のAIが倫理的・社会的に与える重要な影響から目をそらしてはならない。これらの検討は重要であり、技術的、社会科学的背景を持つ多様な専門知識を持つ人々によって取り組まれるべきである。

とはいえ、短期的な脅威ではないとはいえ、超人的な能力を持つAIの実現は懸念事項である。この重要なマイルストーンに到達したとき、AGIの出現を責任を持って管理できるよう、私たちが一丸となって準備を整えることが重要である。


本記事は、Christian Gagné氏によって執筆され、The Conversationに掲載された記事「Google’s Gemini showcases more powerful technology, but we’re still not close to superhuman AI」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。

Follow Me !

\ この記事が気に入ったら是非フォローを! /

Share on:

関連コンテンツ

おすすめ記事

コメントする