GoogleのGemini、さらに強力な技術を披露するも、人間を超えるAIにはまだ遠く及ばず | TEXAL

GoogleのGemini、さらに強力な技術を披露するも、人間を超えるAIにはまだ遠く及ばず

masapoco

投稿日 2024年3月7日 11:11

テクノロジー

final keyword header.width 1600.format webp

本記事は広告およびアフィリエイトプログラムによる収益を得ています。

2023年12月、GoogleはGeminiと名付けられた新しい大規模言語モデル（LLM）のローンチを発表した。Geminiは現在、Google製品の人工知能（AI）基盤を提供しており、OpenAIのGPT-4の直接のライバルでもある。

しかし、なぜGoogleはGeminiをこのように重要なマイルストーンとして考えているのだろうか？また、一般的に言えば、現在のAIの超高速な発展という文脈では何を意味するのだろうか？

あらゆるところにAIを

Googleは、検索、Gmail、YouTube、オフィス生産性スイートなどのサービスにおいて、現在の機能を強化し、新たな機能を生み出すことで、自社製品のほとんどを変革するGeminiに賭けている。これにより、同社の主要な収益源であるオンライン広告ビジネスや、限られた容量のハードウェアで動作するGeminiの縮小版によるAndroidスマートフォン向けソフトウェアの改善も可能になるだろう。

ユーザーにとってGeminiは、Googleのサービスを敬遠しにくくする新機能や能力向上を意味し、検索エンジンなどの分野ですでに支配的な地位を強化している。Googleのソフトウェアの大部分が簡単にアップグレード可能なクラウドサービスであることを考えると、Googleにとっての可能性とチャンスは相当なものだ。

しかし、ChatGPTの予想外の大成功は多くの注目を集め、OpenAIの信頼性を高めた。Geminiによって、Googleは世間一般にAIにおける主要プレーヤーとして復権することができるだろう。GoogleはAIの強豪であり、大規模で強力な研究チームを擁し、過去10年間の多くの大きな進歩の原点となっている。

教育、デザイン、医療などの分野において、これらの新技術がもたらす利益と破壊の両方について、社会的な議論が行われている。

AIの強化

Geminiの核心はTransformerネットワークにある。もともとはGoogleの研究チームが考案したもので、GPT-4など他のLLMにも同じ技術が使われている。

Geminiの特徴的な要素は、テキスト、音声、画像、動画といった異なるモダリティのデータを扱えることである。これにより、AIモデルは、画像の内容に関する質問に答えたり、ポッドキャストで議論されている特定のタイプのコンテンツについてキーワード検索を行ったりするなど、複数のモダリティにわたってタスクを実行する能力を備えている。

しかし、より重要なのは、モデルが異なるモダリティを扱うことができるということで、各モダリティに対して独立して訓練された個別のモデルと比較して、グローバルに優れたAIモデルを訓練することができる。実際、このようなマルチモーダル・モデルは、同じ概念の異なる視点にさらされるため、より強いと考えられる。

例えば、鳥という概念は、鳥の文字による説明、発声、画像、動画をミックスして学習することで、より理解しやすくなるかもしれない。このマルチモーダル・トランスフォーマー・モデルのアイデアは、Googleの以前の研究でも探求されており、Geminiはこのアプローチの最初の本格的な商用実装である。

このようなモデルは、汎用人工知能（AGI）としても知られる、より強力なジェネラリストAIモデルの方向への一歩と考えられている。

AGIのリスク

AIの進歩の速さを考えると、近い将来、超人的な能力を持つAGIが設計されるのではないかという期待が、研究コミュニティやより広く社会で議論を呼んでいる。

一方では、強力なAGIが悪意ある集団の手に渡れば、大惨事が起こる危険性を予想し、開発のスピードを落とすよう求める声もある。

また、そのような実用的なAGIにはまだ程遠く、現在のアプローチでは、訓練されたデータを模倣した浅い知能のモデリングしかできず、人間レベルの知能を実現するために必要な効果的な世界モデル（現実の詳細な理解）が欠けていると主張する者もいる。

その一方で、実存的なリスクに話を集中させることは、偏見を永続させ、不正確で誤解を招くようなコンテンツを作り出し、GoogleにGemini画像ジェネレーターの一時停止を促し、環境への影響を増大させ、ビッグテックの支配を強めるなど、最近のAIの進歩がもたらすより直接的な影響から注意を逸らしている、という見方もできる。

これらの考慮事項の中間に、従うべき一線がある。私たちは、実用的なAGIの出現にはまだほど遠い。象徴的モデリングと推論のためのより強力な能力の導入など、さらなるブレークスルーが必要である。

その一方で、現代のAIが倫理的・社会的に与える重要な影響から目をそらしてはならない。これらの検討は重要であり、技術的、社会科学的背景を持つ多様な専門知識を持つ人々によって取り組まれるべきである。

とはいえ、短期的な脅威ではないとはいえ、超人的な能力を持つAIの実現は懸念事項である。この重要なマイルストーンに到達したとき、AGIの出現を責任を持って管理できるよう、私たちが一丸となって準備を整えることが重要である。

本記事は、Christian Gagné氏によって執筆され、The Conversationに掲載された記事「Google’s Gemini showcases more powerful technology, but we’re still not close to superhuman AI」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。

AI, Gemini, Google, 大規模言語モデル, 生成AI

この記事が面白かったら是非シェアをお願いします！

次の記事
GoogleからAI関連の機密情報を盗み出したとして中国人の元エンジニアが逮捕
2024年3月7日 12:22

前の記事
ジェイムズ・ウェッブ宇宙望遠鏡、宇宙の年齢がわずか4億3,000万年前の時代に驚くほど活発な銀河を発見
2024年3月7日 10:12

スポンサーリンク

この記事を書いた人

masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

コメントを残すコメントをキャンセル

おすすめ記事

今読まれている記事