GoogleのAI「Gemini」はリアルタイム情報分析によるテクノロジーの次なる飛躍をもたらす

The Conversation
投稿日 2023年12月13日 14:41
final keyword header.width 1600.format webp

Googleは、写真、テキスト、音声、音楽、コンピューターコードなど、ほとんどあらゆる種類のプロンプトを理解し、知的に話すことができる新しい人工知能(AI)システム、「Gemini」を発表した

このタイプのAIシステムは、マルチモーダルモデルとして知られている。これは、これまでのようにテキストや画像を扱うことができるだけでなく、さらに一歩進んだものだ。そして、AIが次に進むかもしれない方向、つまり、外界からもたらされるリアルタイムの情報を分析し、それに対応できるようになることを強く示唆している。

Geminiの能力は、入念に編集されたテキストと静止画のプロンプトから編集されたバイラル・ビデオで見たほど高度ではないかもしれないが、AIシステムが急速に進歩していることは明らかだ。より複雑な入出力を処理する能力に向かっているのだ。

新しい能力を開発するために、AIシステムはアクセスできる「トレーニング」データの種類に大きく依存する。写真の中の顔を認識したり、エッセイを書いたりするような推論を行うことを含め、AIはこのようなデータにさらされることで、その能力を向上させることができるのだ。

現時点では、Google、OpenAI、Metaなどの企業がモデルを学習させるデータは、主にインターネット上のデジタル化された情報から採取されたものだ。しかし、AIが扱うことができるデータの範囲を抜本的に拡大しようとする取り組みもある。例えば、常時接続のカメラやマイク、その他のセンサーを使用することで、世界で何が起きているのかをAIに知らせることが可能になる。

リアルタイムデータ

Googleの新しいGeminiシステムは、ライブ映像や人間のスピーチなど、リアルタイムのコンテンツを理解できることを示している。新しいデータとセンサーにより、AIは現実世界で起こる出来事を観察し、議論し、行動することができるようになる。

その最も明白な例が自動運転車で、すでに道路を走行する際に膨大な量のデータを収集している。この情報はメーカーのサーバーに蓄積され、車両を操作する瞬間だけでなく、より良い交通の流れをサポートしたり、当局が不審な行動や犯罪行為を特定するのに役立つ、運転状況の長期的なコンピューター・ベースのモデルを構築するために使用される。

家庭内では、人感センサー、音声アシスタント、防犯カメラなどがすでに使われており、私たちの行動を検知し、習慣を把握している。その他の “スマート”電化製品も続々と市場に登場している。エネルギー消費を改善するために暖房を最適化するなど、初期の用途は身近なものだが、習慣の把握はさらに進んでいくだろう。

つまり、AIは家庭内の活動を推測し、将来何が起こるかを予測することさえできるのだ。このデータは、例えば、医師が糖尿病や認知症などの病気の発症を早期に発見したり、生活習慣の改善を推奨したり、フォローアップしたりするのに利用できる。

現実世界に関するAIの知識がさらに包括的になれば、生活のあらゆる場面でAIが伴走者として機能するようになるだろう。食料品店では、計画している食事に最適で最も経済的な食材を相談できる。仕事場では、AIが直接会って顧客の名前や関心を思い出させてくれる。外国を旅行しているときは、AIが現地の観光名所について会話を続けながら、私が遭遇するかもしれない危険な状況に目を光らせてくれるだろう。

プライバシーへの影響

このような新しいデータには、非常に大きなプラスになる可能性がある一方で、行き過ぎたプライバシー侵害のリスクもある。これまで見てきたように、ユーザーはソーシャルメディアや検索エンジンなどの無料製品を利用する見返りとして、驚くほど多くの個人情報を喜んで取引してきた。

AIが日常生活のあらゆる場面で私たちを知り、サポートするようになるにつれ、将来的なトレードオフはさらに大きくなり、より危険なものになる可能性がある。

チャンスがあれば、この業界はデータ収集を生活のあらゆる側面(オフラインのものまで)に拡大し続けるだろう。政策立案者は、この新しい状況を理解し、メリットとリスクのバランスを取る必要がある。新しいAIモデルのパワーと普及だけでなく、それらが収集するコンテンツも監視する必要があるだろう。

AIが次のフロンティア(現実世界)へとその能力を拡大するとき、その可能性を制限するのは我々の想像力だけである。


本記事は、Lars Erik Holmquist氏によって執筆され、The Conversationに掲載された記事「Google’s Gemini AI hints at the next great leap for the technology: analysing real-time information」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。



この記事が面白かったら是非シェアをお願いします!


  • samsung foundry tenstorrent
    次の記事

    SamsungとASML、1,100億円を投じて韓国に先端半導体研究所を建設

    2023年12月13日 18:08
  • 前の記事

    Tesla、ヒューマノイド・ロボット「Optimus Gen 2」を披露

    2023年12月13日 14:14
    tesla optimus gen 2 delicate object manipulation

スポンサーリンク


この記事を書いた人
The Conversation

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事