Amazon、生成AIによりAlexaを大幅に強化、より自然な会話や会話翻訳機能を実現へ

masapoco
投稿日 2023年9月21日 6:02
amazon echo

Amazonは本日、毎年恒例のプレスイベントを開催し、多くの新しいハードウェア・デバイスを披露した。同社はまた、このイベントにおいて、Amazon独自の生成AI機能の開発計画についても語った。

Amazonは、デジタルアシスタントAlexaと組み合わせるための新しい大規模言語モデル(LLM)を開発していることを明らかにした。この新たなAlexa LLMの導入により、「自然な会話」「直感的なスマートホームコントロール」「視線による制御」「会話翻訳」「Alexa緊急アシスト」が利用可能になる。この新たなAlexaは、まずは米国居住者向けのAmazonのすべてのEchoデバイスで、まもなくプレビュー版として利用可能になる予定だ。

Amazonは次のように述べている:

私たちの最新モデルは、リアルタイム情報へのアクセス、スマートホームの効率的なコントロール、ホームエンターテインメントの最大活用など、私たちがお客様が大好きだと知っている音声と事柄のために特別に最適化されています。

新しいAlexaが目指す物は、「人間と会話するのと同じくらい自然に対話が出来る事」という事で、実際に以下のでも動画にあるように、Amazonの新しい音声認識技術は、あなたの自然な間やためらいを調整し、より自由な会話を提供してくれる。

これを実現するのが、Amazonの新たなLLMであり、音声対話のためにカスタムビルドされ、特に最適化されているとのことだ。Amazonは以下のように説明する:

まず音声認識を使って顧客の音声要求をテキストに変換し、次にLLMを使ってテキストの応答やアクションを生成し、音声合成で音声を返すのではなく、この新しいモデルはこれらのタスクを統合し、より豊かな会話体験を生み出します。

その他、Alexa LLMにより、複数のスマートホームリクエストを同時に処理できるようになる。例えば「Alexa、ブラインドをすべて閉めて、リビング ルームの照明を除くすべての照明を消して」と言った複雑な指示や、「ここは明るすぎる」という曖昧な指示に対してもそれを理解して適切な対応をしてくれるとのことだ。

また、アクセシビリティ関連の機能も追加される。移動障害や発話障害のあるユーザーが視線によってAlexaを制御する事が出来る様な改良が行われる。これにより、音声やタッチ操作の代わりに、視線をタブレットに向けることで音楽やショーの再生、自宅環境のコントロール、大切な人とのコミュニケーションなど、あらかじめ設定されたAlexaのアクションを、手や声を使わずに実行することができるとのことだ。

加えて、Alexaの音声通話やビデオ通話をリアルタイムで翻訳する機能も搭載される。通話参加者は言語を超えたコミュニケーションをより効果的に行うことができ、加えて耳の不自由なユーザーも文字起こし機能によって遠隔コミュニケーションをこれまでよりも簡単に取ることが出来るようになるとのことだ。

この機能は、2023年後半に、米国、カナダ、メキシコ、英国、ドイツ、フランス、イタリア、スペインのEcho ShowおよびAlexaモバイルアプリのユーザー向けに、英語、スペイン語、フランス語、ドイツ語、ポルトガル語を含む10言語以上で提供されるという。

2024年、Amazonはサードパーティの開発者が新しいLLMにアクセスし、Alexaで新しい体験を創造できるようにする。そうした企業の中には、すでに新しい生成AI機能の開発に取り組んでいるところもある。Amazonはこう述べている:

私たちはBMWグループと協力して、会話型の車載音声アシスタント機能を開発しています。この機能は、車の機能に関する素早いハウツー指示や回答を含め、車と対話し、車を知るための自然な方法を提供します。

他の企業も、AlexaのAIを他のことに利用する方法に取り組んでいる。例えば、曲を作ったり、AIベースのキャラクターと自然な会話をしたりするようなことが実現するだろう。


Sources



この記事が面白かったら是非シェアをお願いします!


  • echo hub hero
    次の記事

    Amazon、新たなスマートホームハブ「Echo Hub」を発表

    2023年9月21日 6:21
  • 前の記事

    CERNの実験が磁気モノポールの発見に繋がるかも知れない

    2023年9月20日 16:10
    Comparison Monopoles Dipole

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事