Amazonは、同社の音声アシスタントAlexaに、短い録音だけで死者や生者を問わず、誰の声でもディープフェイクできるようにする機能を追加しようとしているようだ。同社は水曜日にラスベガスで開催されたre:Mars 2022カンファレンスでこの機能について明らかにしている。
発表は、Amazon Alexaチームの上級副社長兼ヘッドサイエンティストであるRohit Prasad氏によって行われた。
デモ映像では、子供がAlexaに話しかける映像が流れた。「おばあちゃんはオズの魔法使いを読み終えてくれる?」と彼女が話しかけると、Alexaは「OK」と言った後、その子の祖母の声で話すようになった。
実際のデモは以下の映像からご覧頂ける。
Prasad氏は、この新たな機能について「現在取り組んでいる」とだけ述べるのみで、これが今後実装されるのか、その時期がいつなのかは語らなかった。
だが、この機能の優れた点として、「スタジオでの長々とした録音作業」が不要になる点を挙げている。Amazonは「1分未満のごく短い時間の録音データから、高品質の音声を生成する方法」を作り上げたとのことだ。
「それを実現させたのは、問題を音声生成のタスクではなく、音声変換のタスクとして設定したことです。」とPrasad氏は述べている。
こういったAIによる音声の模倣である「ディープフェイクテクノロジー」に対しては、一定の利用価値があるとして、取り入れられ、一般的になりつつある。
実際に、映画やテレビなどの一部の業界では、こういった実在の人物の声を人工的に再現するオーディオディープフェイクは徐々に使われるようになって来ている。
例えば、多くの音声録音ソフトには、録音した音声を個別にクローン化する機能が備えられている。これにより、ポッドキャストの録音でセリフを間違えた場合でも、後で編集時に新しいスクリプトを入力するだけでそのセリフを編集することができるようになっているのだ。
日本でも、ヤマハが故・美空ひばりの声を再現したことがあった。技術的には大きな挑戦で、その完成度には賞賛の声もあったが、「故人への冒涜」であるという意見も多く聞かれた。
Alexaの新たなこの機能の開発の背景には、間違いなく“善意”があったのだろう。それは、Prasad氏が発表にあたって述べた、「AIは愛する人を失う痛みをなくすことはできないが、思い出を長続きさせることは間違いなくできる」との言葉に集約されている。
新型コロナウイルスのパンデミックによって始まった感情的な苦痛に対して、無数の人々が人間の「共感と影響」を真剣に求めているのは事実だ。しかし、AmazonのAI音声アシスタントは、そうした人間の欲求を満たすものにはならないだろう。
懐かしい人の声を聞くことが大きな慰めになる可能性もあるが、それがParasad氏が述べている「永続的な人間関係を可能にする」ことに繋がるとは到底思えない。そういった意味でAmazonのこの売り込み方は少々「お節介」な気もする。
だが、技術的な側面は別だろう。このデモが実際に亡くなった人の声を模倣する形で行われたことから、倫理的な問題などが取り沙汰され、また死者を再現したことで「不気味さ」が誇張される結果になってしまっているが、1分の録音データからその人の声を模倣し再現できる出来ると言う、これまでとは全く別次元のレベルの技術が開発されたということは賞賛に値する。願わくば、その方向が正しい方に向いていることを願うばかりだ。
コメントを残す