メタが非文字言語の音声翻訳技術を発表 – 福建語をそのまま英語に翻訳可能に

masapoco
投稿日
2022年10月20日 9:06
Meta realtime hokkien

Meta(メタ)は、先日Grand Tetonプラットフォームを発表し、AI関連の進歩を続けていることを発表したが、開発中のAI Universal Speech Translator(UST)が最初のマイルストーンを達成したことを明らかにした。MetaのAI USTは、今回、台湾・シンガポール・マレーシアなどで用いられている福建語をリアルタイムで英語に翻訳することが可能になったとのことだ。

機械学習による翻訳システムでは、通常、ラベル付けが可能な書き言葉と話し言葉の両方の豊富な用例を学習対象にする必要がある。だが、福建語は広く用いられているにもかかわらず、標準的な書き言葉がないそうだ。そのため、福建語をそのまま伝えることは難しく、これが世代を超えたコミュニケーションの壁にもなっているという。この問題を解決するために、Metaのブログでは、以下のように説明している。

我々は音声単位変換(S2UT)を使って、以前Metaが開拓した方法で入力音声を直接音響単位のシーケンスに変換しました。そして、そのユニットから波形を生成しました。さらに、UnitYは、第1パスのデコーダが関連言語(北京語)のテキストを生成し、第2パスのデコーダがユニットを生成する2パスデコードの仕組みに採用されました。

英語(または福建語)の音声をまず北京語のテキストに翻訳し、それを福建語(または英語)に翻訳して学習データに加えるという、疑似ラベルを構築するために中間言語として北京語を活用しました。

現在、福建語を話す人と英語を話す人が、たどたどしいながらも会話できるようになっているという。しかし、この技術はいずれ多くの言語に適用でき、リアルタイムで翻訳できるようになると確信しているとのことだ。

Meta社は、このプロジェクトから既にオープンソース化しているモデルとトレーニングデータに加え、「Taiwanese Across Taiwan」という福建語の音声コーパスに基づく世界初の音声翻訳ベンチマークシステム、および「LASER」というMeta社の革新的データマイニング技術でマイニングした大規模音声翻訳コーパス、スピーチマトリックスを公開すると発表している。このシステムにより、研究者は独自の音声翻訳(S2ST)システムを構築することができるようになる。



この記事が面白かったら是非シェアをお願いします!


  • stsci 01gfnn3pwjmy4rqxkz585bc4qh 985x1200 1
    次の記事

    ジェイムズ・ウェッブ宇宙望遠鏡が写し出す「創造の柱」の見事な画像が公開

    2022年10月20日 10:08
  • 前の記事

    Netflixが2023年初頭からアカウントを使い回しているユーザーから料金を徴収する事を発表

    2022年10月19日 18:42
    netflix dark image
この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事