Amazonブラックフライデー開催中です。こちらから購入頂くと当サイトの運営の応援に繋がりますので、よろしければ是非!!

メタが非文字言語の音声翻訳技術を発表 – 福建語をそのまま英語に翻訳可能に

Meta(メタ)は、先日Grand Tetonプラットフォームを発表し、AI関連の進歩を続けていることを発表したが、開発中のAI Universal Speech Translator(UST)が最初のマイルストーンを達成したことを明らかにした。MetaのAI USTは、今回、台湾・シンガポール・マレーシアなどで用いられている福建語をリアルタイムで英語に翻訳することが可能になったとのことだ。

311154545 1374345473370803 8507488893608759630 n

機械学習による翻訳システムでは、通常、ラベル付けが可能な書き言葉と話し言葉の両方の豊富な用例を学習対象にする必要がある。だが、福建語は広く用いられているにもかかわらず、標準的な書き言葉がないそうだ。そのため、福建語をそのまま伝えることは難しく、これが世代を超えたコミュニケーションの壁にもなっているという。この問題を解決するために、Metaのブログでは、以下のように説明している。

我々は音声単位変換(S2UT)を使って、以前Metaが開拓した方法で入力音声を直接音響単位のシーケンスに変換しました。そして、そのユニットから波形を生成しました。さらに、UnitYは、第1パスのデコーダが関連言語(北京語)のテキストを生成し、第2パスのデコーダがユニットを生成する2パスデコードの仕組みに採用されました。

英語(または福建語)の音声をまず北京語のテキストに翻訳し、それを福建語(または英語)に翻訳して学習データに加えるという、疑似ラベルを構築するために中間言語として北京語を活用しました。

311137022 418025180496867 2952707825292098738 n

現在、福建語を話す人と英語を話す人が、たどたどしいながらも会話できるようになっているという。しかし、この技術はいずれ多くの言語に適用でき、リアルタイムで翻訳できるようになると確信しているとのことだ。

Meta社は、このプロジェクトから既にオープンソース化しているモデルとトレーニングデータに加え、「Taiwanese Across Taiwan」という福建語の音声コーパスに基づく世界初の音声翻訳ベンチマークシステム、および「LASER」というMeta社の革新的データマイニング技術でマイニングした大規模音声翻訳コーパス、スピーチマトリックスを公開すると発表している。このシステムにより、研究者は独自の音声翻訳(S2ST)システムを構築することができるようになる。

TEXALでは、テクノロジー、サイエンス、ゲーム、エンターテインメントなどからその日の話題のニュースや、噂、リーク情報、レビューなど、毎日配信しています。最新のニュースはホームページで確認出来ます。GoogleニュースTwitterFacebookでTEXALをフォローして、最新情報を入手する事も出来ます。記事の感想や、お問い合わせなども随時受け付けています。よろしくお願いいたします。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

TEXAL管理人。学校の授業でMS-DOSを使っていたくらいの年代。Windows95の登場で衝撃を受け、テクノロジー業界に興味を持つ。以来ガジェット・ゲーム情報を追い続けてうん十年。大学では物理を専攻していたこともあり、物理・宇宙関係の話題も大好き。

コメント

コメントする