現在、この地球上では7,000以上の言語が話されているが、Metaはそのすべてを理解したいと考えている。半年前、同社は野心的なNo Language Left Behind(NLLB)プロジェクトを立ち上げ、最初に英語を介することなく多数の言語間でシームレスに翻訳するためにAIを訓練している。7月6日(現地時間)、同社は「NLLB-200」と名付けられた最初の大きな成功を発表した。これは、ラオス語やカンバ語など、アジアやアフリカのあまり広く使われていない言語を含む、200の言語で話すことができるAIモデルだ。
- Meta : No Language Left Behind: Scaling Human-Centered Machine Translation
- Meta : New AI Model Translates 200 Languages, Making Technology Accessible to More People
- New Scientist : Meta’s AI can translate between 204 languages, including rare ones
- The Verge : Meta open sources early-stage AI translation tool that works across 200 languages
同社が水曜日に発表したブログ記事によると、NLLB-200はアフリカの55言語を「高品質の結果」で翻訳することができるという。Metaは、FLORES-101ベンチマークにおけるこのモデルの性能が、既存の最先端モデルを平均で44%上回り、アフリカとインドの特定の方言では70%もの差をつけたことを報告している。
2つの言語間の翻訳、特にどちらも英語でない場合の翻訳は、AI言語モデルにとって大きな課題であることが証明されている。これは、これらの翻訳システムの多くが、インターネットから収集した文書データに依存して学習していることが一因となっている。この文章を話すことができれば、翻訳するのはとても簡単だが、ファン語やキクユ語で質の高いコンテンツを探している場合は、もっと難しくなるだろう。
Meta社は、公に推進する他のAIプログラムの多くと同様に、NLLB-200のオープンソース化を決定するとともに、この技術の実世界での応用を開発する非営利団体に20万ドルの助成金を提供することにしている。例えば、FacebookのニュースフィードやInstagramのようなアプリケーションだ。「お気に入りのFacebookグループを訪れたとき、イボ語やルガンダ語の投稿に出会い、ボタンをクリックするだけでそれを母国語で理解できることを想像してみてください」と、Metaの投稿では仮説が立てられている。Meta社のデモサイトでは、この新モデルがどのように機能するかを知ることができる。
コメントを残す