AmazonのAWS re:Inventカンファレンスは、これまでの生成AIの歴史をそのままなぞるかのような数々の発表が続く。大規模言語モデルに基づく独自のAIチャットボット「Amazon Q」と別に、Amazonは独自のテキストから画像を生成するAIモデル「Titan Image Generator」を発表し、OpenAIの取り組みに対抗する姿勢を鮮明にしている。
Titan Image Generatorは、「リアルでスタジオ品質の画像」を生成することができ、有害性や偏見に対するガードレールを内蔵しているとのことだ。Titan Image Creatorは単独のアプリやウェブサイトではなく、開発者が自分の画像生成ツールを構築するためのツールであり、使用するにはAmazon Bedrockへのアクセスが必要となる。
Amazonによると、Titan Image Generatorは「多様なデータセット」を使用してトレーニングされ、「幅広いドメイン」にわたっているという。ただし、これらのデータセットがどこから来たのか、また、Titan Image Generatorのトレーニングに使用された画像の作成者から許可を得たのか、または報酬を支払っているのかについては、同社は明らかにしていない。
AWSのデータベース、アナリティクス、マシンラーニング担当副社長であるSwami Sivasubramanian氏は、基調講演でTitan Image Generatorをプレビューし、自然言語のプロンプトから画像を生成するだけでなく、背景を変更する能力がある事も示した。これは、OpenAIのDALL-Eのような既存の画像生成ツールに加えて、Adobe Fireflyよりの機能であり、より企業向けの顧客を対象としている事を示唆するものだろう。
Titan Image Generatorで作成された画像には、デフォルトで「改ざん防止」の目に見えない透かしマークが付けられるという。これは、AI生成の偽情報や虐待画像の拡散を緩和する試みだ。Amazonがどのような透かしマーク技術を使用しているのか、またAmazon自身のAPI以外のどのツールがそれを検出できるのかは明らかではない。
透かしを入れること、またはAI生成のコンテンツとして識別することは、Biden政権のAIに関する行政命令の重要な部分である。これに対応して、MicrosoftやAdobeなどの企業は、Content Provenance and Authenticity Coalition(C2PA)によって開発されたコンテンツクレデンシャルシステムを採用している。
Sources
コメントを残す