Googleは、BardのGemini Proサポートと共に、Bardによるテキストからの画像生成機能を追加したが、それと同時に、よりクリエイティブな画像生成体験のための新たなツール「ImageFX」もリリースしている。
ImageFXはImagen 2によって実行されるスタンドアローンのAI画像生成ツールだ。Alphabet(Google)のAI研究部門であるGoogle DeepMindは、既存のMusicFXとTextFXの改良とともにImageFXを公開した。
ImageFXは、Imagen 2によって画像生成を行っている。このGoogle DeepMindの最新の画像生成モデルは、改善されたプロンプト理解と高品質な画像生成を提供し、“典型的な画像生成AIの欠点を克服した”とされている。
ImageFXは他のAI画像生成ツールと同様に、テキストプロンプトを入力して画像を生成することができるが、それのみならず、「表現力豊かなチップ」を導入することで、アイデアを膨らませ、他のバリエーションを素早く探ることができる点が特徴だ。
同社のブログ記事では、最新の画像生成モデルについて次のように説明している:
ImageFXはLabsの新しいツールで、簡単なテキストプロンプトで画像を作成することができます。Labsの初期の実験では、生成AIツールの新しいユーザーにとって、創造的な探求がいかに重要であるかが浮き彫りになりました。人々は、さまざまなプロンプトやコンセプトを繰り返しテストすることで、新しいアイデアを発見することがよくあります。さらなる創造性を刺激するために、ImageFXには、あなたの創造とアイデアの隣接する次元を素早く試すことができる「表現力豊かなチップ」を特徴とするプロンプト・インターフェイスが含まれています。
ImageFXで生成された画像は、DeepMindが開発したSynthID(画像のピクセルに直接追加されるデジタル透かし)によってマークされ、IPTCメタデータが含まれるため、AIが生成した画像に関する詳細な情報が表示される。
そしてGoogleは、敵対的テスト、安全フィルターや技術的ガードレールの追加、データ安全トレーニングへの投資を通じて、不適切なコンテンツが生成されるのを制限するための安全プロトコルを講じているとの免責事項を提示した。Googleは以下のように説明している:
さらに、ImageFXを使用して生成されたすべての画像にはIPTCメタデータが含まれており、AIが生成した画像に遭遇するたびに、より多くの情報を得ることができます。私たちは、私たちのモデルの安全性とプライバシー保護を向上させるために、これらの技術やその他の技術に投資し続けます。
新たなImageFXに加え、Googleは既存のツールである、昨年リリースしたMusicFXの改良点についても発表した。このAIツールを使えば、ユーザーは70秒までの曲や音楽ループを作成したり、曲をダウンロードして他の人と共有したりできるようになった。
同社は、より高品質なオーディオと、より高速な音楽生成に取り組んでおり、音楽生成に役立つ表現力豊かなチップを使ったプロンプトをユーザーにテストさせている。これらのアップデートを使用して生成された音楽サンプルは、以前のものよりも3倍優遇されているという。
そしてGoogleは、TextFXのアップデートについても詳しく説明した。TextFXは昨年、作家や作詞家などのための実験的な生成AIツールとして導入された。今回、AIモデル内でのユーザーエクスペリエンスとナビゲーションが強化された。
これらのAIツールは、現在、米国、ニュージーランド、ケニア、オーストラリアで利用可能となっている。
Source
- Google The Keyword: Try ImageFX and MusicFX, our newest generative AI tools in Labs
コメントを残す