Microsoftは、開発中のBing AIチャットボットに画像生成機能の搭載を発表した。Bingプレビューユーザーは、英語で「create an image」(または同様のもの)と入力した後にプロンプトを入力することで、画像を生成出来る。他のAI画像生成機能と同様に、プロンプトを詳細に入力すればするほど、より具体的で一貫性のある出力が得られる。
Microsoftはこの機能を段階的に展開しているため、すべてのBingプレビューユーザーがすぐに画像を生成できるわけではないようだ。この機能は現在、チャットボットの「独創性」モードでのみ機能する。ボットには「独創性」「バランス」「厳密」の3つの「性格」が設定されており、「独創性」は最も間違った回答や不正確な情報を与えやすいとされている。今後、他のモードでの画像生成も行う予定のようだ。
Microsoftは、今回の画像生成機能の搭載にあたり、OpenAIのDALL・Eジェネレータの「高度なバージョン」を使用していると述べているが、それ以上の詳細は提供していない。Bingチャットボットは、正式に公開される数週間前からOpenAIのGPT-4モデルを使用していたため、Microsoftもより強力なプレリリースバージョンのDALL・Eモデル(DALL・E 3?)を使用している可能性があるかもしれない。Microsoftが10月に公開した画像生成ツールは、DALL・E 2.0を使用していた。
Microsoftは、Bingチャットボットが生成できるテキストに関する初期の問題を考慮し、DALL・EのためにOpenAI独自の組み込み制限に加え、追加のコンテンツ生成セーフガードを導入している。Microsoft VP Yusuf Mehdi氏は、本日の発表において次のように述べている。
“私たちのシステムは、プロンプトによって潜在的に有害な画像が生成される可能性があることを検出すると、プロンプトをブロックしてユーザーに警告します。また、Image Creatorの画像がAIによって生成されていることを明確にし、画像がImage Creatorを使って作成されたことを示すために、各画像の左下隅に修正したBingアイコンを入れています”
Microsoftは、すべての製品にもっと多くのAI機能を搭載するよう、この1年ずっと推進してきた。もともと「新しいBing」は2月上旬にデビューし、Microsoftはその直後にEdgeブラウザとWindows 11タスクバーにBingチャットの統合を追加した。先週には、Microsoft Officeアプリを使って文書、電子メール、メモ、プレゼンテーションを生成するためのAIツール「Copilot」を発表した。同社はOpenAIと複数年、数十億ドルのパートナーシップを結んでおり、これらのプロジェクトのすべてを可能にしている。
この新しいImage Creatorと同時に、Microsoftは、Bingのストーリーズとナレッジカード 2.0の機能を全ユーザーに提供する。ストーリーズは画像や短い動画で情報の断片を提供し、Bingの最新のAIを搭載したナレッジカードは重要な情報を強調する。
Bingチャットボットの全機能にアクセスするには、Bingチャットプレビューへの参加が必要で、現在はまだ招待制だが、登録すればすぐに使えるようになっているようだ。
Source
コメントを残す