Open AIが開発を進めている、AI画像ジェネレーター「DALL・E」は、元の画像を解析し、「その画像の“外側”がこうなっているのではないか」と想像して描き足す機能「Outpainting」を実装した。
DALL・Eでは、すでに「Inpainting」と呼ばれる、生成またはアップロードされた画像内を変更する機能が提供されていた。今回実装された「Outpainting」では、元画像を拡張し、任意のアスペクト比の大判画像を作成することが可能となっている。
上の例では、ヨハネス・フェルメールの肖像画「真珠の耳飾りの少女」の枠外にあるものを、人間の指示によってDALL・Eが「想像」している様子を見ることができる。。肖像画から得られる限られた情報でも、影、反射、テクスチャなど、画像に存在する視覚的な要素を考慮し、フェルメールのタッチを再現していることは注目に値するだろう。
ちなみに、この画像はデータをDALL・Eに入れれば勝手に描いてくれると言うわけではなく、人間が少しずつ指示を与えて完成させたものだ。下のタイムラプスでは、担当したアーティスト、August Kampが、思い通りの結果を得るために、画像を少しずつ拡大し、DALL・Eに何度もやり直しを指示した様子が見て取れる。この映像では分からないが、これはシステムが勝手に拡張を生成しているわけではなく、都度「テキストにて」人間が指示を与えることで完成させている。
ネット上では早速この機能を使って、各々その想像力を膨らませ、面白い作品が公開されている。
多くのテキスト画像合成AIモデルは、Outpaintingの様な機能を実装することは可能だろう。ただし、実際に使ってみるとお分かりなように、MidjourneyやStable Diffusionなど、ユーザビリティの面ではまだまだ改善の余地があるのが現状だ。
DALL・EによるOutpaintingは、テキストから画像への変換を行うAIシステムの基本機能を拡張するものではないが、ユーザビリティを訴求することで、今後拡大するAIシステム市場において、OpenAIがどのように位置づけられるかを示すことが出来るだろう。
コメントを残す