絵の“外側”を生成して描き足してくれる新たな機能「Outpainting」がDALL・Eに実装

masapoco
投稿日 2022年9月6日 11:52
girl with a pearl earring

Open AIが開発を進めている、AI画像ジェネレーター「DALL・E」は、元の画像を解析し、「その画像の“外側”がこうなっているのではないか」と想像して描き足す機能「Outpainting」を実装した。

DALL・Eでは、すでに「Inpainting」と呼ばれる、生成またはアップロードされた画像内を変更する機能が提供されていた。今回実装された「Outpainting」では、元画像を拡張し、任意のアスペクト比の大判画像を作成することが可能となっている。

上の例では、ヨハネス・フェルメールの肖像画「真珠の耳飾りの少女」の枠外にあるものを、人間の指示によってDALL・Eが「想像」している様子を見ることができる。。肖像画から得られる限られた情報でも、影、反射、テクスチャなど、画像に存在する視覚的な要素を考慮し、フェルメールのタッチを再現していることは注目に値するだろう。

ちなみに、この画像はデータをDALL・Eに入れれば勝手に描いてくれると言うわけではなく、人間が少しずつ指示を与えて完成させたものだ。下のタイムラプスでは、担当したアーティスト、August Kampが、思い通りの結果を得るために、画像を少しずつ拡大し、DALL・Eに何度もやり直しを指示した様子が見て取れる。この映像では分からないが、これはシステムが勝手に拡張を生成しているわけではなく、都度「テキストにて」人間が指示を与えることで完成させている。

ネット上では早速この機能を使って、各々その想像力を膨らませ、面白い作品が公開されている。

https://twitter.com/spetznatz/status/1565450257944612864?s=20&t=jvd77P1BGvKcFUgrgL-cIg

多くのテキスト画像合成AIモデルは、Outpaintingの様な機能を実装することは可能だろう。ただし、実際に使ってみるとお分かりなように、MidjourneyやStable Diffusionなど、ユーザビリティの面ではまだまだ改善の余地があるのが現状だ。

DALL・EによるOutpaintingは、テキストから画像への変換を行うAIシステムの基本機能を拡張するものではないが、ユーザビリティを訴求することで、今後拡大するAIシステム市場において、OpenAIがどのように位置づけられるかを示すことが出来るだろう。



この記事が面白かったら是非シェアをお願いします!


  • Fb5QtDPXEAEPaWJ
    次の記事

    Apple Watch Proは果たして“買い”か?

    2022年9月6日 16:17
  • 前の記事

    Intelのグラフィックスカード「Arc A770」は「間もなく」発売されるようだ

    2022年9月6日 10:33
    intel arc pro

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事