“禁断の画像生成AI”と言われた「Stable Diffusion」が公開 – 実際の動作をご紹介

masapoco
投稿日 2022年8月23日 16:12
makoto shinkai

画像生成の際のフィルタリングがなく、著名人の画像やポルノ画像まで生成できてしまう“禁断の画像生成AI”、「Stable Diffusion」がついに一般向けに公開された。

生成された画像はCreative ML OpenRAIL-Mライセンスの下、商用での利用も許可されている。

上記のページにアクセスすると、中央に生成したい画像について入力するテキスト入力欄があるだけのシンプルなページが表示される。

このテキスト入力欄に英語で生成したい画像について入力するのだが、手っ取り早く試したい場合は、下にサンプルテキストがあるのでクリックしてみよう。試しに、「A pikachu fine dining with a view to the Eiffel Tower」というサンプルをクリックすると、以下のような結果が表示される。

なお、出力される画像のサイズは512×512ピクセルで固定だ。

処理は、自身のデバイスの性能に依存するため、それによって処理時間も変わるようだ。記事作成時点ではNVIDIAチップでの動作が推奨されているが、AMDやApple M1/M2、およびその他のチップセットでの動作にも最適化するようアップデートを予定しているとのこと。

試しに「Rats eating curry rice, portrait」(カレーライスを食べるネズミ。ポートレート)と入力。普通に擬人化されずにカレーライスに群がる野ねずみと言った感じに。

「日本の屋台でラーメンを食べるトム・クルーズの写真。Canon EOS 5D Mark4にSIGMA Art Lens 35mm F1.4で撮影」と入れてみた。あまり屋台っぽくはないが、俳優トム・クルーズの顔がしっかりと描かれている。ただ、麺のようなもので顔を拭いていたり、潰れたコップ?を持ってガッツポーズしてるのが謎すぎる。

「新海誠による男の子と女の子が高層ビルの屋上から雲海を見下ろしている画像」と入力したもの。そもそも女の子が写っていなかったり、ビルの屋上感が全くないが、新海誠監督の雰囲気が感じられる1枚も。

「Taylor Swiftがチワワを抱きながら口紅を塗っている写真」ここら辺はまだまだ学習が必要なのかなと言うレベルで崩れてしまっており、妖怪のようにも見える。ただ、人物そのものは、その人だと認識できるレベルだ。

「宮崎駿氏と庵野秀明氏がビールを飲みながら肩を組んで笑っている写真」髪の毛の色以外は全く似ていない。日本人は苦手なようだ。

もし待ち時間が気になる様ならば、無料の場合回数制限はあるが、サーバーに処理を任せられる以下のサービスもある。

こちらは、アカウント登録すると2.00ポンド(約324円)の無料枠が与えられ、無料枠の範囲ならば課金なしで画像の生成が出来る。画像のサイズや枚数、生成のための処理回数などの指定も可能で、設定によって画像生成に必要な費用が変化する。お試しで使ってみるならばオススメだ。

また、モバイルアプリでは、Lightricksの「Photoleap」が、このStable Diffusionが公開しているオープンソースコードを活用して、同様の機能を提供している。スマホで気軽に試せるため、オススメだ。

総じて、著名人に変わった行動をさせた写真を描くのはまだまだ難しい様子。風景画などならかなり良い精度で描いてくれる印象だ。

ただ、鍛えられて精度が上がり素晴らしい画像を生成できるようになるのが楽しみでもある。よろしければ是非この機会に試してみてはいかがだろうか。



この記事が面白かったら是非シェアをお願いします!


  • 06d8a7c076df3b090cf777525e61e9a65174f410 scaled 1
    次の記事

    PS5用の新コントローラー「DualSense Edge(デュアルセンス・エッジ)」が発表

    2022年8月24日 6:34
  • 前の記事

    ニューヨーク・セントラルパークタワーの80億円のペントハウスの内部が公開

    2022年8月23日 14:34
    CPT PH1

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事