画像生成の際のフィルタリングがなく、著名人の画像やポルノ画像まで生成できてしまう“禁断の画像生成AI”、「Stable Diffusion」がついに一般向けに公開された。
生成された画像はCreative ML OpenRAIL-Mライセンスの下、商用での利用も許可されている。
上記のページにアクセスすると、中央に生成したい画像について入力するテキスト入力欄があるだけのシンプルなページが表示される。
このテキスト入力欄に英語で生成したい画像について入力するのだが、手っ取り早く試したい場合は、下にサンプルテキストがあるのでクリックしてみよう。試しに、「A pikachu fine dining with a view to the Eiffel Tower」というサンプルをクリックすると、以下のような結果が表示される。
なお、出力される画像のサイズは512×512ピクセルで固定だ。
処理は、自身のデバイスの性能に依存するため、それによって処理時間も変わるようだ。記事作成時点ではNVIDIAチップでの動作が推奨されているが、AMDやApple M1/M2、およびその他のチップセットでの動作にも最適化するようアップデートを予定しているとのこと。
試しに「Rats eating curry rice, portrait」(カレーライスを食べるネズミ。ポートレート)と入力。普通に擬人化されずにカレーライスに群がる野ねずみと言った感じに。
「日本の屋台でラーメンを食べるトム・クルーズの写真。Canon EOS 5D Mark4にSIGMA Art Lens 35mm F1.4で撮影」と入れてみた。あまり屋台っぽくはないが、俳優トム・クルーズの顔がしっかりと描かれている。ただ、麺のようなもので顔を拭いていたり、潰れたコップ?を持ってガッツポーズしてるのが謎すぎる。
「新海誠による男の子と女の子が高層ビルの屋上から雲海を見下ろしている画像」と入力したもの。そもそも女の子が写っていなかったり、ビルの屋上感が全くないが、新海誠監督の雰囲気が感じられる1枚も。
「Taylor Swiftがチワワを抱きながら口紅を塗っている写真」ここら辺はまだまだ学習が必要なのかなと言うレベルで崩れてしまっており、妖怪のようにも見える。ただ、人物そのものは、その人だと認識できるレベルだ。
「宮崎駿氏と庵野秀明氏がビールを飲みながら肩を組んで笑っている写真」髪の毛の色以外は全く似ていない。日本人は苦手なようだ。
もし待ち時間が気になる様ならば、無料の場合回数制限はあるが、サーバーに処理を任せられる以下のサービスもある。
こちらは、アカウント登録すると2.00ポンド(約324円)の無料枠が与えられ、無料枠の範囲ならば課金なしで画像の生成が出来る。画像のサイズや枚数、生成のための処理回数などの指定も可能で、設定によって画像生成に必要な費用が変化する。お試しで使ってみるならばオススメだ。
また、モバイルアプリでは、Lightricksの「Photoleap」が、このStable Diffusionが公開しているオープンソースコードを活用して、同様の機能を提供している。スマホで気軽に試せるため、オススメだ。
総じて、著名人に変わった行動をさせた写真を描くのはまだまだ難しい様子。風景画などならかなり良い精度で描いてくれる印象だ。
ただ、鍛えられて精度が上がり素晴らしい画像を生成できるようになるのが楽しみでもある。よろしければ是非この機会に試してみてはいかがだろうか。
コメントを残す