著名人を使った画像やポルノまで生成できてしまう禁断の画像生成AI「Stable Diffusion」がベータテスター募集中

数日前に「文章から神絵を作り出すAI」としてTwitterで話題になった、自動画像生成AI「Midjourney」や、Elon Musk氏率いる人工知能企業Open AIが作り出した、自動画像生成AI「DALL-E2」など、テキストから画像を作り出すAIの人気が高まってきているが、その列に新たなAIが加わり、近日中にベータテストを行うと告知している。それが、Stability.AIが開発した、「Stable Diffusion」だ。

「DALL-E 2」や「Midjourney」は、素晴らしい機能を誇るが、しかし、実は生成できる物にはある程度制限がある。それは、著名人や有害とみなされるコンテンツを描いた画像を生成できないようになっているのだ。

今回、英国のスタートアップ企業 Stability.AI が発表した「Stable Diffusion」にはそういったフィルターがないとのことだ。つまり、基本的にどんな画像でも生成できてしまう。

Stability.AIは、「Stable Diffusion」について、数週間後の一般公開に先立ち、まずは1,000人強の研究者に公開すると発表した。

「Stable Diffusionは、研究者とすぐに一般のユーザー両方が、様々な条件の下でこれを実行し、画像生成を民主化することができます。我々は、潜在空間の境界を真に探索するために、これとさらなるモデルの周りに出現するオープンなエコシステムを楽しみにしています。」と、Stability AI CEO兼創設者のEmad Mostaqueは、ブログで述べている。

とはいえ、有名人の偽画像を作ることは、既にディープフェイクが問題になっていることからも、倫理的に大きな問題になる可能性もある。また、システムが出力する制限のないコンテンツを自由に利用できるようになると、ポルノや生々しい暴力など、悪質な業者に加担する結果にもなりかねないだろう。

“Boy with the …”.#StableDiffusion #AIart

Oh brave new world with such creations in it.#sorrynotsorry pic.twitter.com/gpLQUJkp1T
— Emad acc/acc (@EMostaque) July 27, 2022

Stable DiffusionがMidjourneyやDALL-E2と異なるのは、クラウドで画像生成処理を行うだけではなく、ユーザー自身のデバイスでも動作させられるようだ。この場合、スペックとしては、5GB程度のVRAMを搭載したグラフィックカードで動作するとのこと。これは、いわゆる“ミドルレンジ”のグラフィックカードとなり、NVIDIAのGTX 1660のような、一昔前の物でも大丈夫だ。また、AppleのM1チップを搭載したMacBookにも互換性を持たせる作業が進められている。ただし後者の場合、GPUアクセラレーションなしでは、画像生成に数分もかかってしまうだろう。

Stability.AIは、同社が「ベンチマーク」と呼ぶモデルを、商用・非商用を問わずあらゆる目的に使用できる寛容なライセンスで公開し、モデルを訓練するためのマシンパワーも提供する予定だという。

最終的に、Stability.AIは、顧客のために「プライベート」モデルを訓練し、一般的なインフラ層として機能することで収益を上げることを考えているようだ。同社は、オーディオ、音楽、そしてビデオを生成するためのAIモデルなど、商業化可能な他のプロジェクトが進行中であるとしている。

さらに、今後はStable Diffusionでカスタムメイドで微調整されたモデルを作成するための、ツールもリリースされる予定だという。しかしこれもまた物議を醸し出す可能性がある。別のAIであるが、Viceによると、CuteBlackと名乗るある美大生は、擬人化された動物のアニメキャラに関するポルノイラストを生成するために、ネット上から獣アニメキャラの画像をスクレイピングして、イメージジェネレーター「Disco Diffusion」を訓練し、ポルノ画像の生成に成功したという。同様のことは、恐らくStable Diffusionでも可能になると思われる。可能性は、ポルノにとどまらず、理論的には、悪意のある行為者が、例えば暴動や血みどろの画像、あるいはプロパガンダの画像にStable Diffusionを微調整することが可能になるだろう。

Mostaque氏は、このツールが悪質なユーザーによって「本当に厄介なもの」を作り出すために使われる可能性があることを認めているが、同氏は、ツールを自由に利用できるようにすることで、コミュニティが対策を練ることができると主張している。

「私たちは、独立系と学術系の両方のグローバルなオープンソースAIを調整し、私たちの集団の可能性を最大限に引き出すために不可欠なインフラ、モデル、ツールを構築する触媒となることを望んでいます。これは人類をより良く変えることができる素晴らしい技術であり、すべての人のためのオープンインフラであるべきです。」”とMostaque氏は述べている。

「何割かの人は単に不愉快で変な人ですが、それが人間性です。実際、この技術は普及すると考えており、多くのAI愛好家の父権的でやや見下した態度は、社会を信頼していない点で見当違いです・・・私たちは、リリースと自社サービス全体で潜在的な害を軽減するための最先端のツールを策定するなど重要な安全策を講じています。このモデルで何十万人もの人が開発しているので、正味の利益は非常にポジティブで、何十億人もの人がこの技術を使うことで、害は否定されると確信しています。」

Source

Stability.AI : Stable Diffusion launch announcement
TechCrunch : This startup is setting a DALL-E 2-like AI free, consequences be damned
Create Digital Music : Stable Diffusion, the slick generative AI tool, just launched and went live on GitHub

著名人を使った画像やポルノまで生成できてしまう禁断の画像生成AI「Stable Diffusion」がベータテスター募集中

深海の海綿（スポンジ）生物がくしゃみをするメカニズムが明らかに

DJIの新型FPVドローン「Avata」の公式イメージと思われる物が大量リーク。発売間近か？

コメントを残すコメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

著名人を使った画像やポルノまで生成できてしまう禁断の画像生成AI「Stable Diffusion」がベータテスター募集中

深海の海綿（スポンジ）生物がくしゃみをするメカニズムが明らかに

DJIの新型FPVドローン「Avata」の公式イメージと思われる物が大量リーク。発売間近か？

コメントを残す コメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

コメントを残すコメントをキャンセル