数日前に「文章から神絵を作り出すAI」としてTwitterで話題になった、自動画像生成AI「Midjourney」や、Elon Musk氏率いる人工知能企業Open AIが作り出した、自動画像生成AI「DALL-E2」など、テキストから画像を作り出すAIの人気が高まってきているが、その列に新たなAIが加わり、近日中にベータテストを行うと告知している。それが、Stability.AIが開発した、「Stable Diffusion」だ。
「DALL-E 2」や「Midjourney」は、素晴らしい機能を誇るが、しかし、実は生成できる物にはある程度制限がある。それは、著名人や有害とみなされるコンテンツを描いた画像を生成できないようになっているのだ。
今回、英国のスタートアップ企業 Stability.AI が発表した「Stable Diffusion」にはそういったフィルターがないとのことだ。つまり、基本的にどんな画像でも生成できてしまう。
Stability.AIは、「Stable Diffusion」について、数週間後の一般公開に先立ち、まずは1,000人強の研究者に公開すると発表した。
「Stable Diffusionは、研究者とすぐに一般のユーザー両方が、様々な条件の下でこれを実行し、画像生成を民主化することができます。我々は、潜在空間の境界を真に探索するために、これとさらなるモデルの周りに出現するオープンなエコシステムを楽しみにしています。」と、Stability AI CEO兼創設者のEmad Mostaqueは、ブログで述べている。
とはいえ、有名人の偽画像を作ることは、既にディープフェイクが問題になっていることからも、倫理的に大きな問題になる可能性もある。また、システムが出力する制限のないコンテンツを自由に利用できるようになると、ポルノや生々しい暴力など、悪質な業者に加担する結果にもなりかねないだろう。
Stable DiffusionがMidjourneyやDALL-E2と異なるのは、クラウドで画像生成処理を行うだけではなく、ユーザー自身のデバイスでも動作させられるようだ。この場合、スペックとしては、5GB程度のVRAMを搭載したグラフィックカードで動作するとのこと。これは、いわゆる“ミドルレンジ”のグラフィックカードとなり、NVIDIAのGTX 1660のような、一昔前の物でも大丈夫だ。また、AppleのM1チップを搭載したMacBookにも互換性を持たせる作業が進められている。ただし後者の場合、GPUアクセラレーションなしでは、画像生成に数分もかかってしまうだろう。
Stability.AIは、同社が「ベンチマーク」と呼ぶモデルを、商用・非商用を問わずあらゆる目的に使用できる寛容なライセンスで公開し、モデルを訓練するためのマシンパワーも提供する予定だという。
最終的に、Stability.AIは、顧客のために「プライベート」モデルを訓練し、一般的なインフラ層として機能することで収益を上げることを考えているようだ。同社は、オーディオ、音楽、そしてビデオを生成するためのAIモデルなど、商業化可能な他のプロジェクトが進行中であるとしている。
さらに、今後はStable Diffusionでカスタムメイドで微調整されたモデルを作成するための、ツールもリリースされる予定だという。しかしこれもまた物議を醸し出す可能性がある。別のAIであるが、Viceによると、CuteBlackと名乗るある美大生は、擬人化された動物のアニメキャラに関するポルノイラストを生成するために、ネット上から獣アニメキャラの画像をスクレイピングして、イメージジェネレーター「Disco Diffusion」を訓練し、ポルノ画像の生成に成功したという。同様のことは、恐らくStable Diffusionでも可能になると思われる。可能性は、ポルノにとどまらず、理論的には、悪意のある行為者が、例えば暴動や血みどろの画像、あるいはプロパガンダの画像にStable Diffusionを微調整することが可能になるだろう。
Mostaque氏は、このツールが悪質なユーザーによって「本当に厄介なもの」を作り出すために使われる可能性があることを認めているが、同氏は、ツールを自由に利用できるようにすることで、コミュニティが対策を練ることができると主張している。
「私たちは、独立系と学術系の両方のグローバルなオープンソースAIを調整し、私たちの集団の可能性を最大限に引き出すために不可欠なインフラ、モデル、ツールを構築する触媒となることを望んでいます。これは人類をより良く変えることができる素晴らしい技術であり、すべての人のためのオープンインフラであるべきです。」”とMostaque氏は述べている。
「何割かの人は単に不愉快で変な人ですが、それが人間性です。実際、この技術は普及すると考えており、多くのAI愛好家の父権的でやや見下した態度は、社会を信頼していない点で見当違いです・・・私たちは、リリースと自社サービス全体で潜在的な害を軽減するための最先端のツールを策定するなど重要な安全策を講じています。このモデルで何十万人もの人が開発しているので、正味の利益は非常にポジティブで、何十億人もの人がこの技術を使うことで、害は否定されると確信しています。」
Source
- Stability.AI : Stable Diffusion launch announcement
- TechCrunch : This startup is setting a DALL-E 2-like AI free, consequences be damned
- Create Digital Music : Stable Diffusion, the slick generative AI tool, just launched and went live on GitHub
コメントを残す