著名人を使った画像やポルノまで生成できてしまう禁断の画像生成AI「Stable Diffusion」がベータテスター募集中

masapoco
投稿日
2022年8月13日 11:31
boris johnson with axe in american psycho movie n 9 g S 1703699608 ts 1660325223 idx 0

数日前に「文章から神絵を作り出すAI」としてTwitterで話題になった、自動画像生成AI「Midjourney」や、Elon Musk氏率いる人工知能企業Open AIが作り出した、自動画像生成AI「DALL-E2」など、テキストから画像を作り出すAIの人気が高まってきているが、その列に新たなAIが加わり、近日中にベータテストを行うと告知している。それが、Stability.AIが開発した、「Stable Diffusion」だ。

DALL-E 2」や「Midjourney」は、素晴らしい機能を誇るが、しかし、実は生成できる物にはある程度制限がある。それは、著名人や有害とみなされるコンテンツを描いた画像を生成できないようになっているのだ。

今回、英国のスタートアップ企業 Stability.AI が発表した「Stable Diffusion」にはそういったフィルターがないとのことだ。つまり、基本的にどんな画像でも生成できてしまう

Stability.AIは、「Stable Diffusion」について、数週間後の一般公開に先立ち、まずは1,000人強の研究者に公開すると発表した。

「Stable Diffusionは、研究者とすぐに一般のユーザー両方が、様々な条件の下でこれを実行し、画像生成を民主化することができます。我々は、潜在空間の境界を真に探索するために、これとさらなるモデルの周りに出現するオープンなエコシステムを楽しみにしています。」と、Stability AI CEO兼創設者のEmad Mostaqueは、ブログで述べている。

とはいえ、有名人の偽画像を作ることは、既にディープフェイクが問題になっていることからも、倫理的に大きな問題になる可能性もある。また、システムが出力する制限のないコンテンツを自由に利用できるようになると、ポルノや生々しい暴力など、悪質な業者に加担する結果にもなりかねないだろう。

Stable DiffusionがMidjourneyやDALL-E2と異なるのは、クラウドで画像生成処理を行うだけではなく、ユーザー自身のデバイスでも動作させられるようだ。この場合、スペックとしては、5GB程度のVRAMを搭載したグラフィックカードで動作するとのこと。これは、いわゆる“ミドルレンジ”のグラフィックカードとなり、NVIDIAのGTX 1660のような、一昔前の物でも大丈夫だ。また、AppleのM1チップを搭載したMacBookにも互換性を持たせる作業が進められている。ただし後者の場合、GPUアクセラレーションなしでは、画像生成に数分もかかってしまうだろう。

Stability.AIは、同社が「ベンチマーク」と呼ぶモデルを、商用・非商用を問わずあらゆる目的に使用できる寛容なライセンスで公開し、モデルを訓練するためのマシンパワーも提供する予定だという。

最終的に、Stability.AIは、顧客のために「プライベート」モデルを訓練し、一般的なインフラ層として機能することで収益を上げることを考えているようだ。同社は、オーディオ、音楽、そしてビデオを生成するためのAIモデルなど、商業化可能な他のプロジェクトが進行中であるとしている。

さらに、今後はStable Diffusionでカスタムメイドで微調整されたモデルを作成するための、ツールもリリースされる予定だという。しかしこれもまた物議を醸し出す可能性がある。別のAIであるが、Viceによると、CuteBlackと名乗るある美大生は、擬人化された動物のアニメキャラに関するポルノイラストを生成するために、ネット上から獣アニメキャラの画像をスクレイピングして、イメージジェネレーター「Disco Diffusion」を訓練し、ポルノ画像の生成に成功したという。同様のことは、恐らくStable Diffusionでも可能になると思われる。可能性は、ポルノにとどまらず、理論的には、悪意のある行為者が、例えば暴動や血みどろの画像、あるいはプロパガンダの画像にStable Diffusionを微調整することが可能になるだろう。

Mostaque氏は、このツールが悪質なユーザーによって「本当に厄介なもの」を作り出すために使われる可能性があることを認めているが、同氏は、ツールを自由に利用できるようにすることで、コミュニティが対策を練ることができると主張している。

「私たちは、独立系と学術系の両方のグローバルなオープンソースAIを調整し、私たちの集団の可能性を最大限に引き出すために不可欠なインフラ、モデル、ツールを構築する触媒となることを望んでいます。これは人類をより良く変えることができる素晴らしい技術であり、すべての人のためのオープンインフラであるべきです。」”とMostaque氏は述べている。

「何割かの人は単に不愉快で変な人ですが、それが人間性です。実際、この技術は普及すると考えており、多くのAI愛好家の父権的でやや見下した態度は、社会を信頼していない点で見当違いです・・・私たちは、リリースと自社サービス全体で潜在的な害を軽減するための最先端のツールを策定するなど重要な安全策を講じています。このモデルで何十万人もの人が開発しているので、正味の利益は非常にポジティブで、何十億人もの人がこの技術を使うことで、害は否定されると確信しています。」


Source



この記事が面白かったら是非シェアをお願いします!


  • SEI 118571788
    次の記事

    深海の海綿(スポンジ)生物がくしゃみをするメカニズムが明らかに

    2022年8月13日 14:02
  • 前の記事

    DJIの新型FPVドローン「Avata」の公式イメージと思われる物が大量リーク。発売間近か?

    2022年8月13日 10:03
    Newly leaked DJI Avata cinewhoop drone 0106 1000x687.jpg

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事