AIは賞を取るような芸術を生み出すことができるが、それでも人間の創造性には勝てない

創造性とは本来、人間が持つものだと考えられている。しかし、人工知能（AI）も創造性を発揮できる段階まで来ている。

最近行われたあるコンテストでは、「Midjourney」と呼ばれるAIモデルによって作られた作品が賞を獲得し、アーティストたちの怒りを買った。そして、「Stable Diffusion」と呼ばれる同様のモデルがリリースされたおかげで、このようなソフトウェアが自由に使えるようになったのだ。

「Stop AI Stealing the Show」のようなクリエイティブな実務家の組合は、以前からクリエイティブな分野でのAIの使用について懸念を示してきた。しかし、実際にAIは人間のアーティストに取って代わることができるのだろうか？

これらの新しいAIモデルは、無限の可能性を生み出すことができる。上記のロボットの画像は、それぞれユニークでありながら、類似したユーザーのリクエストからStable Diffusionによって生成されたものだ。

このAIアーティストを使うには、短い文章でプロンプトを書くか、プロンプトと一緒に画像を提供してより多くのガイダンスを与えるかの2つの方法がある。私は、14文字のプロンプトから、フルーツを配達する架空の会社のロゴ案をいくつか生成することができた。しかも、私のミドルレンジノートPCを使い、20分弱で。

上の結果からわかるように、Stable Diffusionは、言葉を含むアートを作るのに苦労しているようだ。しかも、ちょっとファンキーな例もある。

しかし、AIやグラフィックデザイナーの力を借りなければ、これほどのものは作れなかった。ロボットの絵も、自分では描けなかった。

Stable Diffusionを手がけるスタートアップ、Stability AIは、10億米ドル（1400億円）の投資評価を目標としている。しかし、これらのAIモデルは、賞を受賞したMidjourneyの写真に見られるように、実世界に影響を与え始めている。実際、AIが本当に優れているのは、異なる要素やスタイルを組み合わせたファインアートの作品を制作することだ。

だが、AIがほとんどの作業を代行してくれるとはいえ、これらのモデルを使いこなすには、やはりスキルが必要だ。時には、プロンプトが思い通りの画像を生成してくれないこともある。また、AIは他のツールと一緒に使われることもあり、より大きなパイプラインの一部を構成するに過ぎない。

また、ファインアートの制作とデジタルデザインの制作は別物だ。Stable Diffusionは、ロゴよりも風景を描くのに向いている。

Stable Diffusionがゲームチェンジャーである理由

AIモデルは通常、58億5,000万枚という驚異的な画像を含むデータセットを使ってアートを作成するように訓練される。この膨大な量のデータは、AIが画像の内容や芸術的なコンセプトを学習するために必要だ。そして、その処理には非常に長い時間がかかる。

Stable Diffusionの場合、15万時間（17年強）の処理時間を要した。しかし、大規模なコンピュートクラスタ（1つのデバイスとして機能する強力なコンピュータの集合体）で並列に学習することで、これを実時間で1カ月未満に短縮することができるのだ。

また、Stability AIは、DreamStudioというオンラインツールを提供しており、画像1枚あたり約0.01米ドルのコストでそのAIモデルを利用することができる。これに対し、競合のOpenAIのアートモデル「DALL･E 2」を使うには、その10倍以上のコストがかかる。

どちらの手法も、既存の画像をたくさん見て新しい画像を作ることを学習する拡散モデルのコンピュータープログラムとして知られる、同じ基礎的なアプローチを使用している。しかし、Stable Diffusionの方が計算コストが低いため、学習に必要な時間が短く、エネルギー消費量も少なくなる。

また、OpenAIのモデルを実際に自分でダウンロードして動かすことはできず、Webサイトを通じてやりとりするのみだ。一方、Stable Diffusionはオープンソースのプロジェクトであり、誰でも自由に使うことができる。そのため、モデルの改良、ユーザーガイド、他のツールとの統合など、オンラインコーディングコミュニティによる迅速な開発の恩恵を受けている。2022年8月のStable Diffusionのリリース後、数週間ですでにこのようなことが起こっている。

アートの未来は？

この5年間で大幅な改善がなされたとはいえ、AIアートモデルが苦手とすることはまだある。作品に登場する言葉は、認識できるものの、ちんぷんかんぷんなことが多い。同様に、AIは人間の手のレンダリングに苦労している。

また、これらのモデルはデジタルアートしか作れないという明らかな制約がある。人間のように油絵やパステル画は描けない。レコードが復活したように、テクノロジーによって最初は新しい形に振れるかもしれないが、時間が経つにつれて、人々は常に最も質の高いオリジナルの形に回帰していくように思える。

結局のところ、これまでの研究で判明しているように、現在の形のAIモデルは、クリエイティブな人間のデジタルな代替品というよりも、アーティストの新しいツールとして機能する可能性が高い。たとえば、AIが出発点となるさまざまな画像を生成し、それを人間のアーティストが選択し、改良することも可能だろう。

これは、AIアートモデルの長所（迅速な反復とイメージの作成）と人間のアーティストの長所（作品に対するビジョンとAIモデルの問題点の克服）を組み合わせたものだ。特に、特定のアウトプットが必要なコミッションアートの場合、その傾向は顕著だ。AI単体では、必要なものを生み出すことは難しいだろう。

しかし、クリエイターにはまだ危険性があります。AIを使わないことを選択したデジタルアーティストは、AIを駆使したアーティストの迅速なイテレーションと低コスト化についていけず、取り残されてしまうかもしれない。

本記事は、Joseph Early氏によって執筆され、The Conversationに掲載された記事「AI can produce prize-winning art, but it still can’t compete with human creativity」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。