OpenAIは待望のDALL-E APIをパブリックベータ版としてリリースした。これにより、開発者はDALL-Eをアプリや製品に直接組み込むことができるようになる。
この発表により、自然言語プロンプトを使用してオリジナル画像を作成・編集できる変換言語モデルであるDALL-Eが、GPT-3、Embeddings、CodexとともにOpenAIのAPIプラットフォームに加わることになった。
ファッションデザインプラットフォームのCalaや、軽量の装飾タイルにオンライン写真をプリントするMixtilesなどの企業が、すでにそれぞれのユースケースに合わせてAPIを実装し、テストを行っているようだ。
また、Microsoft(マイクロソフト)は、新しいグラフィックデザインアプリであるDesignerにDALL-Eを導入している。また、BingとMicrosoft EdgeにImage Creatorを搭載し、Web検索結果で探しているものが見つからない場合にユーザーが画像を作成できるようにする予定だ。
OpenAIでAPIに携わっているプロダクト・マネージャーのLuke Miller(ルーク・ミラー)氏は、The Vergeに対し、開発者がDALL-Eで新しいアプリケーションを見つけることに興奮していると語っている。
「我々はすでに非常に興味深い方法でこれを構築するいくつかの顧客を持っています。あるものは創造的な探求であり、あるものはよりビジネス志向です。」とMiller氏は語っている。
テキストから画像へのAIへの関心と採用は昨年爆発的に増加し、かつてこの分野の先駆者であったOpenAIは、MidjourneyやStability AIなどのによって話題の中心から少し離れることになった。これらの組織は、ユーザーに対する制限を少なくしており、ユーザーはほとんど監視されることなくAIシステムを構築することができるようになっていた。一方、GoogleやMetaのようなこの分野の他のプレイヤーは、同様の機能を持つシステムを開発しながらも、その一般利用を非常に限られたシナリオに限定するという、はるかに慎重なアプローチを取っている。
テキストから画像への変換がもたらす明らかな創造的利益だけでなく、様々な危険も存在する。このソフトウェアは、誤報や、無許可のヌードなどの有害な画像を生成するために使用される可能性があり(ただし、OpenAIはキーワードフィルターによってそのような使用を困難にしている)、データ使用に関する難しい倫理的問題が存在する。
DALL-Eのようなテキストから画像への変換を行うAIシステムは、ウェブから収集した画像で学習させるが、その画像には通常、写真家、アーティスト、デザイナーの著作物が含まれている。多くのアーティストが、この技術が彼らの個人的なスタイルを模倣するために使われるだけでなく、OpenAIのような数十億ドル規模の企業に収入をもたらすために彼らの作品が使われることに対して補償がないことに批判的だ。
テキストから画像への変換アプリケーションを開発している企業のなかには、補償を提供し始めているところもある。例えばShutterStock(シャッターストック)は、DALL-Eを作るためにOpenAIに投稿者データをライセンスし、そのAPIを使ってカスタムストックイメージを生成しているが、最近、作品がAIの訓練に使われた個人に報酬を与える「Contributors Fund」を設立すると発表している。
OpenAIは、アーティストに報酬を与える同様の制度を設ける予定があるのかと尋ねられたMiller氏は、具体的なことは何も考えていないと答えた。「この件に関して、今すぐ共有できる具体的なことは何もありません。もちろん、この件に関しては、コミュニティからのフィードバックを求め続けている。この問題は、さまざまな視点から考える必要があり、非常に複雑です。私たちは、地域の人たちが何を大切にしているかを知りたいのです。」
OpenAIは、DALL-E APIへのアクセスは、同社がシステムをスピンアップする際にまず料金制限を設け、顧客がその技術をどのように使うかを審査することはないとしている。顧客は、生成された画像ごとに課金され、3段階の解像度から選択することができるようになっている。256×256の画像は1枚0.016ドル、512×512の画像は1枚0.018ドル、1024×1024の画像は1枚0.02ドルとなっている。
コメントを残す