Stable Diffusionなどの画像生成AIやChatGPTなど、AI(特にジェネレーティブAI)が大いに話題になった2022年だが、その波は動画作成にも訪れている。
新しいWebサービス「QuickVid」では、YouTube、Instagram、TikTok、Snapchatの短編動画を自動作成してくれる。これは、新しいAIの登場ではなく、複数のジェネレーティブAIシステムを1つのツールにまとめたものだ。わずか1つの単語を入力するだけで、ライブラリから背景動画を選び、スクリプトとキーワードを書き、DALL-E 2で生成した画像を重ね、合成ナレーションとYouTubeのロイヤルティフリー音楽ライブラリからBGMを追加してくれるのだ。
QuickVidは、以前MetaでFacebook Liveとビデオのインフラに携わっていた開発者であるDaniel Habib氏が、数週間で構築し、12月27日にローンチしたものだ。現時点では比較的シンプルなもので、Habib氏によると1月にはより多くのパーソナライゼーション・オプションが登場する予定とのこと。しかしQuickVidは、キャプションやアバターなど、典型的な情報提供型のYouTubeショートやTikTokビデオを構成する要素を組み合わせることができる。
使い方は簡単で、まず、ユーザーは作成したいビデオの主題を説明するプロンプトを入力する。QuickVidは、このプロンプトをもとに、GPT-3のジェネレーティブテキスト機能を活用してスクリプトを生成する。スクリプトから自動的に抽出されたキーワード、あるいは手動で入力したキーワードから、QuickVidはロイヤリティフリーのストックメディアライブラリPexelsから背景動画を選択し、DALL-E 2を使ってオーバーレイ画像を生成する。そしてGoogle Cloudの音声合成APIを使ってナレーションを出力し、これらの要素を組み合わせて動画を作成するのだ。
QuickVidは、MetaやGoogleがジェネレーティブAIにより全く新しい動画を生成するのとは異なり、既存のAIを組み合わせることで、Bロールを多用した短編ビデオの反復的でテンプレート化された形式を利用し、映像そのものを生成しなければならないという問題を回避しているのである。
ただし、その品質はまちまちで、そのまま動画クリエイターがプラットフォームに投稿するレベルにはまだまだ達していないのが現状のようだ。ただし、Habid氏もこの現状を認識しており、常に改善を続けているとのこと。
Habib氏によると、QuickVidのユーザーは作成したコンテンツを商業的に使用する権利を保持しており、YouTubeなどのプラットフォームで収益化する許可を得ているという。しかし、AIが生成したコンテンツの著作権状況は、少なくとも現時点ではまだ曖昧なものだ。
Microsoft、GitHub、OpenAIの3社は、コード生成システムCopilotが、ライセンス供与されたコードの一部をクレジット表示なしに再利用することを許可しており、著作権法に違反しているとして集団訴訟で訴えられている。(この訴訟は、DALL-E 2のようなジェネレーティブアートAIにも影響を与え、同様に、学習させたデータセット(画像など)からコピー&ペーストすることが判明している。)このことが、QuickVidに影響を与える可能性もありそうだ。
また、AI生成テキストに関するGoogle検索が明らかにしている方針は、動画領域で今後起こることを予見している可能性がある。Googleは、検索順位に関わる合成テキストを人間が書いたテキストと区別して扱わないが、“検索順位を操作することを目的とし、ユーザーの役に立たない”コンテンツには対処するとしている。これには、異なるウェブページをつなぎ合わせたり、組み合わせたりして「十分な価値を付加していない」コンテンツや、純粋に自動化されたプロセスで生成されたコンテンツが含まれるが、いずれもQuickVidは該当する可能性がありそうだ。
つまり、AIで生成された動画が大きく普及しても、プラットフォームから全面的に禁止されるわけではないが、それがしっかりと評価されるためには結局は品質が担保される必要があると言う事だ。
とはいえ、TikTokのようなプラットフォームが、誤解を招く動画の新しい住処になりつつあると考える専門家の不安を払拭することはできないだろうが、Habib氏がインタビューの中で述べたように、「ジェネレーティブAI革命は止められない」だろう。
Source
コメントを残す