DeepMindの元研究員が設立した「Haiper」の登場が動画生成AI競争を盛り上げる

masapoco
投稿日
2024年3月6日 7:46
videoframe 1543

動画生成AIを開発しているスタートアップのHaiperは本日、Octopus Venturesが主導するシード資金として1380万ドルを調達したと発表した。

2021年後半に設立されたHaiper社は、DeepMindの元研究員である2人の最高経営責任者(CEO)Yishu Miao博士と最高技術責任者(CTO)Ziyu Wang,博士が率いており、2人ともオックスフォード大学で機械学習の博士号を取得している。

Haiperは、ユーザーが書いたテキストプロンプトを短いアニメーション動画に変換できるAI基盤モデルの構築に取り組んできた。また、ユーザーが書いたプロンプトと一緒に静止画像をアップロードして、それを元にクリエイティブなアニメーションを生成させることもできる。

ビジュアル生成AIにおける同様の開発には、OpenAIのSoraがあり、驚異的なビジュアルクオリティを維持しながら、最長1分の動画を生成することができる。過去に同様のモデルを発表した他の企業には、Meta、Google、Runway AIなどがある。これらのモデルで常に問題となっているのは、品質とテキストプロンプトを遵守する能力である。

Haiperのチームによると、動画生成AIは、AIモデルが品質と精度を拡大する必要がある変曲点に到達している。そのためには、単に膨大な数の動画や画像を与えるだけでなく、光、動き、質感、物体間の相互作用など、物理学的な文脈やその中の情報の相互作用を理解する必要がある。例えば、雨粒が表面に当たったときにどのように飛び散るのか、風が人の顔を横切ったときに髪の毛がどのように動くのか、モデルは理解する必要がある。

同社は、AI研究の究極の目標である汎用人工知能(AGI)の形態まで拡張できるモデルを構築することを目指している。

Haiperの動画生成AIは現在ベータテスト中で、同社のWebサイトから無料で入手できるHaiperのアプリを使えば、ユーザーはいくつかの異なるツールを使って同社のAIモデルにアクセスし、動画を生成することができる。同社が現在提供しているツールには、ユーザーが見たいものについて自分で想像力豊かな説明を書き、それを動画にしたり、画像をアップロードして説明文とともにモデルにアニメーションを依頼したりできる「テキスト・トゥ・ビデオ」などがある。

さらに、ビデオのリペイントでは、短いビデオを、テキストの説明を使って、さまざまな色、テクスチャ、要素で変更することができる。例えば、スープの入ったボウルをカラフルな魚でいっぱいにしたり、洋服が干してあるアニメーションを、物干し竿にぶら下がっている光り輝くエイリアンに変更したりすることができる。


Sources



この記事が面白かったら是非シェアをお願いします!


  • Android apps on windows 11 4
    次の記事

    Microsoft、Windows 11上でAndroidアプリを実行する機能を終了へ

    2024年3月6日 8:36
  • 前の記事

    JEDEC、次世代グラフィックス・メモリ規格としてGDDR7を正式に発表

    2024年3月6日 6:39
    gddr

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事