Google、生成AIを使い「バーチャル試着」を実現

masapoco
投稿日 2023年6月15日 8:50
BlogImage1 zAa1DR7.width 1600.format webp

Googleは、Googleショッピングの幅広いアップデートの一環として、生成AIによって、取り込んだ衣類画像を、さまざまなポーズをとった実際のモデルに実際に着させて、衣類のドレープ、折り目、密着、伸び、シワや影のでき方を予測することまで出来るというアパレル向け「バーチャル試着ツール」を発表した。

バーチャル試着は、Googleが内部で開発した新しい拡散ベースのモデルによって実現されている。拡散モデルとは、テキストからアートへの変換を行うStable DiffusionやDALL-E 2と同様のアプローチによるもので、ノイズのみで構成されたスタート画像から徐々にノイズを減算し、目標に一歩一歩近づけていくことを学習する。

例えば、シャツを着た人が横向きに立っている画像と、前向きに立っている画像など、2種類のポーズで服を着た人が写っている画像のペアを多数使って、Googleはモデルを学習させた。さらに、このモデルをより強固なものにするため(つまり、折り目の形が崩れて不自然に見えるなどの視覚的な欠陥に対処するため)、衣服と人物のランダムな画像ペアを使用してこのプロセスを繰り返した。

本日より、Googleショッピングをご利用のお客様は、Anthropologie、Everlane、H&M、LOFTなどのブランドの女性用トップスを仮想的に試着することが出来るとのことだ。Google検索で新しい「試着」バッジをお探しください。男性用トップスは年内に発売される予定だ。

バーチャル試着技術は、新しいものではない。AmazonやAdobeは以前からアパレル商品のジェネレーティブ・モデリングを試しており、Walmartも昨年から、顧客の写真を使って服をモデリングするオンライン機能を提供している。AIスタートアップのAIMIRRは、このアイデアをさらに一歩進め、リアルタイムの衣服レンダリング技術を使って、人物のライブ映像に衣服の画像を重ね合わせている。

Google自身も過去にバーチャル試着技術を試験的に導入しており、L’Oréal、Estée Lauder、MAC Cosmetics、Black Opal、Charlotte Tilburyと共同で、検索ユーザーがさまざまな肌色のモデルを使って化粧品の色合いを試せるようにした。

しかし、生成AIがファッション業界をますます侵食するにつれ、長年の不平等を悪化させるというモデルからの反発も出てきている。

Levisは、カスタマイズされたAI生成モデルを作成するためにAI技術をテストしたが一部では反発もあった。その後Levisはインタビューでこの技術を擁護し、「買い物客が商品を着ているのを見ることができるモデルの多様性が増す」と述べている。

Googleはブログの中で、本物のモデルを起用したことを強調し、しかも、さまざまな人種、肌の色、体型、髪質を持つXXSから4XLサイズに及ぶ多様なモデルを起用したとしている。

Googleは、バーチャル試着の展開と同時に、AIとビジュアルマッチングアルゴリズムを活用した衣料品検索のフィルタリングを開始する。このフィルターは、ショッピングの商品リスト内で利用でき、ユーザーは色、スタイル、パターンなどの入力により、店舗間の検索を絞り込むことが可能だ。

Googleは、「店舗では、アソシエイトが、あなたがすでに試着したものをもとに、他の選択肢を提案したり、見つけたりして、これをサポートすることができます」と述べている。「今、あなたはオンラインで服を買うとき、その特別な手を借りることができます」。


論文

参考文献

研究の要旨

ある人物と別の人物が着用する衣服が描かれた2つの画像が与えられたとき、その衣服が入力された人物にどのように見えるかを視覚化することが目標である。主な課題は、被写体によって大きく変化する体のポーズや形状に対応するために衣服を歪ませながら、ディテールを維持したフォトリアリスティックな視覚化を合成することである。これまでの手法では、効果的なポーズや形状の変化を伴わない衣服の詳細保持に重点を置くか、希望する形状やポーズでの試着は可能だが衣服の詳細が欠落している。本論文では、2つのUNetを統合した拡散ベースのアーキテクチャ(Parallel-UNetと呼ぶ)を提案し、これにより、1つのネットワークで衣服の詳細を保存し、大きなポーズと体の変化に対して衣服をワープさせることができます。Parallel-UNetの主要な考え方は以下の通りです:1) 衣服の歪みは、クロスアテンションメカニズムによって暗黙のうちに行われる 2) 衣服の歪みと人物のブレンドは、2つの別々のタスクのシーケンスではなく、統一されたプロセスの一部として行われる実験結果は、TryOnDiffusionが質的にも量的にも最先端の性能を達成したことを示しています。



    この記事が面白かったら是非シェアをお願いします!


    • June Hero 3 N5njC9z.width 1600.format webp
      次の記事

      Google、「一目で分かる道案内」など、旅行に役立つ3つの機能をGoogleマップに追加

      2023年6月15日 9:22
    • 前の記事

      MetaやGoogleの元研究者らが設立したAIスタートアップ「Mistral AI」が史上最高額の資金調達

      2023年6月15日 6:56
      artificial intelligence

    スポンサーリンク


    この記事を書いた人
    masapoco

    コメントを残す

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です

    おすすめ記事

    • openai

      OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

    • a04c35e8e555c1cc7ae1d6a5f3159856

      MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

    • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

      ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

    • google logo image

      Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

    • Pixel 8 in Rose.max 936x936.format webp

      Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

    今読まれている記事