Meta、初見の物体も識別出来るAIモデル「SAM」を公開

masapoco
投稿日 2023年4月6日 7:09
FireShot Capture 050 Segment Anything Meta AI segment anything.com

AIは通常、オブジェクトを検出するために既存の材料で訓練する必要があるが、Metaは、画像や映像の中の個々の物体を、訓練中に遭遇しなかったものまで識別できるAIモデル「Segment Anything Model(SAM)」を発表した。

Metaのブログによると、SAMは画像セグメンテーション(分割)モデルであり、テキストプロンプトやユーザーのクリックに反応して、画像内の特定のオブジェクトを分離することができるとのことだ。画像分割は、コンピュータビジョンにおけるプロセスで、画像を複数のセグメントまたは領域に分割し、それぞれが特定のオブジェクトまたは関心領域を表すことを意味する。

画像分割の目的は、画像の解析や加工を容易にすることだ。Metaはまた、この技術がWebページのコンテンツ理解、拡張現実アプリケーション、画像編集、ビデオ上で追跡する動物や物体を自動的に特定することによる科学研究の補助に役立つと見ている。

通常、正確なセグメンテーションモデルを作成するには、「AIトレーニングインフラと慎重にアノテーションされた大量のドメイン内データを利用できる技術専門家による高度な専門作業が必要」だとMetaは述べている。MetaはSAMを作成することで、専門的なトレーニングや専門知識の必要性を減らすことでこのプロセスを「民主化」し、コンピュータビジョンの研究がさらに促進されることを期待している。

Metaは、SAMに加え、「大手写真会社」からライセンスを受けた1100万枚の画像と、セグメンテーションモデルで作成した11億枚のセグメンテーションマスクからなるデータセット「SA-1B」を構築した。Metaは、SAMとそのデータセットをApache 2.0ライセンスで研究目的に利用できるようにする予定だ。

現在、GitHubでコード(ウェイトなし)が公開されており、Metaはセグメンテーション技術の無料インタラクティブデモを作成した。デモでは、写真をアップロードし、「Hover & Click」(マウスでオブジェクトを選択)、「Box」(選択ボックス内でオブジェクトを選択)、「Everything」(画像内のすべてのオブジェクトを自動的に識別しようとする)を使用することが出来る。

画像分割技術は新しいものではないが、SAMはトレーニングデータセットに存在しないオブジェクトを識別する能力と、部分的にオープンなアプローチで注目される。また、SA-1Bモデルのリリースは、Metaの言語モデルLLaMAがすでに分派プロジェクトを刺激しているのと同様に、新世代のコンピュータビジョンアプリケーションの火付け役となる可能性がある。

Reutersによると、MetaのCEOであるMark Zuckerberg氏は、今年、同社のアプリにジェネレーティブAIを取り入れることの重要性を強調した。Metaはまだこの種のAIを使った商用製品をリリースしていないが、以前、SAMに似た技術をFacebookと社内で活用し、写真のタグ付け、コンテンツのモデレーション、FacebookやInstagramでのおすすめ投稿の決定などに活用している。

Metaの発表は、AI空間の支配を目指すビッグテック企業間の熾烈な競争の中で行われた。Microsoftが支援するOpenAIのChatGPT言語モデルは2022年秋に広く注目を集め、ソーシャルメディアやスマートフォンを超えるテクノロジーにおける次の大きなビジネストレンドを定義するかもしれない投資の波を引き起こした。


Source



この記事が面白かったら是非シェアをお願いします!


  • Header Android Giving people more control over their data
    次の記事

    Google、Androidアプリ開発者に、ユーザーアカウント削除オプション提供を義務付けへ

    2023年4月6日 9:22
  • 前の記事

    Google Earth、タイムラプス機能に新たに2022年までのデータを追加

    2023年4月6日 6:38
    brisbane3 CROPPED 1.width 1000.format webp

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事