Meta、自己監視型ビジョントランスフォーマーモデル「DINOv2」を発表

masapoco
投稿日 2023年4月18日 18:28
depth estimation demo a2411a3b

自己教師付きビジョントランスフォーマーモデルであるDINOを導入してから2年、Meta AIは「DINOv2」のリリースを発表した。このモデルは、CLIPなどの他の類似モデルとは異なり、強力なパフォーマンスを発揮し、微調整を必要としない。

GitHubのリポジトリはこちら:DINOv2

Metaは、言語モデリングや単語ベクトルなど、スーパービジョンが不要な目的を用いて、大量の生テキストに対して事前学習を行うことでこれを実現した。このモデルはオープンソースで、1億4,200万枚の画像に対して、ラベルなしで自己教師付きで事前学習される。

「DINOv2は、シンプルな線形分類器の入力として直接使用できる高性能な機能を提供します。この柔軟性は、DINOv2が様々なコンピュータビジョンタスクの多目的バックボーンとして使用できることを意味します」とブログ記事で述べられている。

DINOv2は、深度推定、画像分類、セマンティックセグメンテーション、画像検索などのタスクに、高価なラベル付きデータを必要とせずに取り組むことができるため、開発者は時間とリソースを大幅に節約することが出来るだろう。


Source



この記事が面白かったら是非シェアをお願いします!


  • netflix building
    次の記事

    Netflix、同社の原点であるDVD事業を終了へ

    2023年4月19日 5:38
  • 前の記事

    リアウィンドウのない電気自動車SUV「Polestar 4」が登場

    2023年4月18日 18:16
    666118 20230418 Polestar 4

スポンサーリンク


この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事