あなたの好奇心を刺激する、テックと科学の総合ニュースサイト

Meta、自己監視型ビジョントランスフォーマーモデル「DINOv2」を発表

自己教師付きビジョントランスフォーマーモデルであるDINOを導入してから2年、Meta AIは「DINOv2」のリリースを発表した。このモデルは、CLIPなどの他の類似モデルとは異なり、強力なパフォーマンスを発揮し、微調整を必要としない。

GitHubのリポジトリはこちら:DINOv2

Metaは、言語モデリングや単語ベクトルなど、スーパービジョンが不要な目的を用いて、大量の生テキストに対して事前学習を行うことでこれを実現した。このモデルはオープンソースで、1億4,200万枚の画像に対して、ラベルなしで自己教師付きで事前学習される。

「DINOv2は、シンプルな線形分類器の入力として直接使用できる高性能な機能を提供します。この柔軟性は、DINOv2が様々なコンピュータビジョンタスクの多目的バックボーンとして使用できることを意味します」とブログ記事で述べられている。

DINOv2は、深度推定、画像分類、セマンティックセグメンテーション、画像検索などのタスクに、高価なラベル付きデータを必要とせずに取り組むことができるため、開発者は時間とリソースを大幅に節約することが出来るだろう。


Source

Follow Me !

この記事が気に入ったら是非フォローを!

Share!!

関連コンテンツ

おすすめ記事

執筆者
Photo of author

masapoco

TEXAL管理人。中学生の時にWindows95を使っていたくらいの年齢。大学では物理を専攻していたこともあり、物理・宇宙関係の話題が得意だが、テクノロジー関係の話題も大好き。最近は半導体関連に特に興味あり。アニメ・ゲーム・文学も好き。最近の推しは、アニメ『サマータイムレンダ』

記事一覧を見る

コメントする