Meta、自己監視型ビジョントランスフォーマーモデル「DINOv2」を発表

自己教師付きビジョントランスフォーマーモデルであるDINOを導入してから2年、Meta AIは「DINOv2」のリリースを発表した。このモデルは、CLIPなどの他の類似モデルとは異なり、強力なパフォーマンスを発揮し、微調整を必要としない。

Announced by Mark Zuckerberg this morning — today we're releasing DINOv2, the first method for training computer vision models that uses self-supervised learning to achieve results matching or exceeding industry standards.

More on this new work ➡️ https://t.co/h5exzLJsFt pic.twitter.com/2pdxdTyxC4
— AI at Meta (@AIatMeta) April 17, 2023

GitHubのリポジトリはこちら：DINOv2

Metaは、言語モデリングや単語ベクトルなど、スーパービジョンが不要な目的を用いて、大量の生テキストに対して事前学習を行うことでこれを実現した。このモデルはオープンソースで、1億4,200万枚の画像に対して、ラベルなしで自己教師付きで事前学習される。

「DINOv2は、シンプルな線形分類器の入力として直接使用できる高性能な機能を提供します。この柔軟性は、DINOv2が様々なコンピュータビジョンタスクの多目的バックボーンとして使用できることを意味します」とブログ記事で述べられている。

DINOv2は、深度推定、画像分類、セマンティックセグメンテーション、画像検索などのタスクに、高価なラベル付きデータを必要とせずに取り組むことができるため、開発者は時間とリソースを大幅に節約することが出来るだろう。

Source

Meta: DINOv2: State-of-the-art computer vision models with self-supervised learning

Meta、自己監視型ビジョントランスフォーマーモデル「DINOv2」を発表

Netflix、同社の原点であるDVD事業を終了へ

リアウィンドウのない電気自動車SUV「Polestar 4」が登場

コメントを残すコメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

Meta、自己監視型ビジョントランスフォーマーモデル「DINOv2」を発表

Netflix、同社の原点であるDVD事業を終了へ

リアウィンドウのない電気自動車SUV「Polestar 4」が登場

コメントを残す コメントをキャンセル

おすすめ記事

OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事

コメントを残すコメントをキャンセル