ChatGPTの新たなライバル「Claude 2」がオープンベータテストを開始

AnthropicはOpenAIのChatGPT、GoogleのBard等の競合になり得る大規模言語モデル（LLM）の最新版「Claude 2」を発表した。3月に発表されたClaudeのオリジナル版とは異なり、Claude 2は、ユーザーに向けて一般公開されており、ベータ版専用のWebサイトで無料で試すことができる。また、開発者向けの商用APIとしても利用できる。

Anthropicは、元OpenAIの研究者によって2021年に設立され、約15億ドルの資金を獲得しており、OpenAIの直接の競合と目されている。OpenAIは既にChatGPTで大成功を収め、Microsoftから多くの支援も受けており、AI分野で既に有意な位置に立っている。しかし、Anthropicの最初のAIモデルである「Claude」は、少なくともベンチマークでは、かなり優位に立つことができていた。

Anthropicは現在、Claude 2でその性能を更に高めている。同社によれば、Claude 2では、「より優れた会話スキル、より明確な推論説明、より無害な出力、より長いメモリ、より優れたプログラミング、数学、思考スキル」など、多くの面で改善が見られるという。

このモデルは、文書、メモ、手紙、物語、技術文書、書籍の作成に使用できる。Claude 2の優れた特徴として、一度に100,000トークン（75,000語）まで処理できることが挙げられる。これは標準的なChatGPTの4,096トークン、GPT-4の32,768トークンを大幅に上回るものだ。

これにより、チャットボットは応答においてより多くのコンテキストを考慮することができ、応答の質とタスクの多様性が向上している。Anthropicはすでに5月に、最初のモデルであるClaudeについても、処理トークンの大幅アップデートを発表していた。

アメリカの司法試験の多肢選択式セクションでは、Claude 2は76.5パーセントでGPT-4と同等だ。無料のChatGPTであるGPT-3.5の平均は約50%に過ぎない。Codex HumanEval Pythonプログラミングテストでは、Claude 2は71.2パーセント（Claude 1.3は56.0パーセント）、GSM8k小学校算数問題では88.0パーセント（Claude 1.3は85.2パーセント）を達成している。

Anthropic社によれば、追加機能は今後数ヶ月の間にゆっくりと反復的に展開される予定だという。

Claude 2は英国と米国で最初にローンチ

新しいチャットボットの開発には約2ヶ月を要した。約35人がAIモデルの開発に直接携わり、さらに150人がサポート役に回った。Claude 2の開発にあたり、Anthropic社は安全性に特に注意を払ったとしている。

OpenAIとは異なり、Anthropicは、モデルを最適化するためにAIが生成したコンテンツの評価に人間を関与させるのではなく、AIベースのフィードバックメカニズムに依存しており、AppleのT&Cなどのガイドラインに基づく一種の“憲法”を通じて基本ルールを設定している。

Anthropic社によれば、チャットボットが意図的にミスを犯すよう挑発するレッドチームテストにおいて、Claude 2は前作の2倍の快適なユーザー体験を達成したという。とはいえ、Claude 2は幻覚や誤報がないわけではない。Anthropic社によれば、克服すべきハードルはまだたくさんあるという。

Anthropic社によれば、マーケティング・コピーのための生成AIプラットフォームであるJasper社や、Claudeの推論機能の強化とより大きなコンテキスト・ウィンドウを使用して開発者のコード作成、修正、保守を支援するコードAIプラットフォームであるSourcegraph社などのパートナーを含め、すでに何千もの企業がClaude 2のAPIを使用しているという。

企業顧客はClaude 1.3と同じ価格でClaude 2 APIを入手でき、Webチャットボットは米国と英国で無料ベータ版として利用できる。

Sources

Anthropic:
- Claude 2
- Model Card and Evaluations for Claude Models (PDF)