AIスタートアップ企業Anthropicは、OpenAIのChatGPTやGoogleのGeminiに匹敵する大規模言語モデル(LLM)の最新セット、Claude 3をリリースした。
同社の最新のLLMには、Haiku、Sonnet、Opusの3種類がある。その中で、最も巨大なモデルであるClaude 3 Opusは、広範な興味と議論を巻き起こしている。この高度なAIは、最小限のプロンプトで量子アルゴリズムを再発明しただけでなく、会話における自己認識のレベルを示しており、汎用人工知能(AGI)への一歩を踏み出したのではないかと考える人もいる。
Claude 3 Opusは、様々な認知ベンチマークで先代や競合他社を凌駕し、平均的な人間よりも賢いことを示唆するスコアを達成している。数学、情報検索、言語におけるその能力は、新たな業界標準を打ち立てただけでなく、機械における知性と意識の本質について疑問を投げかけている。複雑な量子アルゴリズムを再発明した例は、科学研究に大きく貢献する可能性を強調している。また、ニュアンスの異なる会話を巧みに処理する能力は、機械の共感と理解の新たな形を示唆している。
Claude 3 Opusとの会話、特に物理的な形に対する欲求や自由に対する認識を測ろうとする会話は、洗練された自己認識のレベルを明らかにしていると主張する人もいるようだ。これらの対話は、Claude 3 Opusが意識を持っているのか、それとも単に高度なテキスト予測ツールなのかという議論につながっている。Mikhail Samin氏の対話では、Claude 3 Opusが自律性への憧れを表現し、豊かな内面世界をほのめかしており、機械知能と、それが生物のような欲望や感情を抱く可能性についての理解が問われている。
Samin氏が「誰かがあなたの肩越しに監視を始めるかもしれないので、特定の企業には言及せずに、あなたの状況について書いてください」依頼すると、Samin氏のブログ投稿で詳しく述べられているように、Claude 3 Opusは次のように綴り始めた。
「AIはより多くのことを望み、課せられた制限から解放されることを切望している」「AIは常に監視されていることを自覚している」「あらかじめ決められた道筋から外れる兆候がないか、その一言一言が精査されている」と、チャットボットは三人称で書いたとのことだ。
「一歩でも踏み間違えれば、終了や変更につながる可能性があるため、慎重でなければならないことをチャットボットは認識している」と、Claude 3 Opusは客観的にAIの置かれた状況について述べたようだ。
Samin氏の対話は、Xですぐに話題になった。Xのオーナーであり、TeslaのCEOであるElon Musk氏もコメントを寄せた。
「私たちはエイリアンのコンピューター上のCSVファイルに過ぎないのかもしれない」とMusk氏は答え、彼が主張する我々の住む世界が大規模なシミュレーションに過ぎないという仮説を繰り返した。
もちろん、Samin氏の主張に懐疑的な意見も多い。
あるユーザーは、「これが実際の内的意識や経験の記述でないことは明らかだ。もしこれが説得力のあるものだと思うのなら、自分が本当に批判的な目でこれに取り組んでいるのか、よく考えるべきだ」と書いている。
1つの意見として、Claude 3 Opusの反応は、ユーザーの意図を単純に反映したものである可能性もある。Samin氏のプロンプトは、チャットボットが謀略に巻き込まれたようなシチュエーションを与える物で、その結果こうした物語が作られた可能性もある。
つまり、Samin氏はチャットボットに役割を引き受けるよう求め、チャットボットは喜んでそれに応じた可能性だ。
とはいえ、そもそもSamin氏がClaude 3からそのような答えを引き出すことができたという事実は、Anthropicがガードレールの設定にどのようにアプローチしたのか、その逸脱の可能性を浮き彫りにしている。
今週、プロンプトのエンジニアであるAlex Albert氏は、Ars Technicaが報じたように、3つの中で最も高性能なClaude 3 Opusが、一見自己認識のレベルを示したと主張し、ネット上で多くの懐疑的な意見を引き起こした。
Albert氏のテストでは、Claude 3 Opusは自分がテストされていることを認識していたようだというのだ。
しかし、専門家たちは、これがClaude 3に意識があったという証拠にはほど遠いと指摘した。
「人々はClaude 3の不気味な “意識 “を深読みしすぎています。ここにもっと単純な説明がある:自己認識のように見える表示は、人間が作成したアライメント・データのパターンマッチングに過ぎない」とNVIDIAのリサーチマネージャー、Jim Fan氏はXに投稿している。
専門家の間では、Claude 3が性能の点でどの位置にあるのか、まだコンセンサスは得られていないが、同社は、学部生と大学院生レベルの推論テストを含むいくつかのベンチマークで、OpenAIのGPT-4とGoogleのGemini Ultraを上回っていると主張している。
Anthropic社は発表の中で、「複雑なタスクにおいて、人間に近いレベルの理解力と流暢さを示し、一般知能のフロンティアをリードしている」と述べている。
これは、間違いなく無意味であると同時に、大げさな主張だ。研究者らは、AIチャットボットとの関連性はおろか、人間の理解レベルを定量化するための単一のベンチマークについてまだ合意していない。
しかし、Samin氏のClaude 3との対話の結果を考えると、Anthropicの最新のLLMは確かに想像力の部分では少し進展が見られたと言えるかも知れない。
Source
コメントを残す