ケンブリッジ大学を中心とする新たなAI研究プロジェクトは、科学的発見に繋がる新たなAI「Polymathic AI」の開発を発表した。このプロジェクトは、ChatGPTと同じ基盤技術を用いて、科学的発見を促進するAIを開発することを目的としている。ChatGPTが言葉や文章を扱うのに対し、Polymathic AIは数値データや物理学のシミュレーションから学習し、科学研究者が、超巨大星から地球の気候まで、多様な科学的問題をモデリングすることを支援するとのことだ。
プロジェクトは先週、関連する一連の科学論文とともに公開された。プロジェクトの主任研究者であるフラットアイアン研究所のShirley Ho氏によれば、このAIは「科学におけるAIと機械学習の使い方を完全に変える」とのことである。Polymathic AIのアイデアは、人間がすでに複数の言語を知っていると新しい言語を学ぶのが容易であるように、大規模な事前訓練済みモデル(ファウンデーションモデル)を用いることで、科学的モデルの構築をより迅速かつ正確に行う事を実現しているという。
このプロジェクトは、サイモンズ財団やフラットアイアン研究所、ニューヨーク大学、ケンブリッジ大学、プリンストン大学、ローレンス バークレー国立研究所など、多様な研究機関からの研究者を含む国際チームによって推進されている。専門家は、物理学、天文学、数学、人工知能、神経科学など多岐にわたる。
これまでにも、科学研究にAIは用いられてきたが、それらは主に目的に応じて構築され、関連するデータを使用して訓練された汎用性の低いものだった。「近年、様々な科学分野で機械学習が急速に発展しているにもかかわらず、ほとんどの場合、機械学習ソリューションは特定のユースケースのために開発され、非常に特定のデータで訓練されています。つまり、AIを研究に利用する科学者たちは、異なるフォーマットや全く異なる分野で存在する情報を利用することができないのです」」と、フランス国立科学研究センター(CNRS)の宇宙学者である共同研究者Francois Lanusse氏は言う。
Polymathic AIは、物理学や天文学など、多様な科学分野からのデータを用いて学習する。この多角的な知識を用いて、多くの科学的問題に対処する。プロジェクトのメンバーであるMariel Pettee氏によれば、このプロジェクトは「多くの一見無関係なサブフィールドを何かより大きなものに結びつけるでしょう。どこまで学問分野を飛び越えられるかは不明です。私たちがやりたいのは、それを実現させることなのです」と述べている。
ChatGPTは、正確さに関しては、一定の間違いを犯すことが知られている。Pllymathic AIのプロジェクトでは、数字を文字や句読点と同じレベルの文字としてではなく、実際の数字として扱うことで、こうした落とし穴の多くを回避するとHo氏は言う。また、学習データには、宇宙の根底にある物理を捉えた実際の科学データセットを使用する。
また、このプロジェクトは透明性と公開性を重視している。数年内には、多様な問題と領域にわたる科学的分析を改善することができる事前訓練済みモデルをコミュニティに提供することを目指しているとのことである。
論文
- arXiv:
参考文献
- Polymathic
- University of Cambridge: Scientists begin building AI for scientific discovery using tech behind ChatGPT
コメントを残す