カーネギーメロン大学とバイオテクノロジースタートアップEmerald Cloud Lab (ECL) の研究者らは、科学研究と実験を自律的に展開する人工知能システム「Coscientist」を開発した事を発表した。学術誌『Nature』に掲載されたこの非有機的知的システムは、Gabe Gomes助教授と博士課程学生のDaniil BoikoとRobert MacKnightが開発したもので、OpenAIのGPT-4を使用し、化学分野の複雑な科学実験を自律的に設計、計画、実行するように設計されている。
Coscientistの設計により、公開データを利用した化学合成の計画から、液体処理機器の制御、過去に収集したデータの分析による最適化問題の解決まで、さまざまなタスクを実行できる。
「自律的な科学実験のためのインテリジェント・エージェント・システムが、とてつもない発見、予期せぬ治療法、新素材をもたらすだろうと予想しています。これらの発見がどのようなものになるかは予測できませんが、人間と機械の相乗的なパートナーシップによって、新しい研究方法が生まれることを期待しています」と研究チームは論文に書いている。
Coscientistは、相互に作用し合う複数のモジュールで構成されている:中心的なモジュールである「Planner」は、GPT-4を使ってユーザー入力に基づいて実験を計画する。システムは4つのコマンド「GOOGLE、PYTHON、DOCUMENTATION、EXPERIMENT」を使って行動空間を定義する。
GOOGLEコマンドはGoogle Search APIを使ってインターネットを検索する。DOCUMENTATIONコマンドは、実験器具に必要な文書を検索し、要約する。
一方、PYTHONコマンドは、プランナーが要求する予期せぬアクションからユーザーのマシンを保護するために、隔離されたDockerコンテナ内でコードを実行し、言語モデルは使用しない。EXPERIMENTコマンドも同様で、生成されたコードを適切なハードウェア上で実行するか、合成プロセスを手動で実験できるようにする。例えばコードにエラーがあった場合、プランナーはフィードバックを受け取り、コードの修正を試みることができる。
Coscientistがオープンソースの液体ハンドラーを制御する
このアーキテクチャを使って、研究者たちは、公開されているデータを使って、既知の化合物の化学合成を計画するCoscientistの能力をテストした。そのために、CoscientistのGPT-4ベースのWeb Searcherモジュールの性能を、GPT-3、Claude 1.3、Falcon-40B-Instructなどの他のモデルと比較した。GPT-4ベースのWeb Searcherは、アスピリンなどの化合物に関する正確で詳細な情報をより一貫してコンパイルするため、合成計画を大幅に改善した。これは、正確で効率的な実験計画のために高度なLLMを使用することの重要性を浮き彫りにした。
Coscientistは、実験に使用されたOpentronのPython APIなど、実験装置を操作するための技術文書も使用している。また、実験に使用されたEmerald Cloud Lab (ECL) Symbolic Lab Language (SLL)でのプログラミングを学習することもできた。
調査、必要なドキュメントの収集、コードの記述の後、AIシステムはリキッドハンドラーOpentronsのOT-2を制御した。
例えば、「1本おきに好きな色を塗ってください」といった自然言語による簡単な指示を与えると、Coscientistは、ロボットによって実行されると、希望する指示に非常によく似た正確なプロトコルを生成した。
上の画像のように、研究者らは最後の実験として、より複雑な実験、触媒クロスカップリング実験でCoscientistの性能をテストした。触媒クロスカップリング実験とは、特殊な触媒を使って2つの異なる分子を結合させる化学プロセスである。
この技術は、医薬品や電子機器の材料など、複雑な分子を作るためによく使われる。
研究チームによれば、システムはプロトコルを正常に実行できたという。マイクロプレートを交換するときだけ人間の介入が必要であったが、それ以外は実験が積極的に妨害されることはなかった。
研究チームは、この結果を、他の科学的ツールを言語モデルに統合することで、科学的発見を大幅に加速できる可能性があることを示すものと見ている。しかし、このようなシステムの開発には、悪用される可能性やそれを回避する方法についての疑問も生じる。研究チームは、この両面でさらに研究を進めるつもりである。
「Gomes氏と彼のチームは、このシステムで実証された化学合成作業の枠を超えて、一種の超効率的な実験パートナーを合成することに成功した。彼らはすべてのピースを組み合わせ、最終的な結果はそのパーツの総和をはるかに超えるものである」と、全米科学財団化学部門のDavid Berkowitz部門長は、プレスリリースで語っている。
同様のAIベースのアシスタントは過去にも作られている。マサチューセッツ工科大学の研究者は「CRSEt」と呼ばれる実験アシスタントのようなシステムを作り、ミシガン大学のチームはBacterAIという、特定の2つの微生物のメタボリズムをマッピングできるシステムを作った。しかし、Coscientistが他と違うのは、実行可能な実験の複雑さと、手順やプロトコルに関する人間の監視が大幅に少なくて済むことである。
チームは、Coscientistの開発が、科学研究におけるAIの倫理的かつ責任ある使用に関する重要な検討事項を提起していることを認識している。AIは研究を前進させる大きな可能性を提供する一方で、安全性や誤用の可能性に関する懸念も存在する。CoscientistのようなAIシステムの可能性を科学的発見に最大限に活用し、リスクを軽減するためには、これらの懸念に対処することが極めて重要である。
「AIを活用した科学がもたらすプラス面は、マイナス面をはるかに上回ると信じています。しかし、私たちには、何がうまくいかない可能性があるのかを認識し、解決策とフェイルセーフを提供する責任があります」と、Gomes氏は述べている。
「これらの強力なツールの倫理的かつ責任ある利用を保証することで、我々は、その誤用に関連するリスクを軽減しながら、科学研究を進める上で大規模な言語モデルの大きな可能性を探求し続けることができる」と、著者らは研究論文で結論づけた。
なお、コードはプロジェクトのGitHubで公開されている。
論文
参考文献
- Carnegie Mellon University: CMU-Designed Artificially Intelligent Coscientist Automates Scientific Discovery
- GitHub: gomesgroup/coscientist
研究の要旨
トランスフォーマーを用いた大規模言語モデルは、自然言語処理、生物学、化学、コンピュータプログラミングなど、様々な分野で大きな進歩を遂げている。ここでは、GPT-4によって駆動される人工知能システムであるCoscientistの開発と能力を紹介する。Coscientistは、インターネットや文書検索、コード実行、実験自動化などのツールによって強化された大規模な言語モデルを組み込むことによって、複雑な実験を自律的に設計、計画、実行する。Coscientistは、パラジウム触媒クロスカップリングの反応最適化の成功を含む、6つの多様なタスクにわたって研究を加速する可能性を示し、同時に(半)自律的な実験デザインと実行のための高度な能力を示している。我々の発見は、Coscientistのような人工知能システムが研究を推進する上で、汎用性、有効性、説明可能性を示すものである。
コメントを残す