GPT-4がこれまでのGPTモデルより優れている点

OpenAIの新しいAIモデル「GPT-4」がついに公開され、既に新しいBingやDuolingoの言語学習ボットの改良まで、多方面で活躍している。では、このGPT-4はChatGPTやGPT-3.5といった旧バージョンと何が違うのだろうか？ここでは、これらの人気システムの5つの大きな違いを紹介しよう。

ChatGPTはもともとGPT-3.5（つまりGPT-3の数世代先）と説明されていたが、それ自体はOpenAIの大規模言語モデルのバージョンではなく、モデルを動かすチャットベースのインターフェイスを指す物だ。ここ数ヶ月で爆発的に普及したChatGPTシステムは、GPT-3.5と対話するための窓口であり、現在では、（ChatGPT Plusは）GPT-4と対話するための窓口となる。

1.GPT-4は信頼性と創造性が上がり、より賢くなった

OpenAIの大規模言語モデルの最新モデルGPT-4は、OpenAI独自のレポートによると、GPT-3.5よりもはるかに信頼性と創造性が高く、カジュアルな会話でより微妙な指示を処理することが出来るとのことだ。

GTP-4の優位性を示す実験として、本来人間向けに設計された司法試験の模擬試験で両バージョンをテストした。GPT-4が上位10％台のスコアで合格したのに対し、GPT-3.5のスコアは下位10％前後であり、後継モデルが前作よりもはるかに知能が高いことが示された。

その他の公開テストでは、GPT-4はGPT-3を上回るか、同等の成績を収めている。例えば、SAT Evidence-based Reading & Writingでは、GPT-4は93％、GPT-3は87％のスコアを獲得している。また、GRE（Graduate Record Examination）のQuantitativeでは、GPT-4は80％台、GPT-3は25％台と、その優秀さを証明している。

2.GPT-4は映像を見て理解できる

この汎用性の高い機械学習システムの最も顕著な変化は、複数の「モダリティ」の情報を理解できる「マルチモーダル」であることだ。ChatGPTとGPT-3は、テキストに限定されていた。ChatGPTやGPT-3は、読み書き機能に限定されていたわけだ。

しかし、GPT-4は画像を入力すると、それを処理して関連情報を探し出すことができる。もちろん、写真の中に何が写っているかを説明させることもできるが、それ以上に重要なのは、その理解力だ。OpenAIが提供した例では、iPhoneのコネクタがやたらと大きい画像のユーモアについて説明しているが、目の見えない人や弱視の人が使うアプリ「Be My Eyes」との提携により、自分のスマートフォンが見ている物を理解し、説明してくれるようになったのだ。これにより、目の見えない方が、より周りの世界を理解しやすくなる手助けが出来る様になっている。

3.GPT-4は騙されにくい

今日のチャットボットは、正しく機能しているにもかかわらず、簡単に迷わされる傾向がある。ちょっとした作り話で、モデルにあらゆる種類の奇妙で率直に言って不愉快なことを言わせることが出来る。プロンプト・インジェクションと言った方法で、本来明らかにしてはいけない情報を明らかにさせる手法も開発されている。

一方、GPT-4は、ここ1～2年の間にユーザーがOpenAIに提供してくれた、たくさんの悪意のあるプロンプトをもとに学習させたものだ。これらにより、新しいモデルは、”事実性、操縦性、ガードレールから外れることを拒否する”という点で、以前のモデルよりはるかに優れた性能を示す。

OpenAIの説明によると、GPT-3.5（ChatGPTを搭載）は新しいトレーニングアーキテクチャの「試験運用」であり、その教訓を新しいバージョンに適用したところ、「前例のないほど安定した」状態になったそうだ。また、その能力をより予測できるようになったため、驚きが少なくなったという。

4.GPT-4はより長い文書が取り扱える

これらの大規模な言語モデルは、何百万ものWebページや書籍などのテキストデータで学習されるが、実際にユーザーと会話する際には、「頭に入れておける」量に限界がある。GPT-3.5や旧バージョンのChatGPTでは、その限界が4,096「トークン」で、これは約8,000語、本の4～5ページ分くらいに相当する。そのため、そこまで “後戻り”してしまうと、注意機能が働かなくなる。

GPT-4の最大トークン数は32,768（2¹⁵）となる。これは64,000語、50ページのテキストに相当し、劇や短編小説を1本作るのに十分な量だ。

つまり、会話や文章を作成する際に、最大で50ページほどを記憶しておくことができるのだ。つまり、20ページ前のチャットの内容を覚えていたり、物語やエッセイを書くときに、35ページ前の出来事に言及したりすることができるということだ。

5.GPT-4は英語以外の精度が大幅に向上

AIの世界は英語を話す人が多く、データからテスト、研究論文まで、すべてがその言語で書かれている。しかし、もちろん大規模な言語モデルの能力は、どのような書き言葉でも適用可能であり、それらで利用できるようにする必要がある。

GPT-4は、イタリア語からウクライナ語、日本語まで26の言語で、数千の選択式問題に高い精度で答えることができることを実証し、そのための一歩を踏み出した。GPT-4は、ロマンス語とゲルマン語を最も得意としているが、他の言語にもよく適応する。

そもそもテスト基準が英語から翻訳されているし、多肢選択式の問題は普通の会話を表現するものではない。これは、GPT-4が非英語圏の人々にもっと親しみやすいものになる可能性を物語っている。

GPT-4と前モデルとの違いは、まだまだたくさんあるが、そのほとんどは、より繊細で技術的なものだ。今後、ユーザーが最新の言語モデルを使いこなすことで、さらに多くの発見があるはずだ。

GPT-4は、OpenAIの有料サービスChatGPT Plusで提供され、開発者向けのAPIでまもなく利用できるようになり、おそらくすぐに無料デモが開始されるだろう。