世界で2番目に優秀な言語モデル「Inflection-2」が発表、一部テストではGPT-4を上回る

masapoco
投稿日
2023年11月25日 14:58
1700665923 inflection2 web 1 crop

Inflectionは、新しい言語モデル「Inflection-2」を発表したが、同社によればこのInflection-2は、GoogleのPaLM-2やClaude 2など競合他社の言語モデルを上回り、GPT-4に次ぐ世界第二位の性能を持つとのことだ。

Inlectionによれば、この新モデルは、前作である「Inflection-1」よりも大幅に強力であり、事実に関する知識、スタイル制御、推論能力が大幅に向上してると述べている。

Inflectionの第1弾大規模言語モデル「Inflection-1」は2022年7月にリリースされ、GPT-3.5やPaLM-540Bとほぼ同等の性能を持っていたが、同社はInflection-2にて、OpenAIが提供する不動の1位であるGPT-4に追いつくことを目指している。

Inflection-2は、5,000台のNVIDIA H100 GPUを使用し、約10²⁵ FLOPsでfp8の混合精度でトレーニングされた。これにより、GoogleのフラッグシップモデルであるPaLM 2 Largeと同じトレーニングクラスに位置づけられるが、Inflection-2は、MMLUベンチマークを含むほとんどの標準AIパフォーマンステストでPaLM 2 Largeを上回っているとのことだ。

Inflection-2は、HellaSwag、TriviaQA、GSM8kなどの言語テストでも優れた成績を収めている。GPT-4と比較して、Inflection-2はHellaSwag 10-shotで89.0のスコアを記録し、GPT-4の95.3に迫っている。さらに、Inflectionは、最新のLLMがCoT(思考連鎖)推論、つまり最適化されたプロンプト処理でClaude 2を上回ると述べている。

コーディングや数学のタスクではGPT-4に及ばないものの、例えばMetasのLlama 2よりも優れた性能を発揮している。Inflection-2はコーディングに最適化されていないため、将来のモデルで改善の余地があるとInflectionは述べている。

Inflection-2は、同社のPiチャットボットで近々使用される予定である。PiはPi.ai/talkでテストできる。インフラはNVIDIA A100からH100 GPUにアップグレードされ、AIモデルによる入力の処理が高速化される見込みである。1750億パラメータを持つにもかかわらず、Inflection-2はInflection-1よりも安価で高速になるとされている。

Inflectionは、22,000台のGPUクラスターの全容量を使用して、さらに大きなモデルをトレーニングする計画を立てており、次のAIモデルは約10倍の大きさになり、約6ヶ月後にリリースされる予定だ。安全性と責任に関して、Inflectionはホワイトハウスの2023年7月のコミットメントに自発的に署名している

Inflectionは、LinkedInの創設者Reid Hoffman氏、DeepMindの共同創設者Mustafa Suleyman氏、元DeepMind研究者Karén Simonyan氏によって設立され、2022年3月に公開された。同社は、自然言語をコンピュータへの個人的なインターフェースとして使用することに焦点を当てている。

2022年5月、Inflection AIは2億2500万ドルの投資ラウンドを締結し、2023年6月にはMicrosoft、Reid Hoffman氏、Bill Gates氏、Eric Schmid氏、NVIDIAが合計13億ドルを投資する別の投資ラウンドを発表した。当時、同社の評価額は40億ドルであった。

このスタートアップの発表以来、Meta AIのHeinrich Kuttler氏や、Google Brainの元所属であるMaarten Bosma氏とRewon Child氏などのAI研究者がInflection AIに参加したとされている。元DeepMindおよびGoogleのプロダクトマネージャーであるJoe Fenton氏は、Inflection AIの製品開発とビジネスモデルの開発を支援している。


Source



この記事が面白かったら是非シェアをお願いします!


  • th youtube logo min
    次の記事

    YouTubeの読み込みが遅いのはブラウザのせいではなく広告ブロッカーのせいだった

    2023年11月25日 16:19
  • 前の記事

    Intelの次世代Arrow Lakeは、XMXを搭載した新しい「Xe-LPG Plus」GPUアーキテクチャを採用

    2023年11月25日 10:29
    Intel Meteor Lake Arrow Lake Lunar Lake Hot Chips 34 35
この記事を書いた人
masapoco

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です


おすすめ記事

  • openai

    OpenAI、15秒の音声サンプルから感情豊かで自然な音声を合成できる「Voice Engine」を発表

  • a04c35e8e555c1cc7ae1d6a5f3159856

    MicrosoftとOpenAI、1000億ドル以上をかけて超人的AI開発のためのスーパーコンピューター「Stargate」を開発する計画

  • Sam Altman TechCrunch SF 2019 Day 2 Oct 3 cropped cropped

    ベンチャーキャピタリスト、OpenAIのSam Altman氏を“誇大妄想的”と非難

  • google logo image

    Googleが非営利団体を対象に2000万ドルの資金を提供し生成AI活用を支援

  • Pixel 8 in Rose.max 936x936.format webp

    Google、方針を転換しPixel 8にもGemini NanoによるオンデバイスAI機能を搭載へ

今読まれている記事