中国共産党は、同国を代表するハイテク企業4社が構築する大規模言語モデルに、政府としてのお墨付きを与えている。
Global Timesの報道では、Alibaba、Baidu、Tencent、360 Groupらの構築する、4つの大規模生成AIモデルが、中国の公式な“大型モデル基準適合評価“に合格したようだ。この評価は、工業・情報化省傘下の中国電子標準化研究院によって実施されたとのことで、業界におけるAI生成コンテンツ(AIGC)の発展を促進し、コンプライアンス・ディレクトリを作成することを目的とした動きのようだ。
この評価は、多次元モデル評価フレームワークと、大規模モデルの汎化性、知性、安全性を網羅するように設計された指標システムに基づいている。テキスト、スピーチ、ビジュアルコンテンツを含む複数のモダリティをカバーしているとのことだ。
今回発表されたモデルには、BaiduのErnieボットや、大規模AIモデルの最初の発表グループの中で唯一のオープンソースモデルであるAlibabaのTongyi Qianwenが含まれる。
浙江大学国際経営学院のPan Helin教授はGlobal Times紙に対し、政府の規制は後から介入するよりも、先手を打つ方が中国における業界の成長には良いと語った。「将来的に業界を混乱させ、再編成するよりも、最初から規制する方が良いでしょう」。
世界に追いつくことを目指す中国
既に中国には130以上の大規模言語モデルがあり、米国の50%のシェアに次ぐ世界全体の40%を占めているという。
清華大学電子工程学院のDou Dejing准教授によると、中国国内最高のAIモデルはGPT-3.5のレベルに達しており、GPT-4との技術格差は縮まっているという。
BaiduのCEO Robin Li氏は、同社のErnieボット4.0が2023年10月下旬にOpenAIのGPT-4と同等になったと主張している。だが、360 Security Technologyの創業者兼社長であるZhou Hongyi氏は、Global Timesに、ChatGPTは中国の競合より12~18ヶ月先を行っているとの見解を伝えている。
中国共産党は、生成AIサービスが “社会主義の中核的価値観”に基づいていることを要求している。これは、とどのつまりは“検閲”であり、実際の所は中国共産党に都合の悪い知識を削除し、モデルの出力も、例えば“天安門事件”等が出力されないように調整されていることを意味するのだろう。
言語モデルの評価と検証に加え、その政治的見解を反映した言語モデルを訓練するために、1億データポイントの500億トークンのデータセットも公開している。
Sources
コメントを残す