非営利団体LAION(Large-scale Artificial Intelligence Open Network)は、「Open Empathic」という新しいオープンソースプロジェクトを立ち上げた。このプロジェクトの目的は、AIシステムに共感と感情的知能を装備することで、人間の感情に対する理解と反応を向上させることだという。感情的知能は、AI主導の世界で人間の感情を理解し、それに応答するために不可欠なものだ。
LAIONは、テキストから画像を生成する画像生成ジェネレーター「Stable Diffusion」に用いられているデータセット「LAION-5B」データセットの構築で知られている。オープンソースのこのデータセットと同様に、彼らは感情検出機能をすべての開発者に提供したいと考えている。
LAIONの創業者であるChristoph Schuhmann氏は、TechCrunchの取材に対し、「ヘルスケア、教育、機械学習研究のバックグラウンドを持つLAIONチームは、オープンソースコミュニティにギャップを感じた。LAIONの誕生につながった、透明性のないAIの独占に対する懸念と同じように、私たちはここでも同じような緊急性を感じた」と、語っている。
LAIONは、感情知能AIシステムの潜在的な利点をいくつか挙げている:
- 教育:AIシステムは学習者の感情的なニーズや性格に適応し、前向きな学習環境を作り出すことができる。
- 心理学研究:AIモデルは心理学研究において客観的で信頼できるツールとして機能し、心理学的介入方法の改善に役立つ。
- メンタルヘルス支援:感情的知性により、AIシステムは、特に孤立した人々や患者、高齢者に対し、共感的な同伴を提供し、孤独感を和らげることができる。
- 倫理的意思決定:人間の感情や価値観を考慮した倫理的な意思決定をAIシステムが行えるようにする。
- エンターテインメント業界に革命を起こす:例えばゲーム業界やオーディオ・コンテンツやビデオ・コンテンツの制作において、感情知能は人とさまざまなメディアとの新たな相互作用を可能にする。
Open Empathicプロジェクトは、人間の感情を「理解」するAI、例えばチャットボットや音声合成モデルを作成することが目標としている。そのために、データベースに音声クリップを提出するボランティアを募集している。興味のある方は、音声トラックに含まれる感情を記述する音声アノテーションを投稿することができる。
また、このプロジェクトのために、LAIONはボランティアがYouTubeクリップを注釈付けするウェブサイトが作成し、公開している。各クリップに対して、詳細なフィールドを記入することができ、その中にはクリップの書き起こし、オーディオとビデオの説明、クリップ内の人物の年齢、性別、アクセント、覚醒レベル、および価値レベル(「快適さ」対「不快さ」)などが含まれる。実際のプロセスは以下のビデオにて解説されている:
フォームの他のフィールドは、クリップの音質と大きなバックグラウンドノイズの有無に関係する。しかし、最も注目されるのは、その人の感情、少なくともボランティアが感じる感情である。
ドロップダウンメニューの配列から、ボランティアは、”さえずり”、”爽やか”、”魅惑的 “から “内省的”、”魅力的 “まで、個々の、あるいは複数の感情を選択することができる。
「多種多様な言語を理解し、異なる文化的背景を真に理解できるAIモデルを訓練することに照準を合わせています。私たちは、実際の感情や表情を映したビデオを使って、言語や文化を “理解する “モデルの作成に取り組んでいます」と、LAIONのオープンソース・コントリビューターで、ボーンマス大学の博士課程に在籍するKari Noriy氏はTechCrunchの取材で述べている。
LAIONは、今後数ヶ月で約10,000のサンプルを収集し、来年には10万から100万のサンプルを収集することを目指している。このプロジェクトは、AIモデルとデータセットを民主化するというビジョンに駆り立てられたコミュニティメンバーによって支えられている。
Sources
コメントを残す