本日、イスラエルのスタートアップ「D-ID」は、広く利用されているデジタルヒューマン・プラットフォームと会話型AI向けの大規模言語モデル(LLM)を融合した新しいチャット「d-id chat」の発売を発表した。D-IDの同名のプラットフォームは、過去2年間で1億人以上の実物そっくりのデジタルヒューマンを生成するために使用されてきた。D-IDのプラットフォームは、誰でも簡単に新しい画像を読み込むことができ、また、さまざまな音声や言語で音声合成が可能なアバターを既存のインベントリから選択することが出来る。
同社は現在、ブランディングや顧客体験を目的に、企業向けにこのAPIを提供している。このAPIの前提は、会話型AIに「人間」のインターフェイスを提供することである。D-IDはプレスリリースで、新しいリアルタイムストリーミング機能とそのテキスト・トゥ・ビデオ技術により、クライアントはGPT-3やLaMDAなどの大規模言語モデルの力を統合し、インタラクティブなデジタルヒューマンを展開できると述べている。
この新サービスにより、開発者は、より人間的で魅力的な方法で消費者と対話できる、写実的なデジタルアシスタントを作成できるようになるだろう。
「GPT-3やLaMDAのような大規模言語モデルは、我々のテクノロジーとの関わり方や対話の方法を変えています。私たち全員が自分専用のAIアシスタントを持つようになる日はそう遠くはないでしょう。私たちは、テクノロジーに顔を与え、より自然なインタラクションを実現することで、テクノロジーに人間味を与えていきます。新興のジェネレーティブAI業界の最先端にあり続けるD-IDを、私はとても誇りに思います」と、D-IDのCEO兼共同創業者のGil Perry氏は声明で述べている。
テキストチャットボットは、消費者がブランドと対話するための一般的な方法であり、D-IDは、ブランドがよりパーソナルでインタラクティブな体験を通じて顧客と関わることができるようになるため、これが新しいAPIの可能な用途を示すと指摘している。
D-IDは、AdobeやOpenAIなど多くの企業が、倫理的かつ責任ある合成メディアの開発、作成、共有のためのフレームワークへの参加を発表したことを受けて、今回の発表を行った。
数カ月前の発表以来、Open AIのChatGPTはインターネットを席巻し、ますます人気が高まっている。このタイミングでD-IDがAIとのインタラクションをより自然に感じさせ、ブランドがトレンドのテクノロジーを活用する手助けをしようとしているのは、当然の流れかもしれない。
Source
コメントを残す