AIと仕事の未来 - 5人の専門家が語る、ChatGPT、DALL-E、その他のAIツールがアーティストやナレッジワーカーに意味するもの

蒸気や電気からコンピュータやインターネットに至るまで、技術の進歩は常に労働市場を混乱させ、ある仕事を押し出す一方で、別の仕事を生み出してきた。しかし、人工知能は、アーティストやナレッジワーカーといった新たな職種に影響を与える変曲点を迎えている。

特に、大規模言語モデル（膨大な量のテキストで学習させたAIシステム）の出現は、コンピュータが人間らしく聞こえる文章を作成し、説明的なフレーズをリアルな画像に変換できるようになったことを意味する。The Conversationでは、5人の人工知能研究者に、大規模言語モデルがアーティストやナレッジワーカーにどのような影響を与えそうなのかについて尋ねている。そして、専門家が指摘するように、この技術は完璧とは言い難く、誤報から剽窃まで、人間の労働者に影響を与える多くの問題を提起している。

各回答は以下の通りだ。

すべての人に創造性を – しかし、スキルの喪失は？

テネシー大学副学長 Lynne Parker氏

大規模言語モデルによって、創造性や知識労働が誰にでもアクセスできるようになりった。インターネットに接続できる人なら誰でも、ChatGPTやDALL-E 2のようなツールを使って自己表現したり、テキストの要約を作成するなどして、膨大な情報を理解することができるようになったのだ。

特に注目すべきは、大規模言語モデルが示す人間らしい専門知識の深さである。ビジネスプレゼンテーション用のイラストの作成、マーケティング資料の作成、執筆困難の克服、指定された機能を実行するための新しいコンピュータコードの生成などを、人間の専門家が行うような品質で、わずか数分で行うことができるようになったのだ。

もちろん、これらの新しいAIツールは人の心を読むことはできない。ユーザーが求める結果を得るためには、テキストプロンプトという形で、よりシンプルで新しい人間の創造性が必要なのだ。人間とAIのコラボレーションの一例である反復プロンプトによって、AIシステムは、プロンプトを書いた人間が満足する結果が得られるまで、連続したアウトプットを生成する。例えば、最近開催されたコロラド州フェアのデジタルアーティスト部門の優勝者（人間）は、AIを搭載したツールを使って創造性を発揮したが、それは筆や色や質感を見極める目を必要とするようなものではない。

創造性と知識労働の世界を誰にでも開放することには大きな利点があるが、こうした新しいAIツールにはマイナス面もある。まず、今後とも重要なヒューマンスキル、特にライティングスキルの喪失を加速させる可能性がある。教育機関は、フェアプレーと望ましい学習成果を確保するために、大規模言語モデルの許容される使用法に関するポリシーを作成し、実施する必要があるだろう。

第二に、こうしたAIツールは、知的財産権保護にまつわる問題を提起する。人間の創造者は、建築物や他人の著作物、音楽、絵画など、世の中に存在する人工物から常にインスピレーションを受けているが、著作権で保護された、あるいはオープンソースの学習例を大規模言語モデルが適切かつ公正に使用できるかについては、未解決の問題が残っている。現在進行中の訴訟でもこの問題が議論されており、今後の大規模言語モデルの設計と利用に影響を与える可能性がある。

社会がこうした新しいAIツールの意味を理解するにつれ、一般の人々もそれを受け入れる準備が整ってきたように思われる。チャットボットChatGPTは、画像生成ツールDall-E miniなどと同様、すぐにバイラル化した。このことは、創造性の未開発の大きな可能性を示唆しており、創造的で知識労働をすべての人が利用できるようにすることの重要性を示している。

不正確な情報、偏見、剽窃の可能性

コロラド大学ボルダー校コンピュータサイエンス准教授 Daniel Acuña氏

私は、コンピュータコードの作成を支援するツールであるGitHub Copilotを常用しており、ChatGPTやAI生成テキスト用の同様のツールで数え切れないほどの時間を費やして遊んできた。私の経験では、これらのツールは、これまで考えもしなかったようなアイデアを探求するのに向いている。

私の指示を首尾一貫したテキストやコードに変換するモデルの能力には、感心させられたものだ。自分のアイデアの流れを改善する新しい方法を発見したり、知らなかったソフトウェアパッケージで解決策を見出したりするのに役立っている。また、これらのツールが生成するものを見れば、その品質を評価し、大きく編集することができる。全体として、クリエイティブの水準を高めてくれるものだと思っている。

しかし、いくつか懸念もある。

そのひとつが、大小さまざまな不正確さだ。CopilotやChatGPTでは、アイデアが浅すぎないか、例えば、中身のないテキストや効率の悪いコード、間違った例えや結論、動かないコードなど、明らかに間違っているアウトプットを常に検証する必要がある。もしユーザーがこれらのツールが生み出すものに対して批判的でなければ、ツールは有害である可能性がある。

最近、Metaは科学的テキスト用のGalactica大規模言語モデルを停止した。それは「事実」をでっち上げるが、非常に自信に満ちた響きがあったからだ。自信満々に聞こえる虚偽でインターネットを汚染する可能性があると懸念されたのである。

もう一つの問題は、バイアスだ。言語モデルは、データの偏りを学習し、それを再現することができる。このバイアスは、テキスト生成では見えにくいが、画像生成モデルでは非常に明確である。ChatGPTの開発者であるOpenAIの研究者たちは、モデルが反応する内容について比較的注意を払っているが、ユーザーは日常的にこのガードレールを回避する方法を見つけ出している。

Here are all the ways to get around ChatGPT's safeguards:

[1/n]
— Davis Blalock (@davisblalock) December 13, 2022

もう一つの問題は、盗用だ。最近の研究では、画像生成ツールは他人の作品を盗用することが多いことが分かっている。ChatGPTでも同じことが起こるのだろうか？私は、それはわからないと思っている。もしかしたら、このツールは学習データを言い換えているのかも知れない。私の研究室では、テキストの剽窃検出ツールは、言い換えを検出することに関しては、かなり遅れていることが分かっている。

これらのツールは、その可能性を考えると、まだ発展途上のものだ。今のところ、現在の限界を解決する方法があると私は考えている。例えば、生成されたテキストを知識ベースと照合したり、大規模な言語モデルからバイアスを検出・除去する最新の手法を用いたり、より洗練された剽窃検出ツールに結果をかけたりすることができるだろう。

人間が凌駕することで、ニッチで「手づくり」な仕事が残る

ミシガン大学地域情報学部教授外山健太郎氏

私たち人間は、自分たちが特別な存在であると信じたいものだが、科学技術はその確信が誤りであることを繰り返し証明してきた。道具を使うのも、チームを組むのも、文化を広めるのも、かつて人間だけだと思われていたが、科学は他の動物もこれらのことをそれぞれやっていることを明らかにした。

一方、認知的な作業には人間の脳が必要だという主張も、技術によって次々と打ち破られてきた。最初の加算機が発明されたのは1623年である。今年、コンピュータで作られた作品がアートコンテストで優勝した。私は、コンピュータが人間の知能と出会い、それを超える瞬間、「シンギュラリティ（技術的特異点）」は目前に迫っていると考えている。

機械が人間よりも賢く、クリエイティブになったとき、人間の知性や創造性はどのように評価されるのだろうか。おそらく連続性があるのだろう。ある分野では、たとえコンピュータの方がうまくできても、人間が何かをすることに価値を見出す人もいる。IBMのディープ・ブルーが世界チャンピオン、ガルリ・カスパロフを倒してから四半世紀が経つが、人間のチェスは、そのドラマとともに、まだ消えてはいないのだ。

それ以外の領域では、人間の技術はコストがかかり、余計なお世話になると思われるだろう。例えば、イラストレーション。読者は、雑誌の記事に添えられたグラフィックが人間によって描かれたものか、コンピュータによって描かれたものかをほとんど気にしていない。もしコンピュータがうまく描けたとして、読者はクレジットラインにメアリー・チェンやシステムXと書いてあるかどうかを気にするだろうか？イラストレーターは気にするだろうが、読者は気にしないかもしれない。

もちろん、この問題は白か黒かではない。多くの分野では、ホモ・サピエンスが幸運なニッチを見つけつつも、仕事の大半はコンピューターによって行われるというハイブリッドになるだろう。製造業を考えてみよう。今日、その多くはロボットによって達成されているが、機械を監督する人間もおり、手作りの製品の市場も残っている。

AIの進化によって、より多くの仕事が消え、人間だけの技術を持つクリエイティブ・クラスの人々が豊かになるが、その数は減り、クリエイティブな技術を持つ人々が新たなメガリッチになることは、歴史が示すとおりほぼ確実だ。もし、明るい兆しがあるとすれば、まともな生活ができない人がさらに増えれば、人々は暴走する不平等を抑制する政治的意思を持つようになるかもしれないということだろう。

古い仕事はなくなり、新しい仕事が生まれる

フロリダ国際大学コンピューターサイエンス准教授 Mark Finlayson氏

大規模言語モデルは洗練された順序補完機械である。一連の単語（”I would like to eat an …”）を与えると、”… apple. “のような補完候補を返す。ChatGPTのような大規模言語モデルは、記録的な数の単語（数兆語）で学習され、その補完の現実性、広さ、柔軟性、文脈依存性で、多くのAI研究者を含む多くの人々を驚かせている。

あるスキルを自動化する強力な新技術と同様に、この場合、多少汎用的ではあるが、首尾一貫したテキストの生成は、そのスキルを市場で提供する人々に影響を与えることになる。何が起こるかを考えるには、1980年代初頭にワープロソフトが導入されたときの影響を思い起こすと良いだろう。タイピストのような特定の仕事は、ほとんど完全に姿を消した。しかし、その一方で、パソコンがあれば誰でも簡単に、きちんとしたタイピストの文書を作成できるようになり、生産性が大きく向上した。

さらに、履歴書によく書かれるMS Officeのように、それまで想像もつかなかった新しい仕事やスキルが登場した。また、ハイエンドのドキュメント制作の市場も残り、より高性能で高度な専門性を持つようになった。

これと同じパターンが、大規模言語モデルにもほぼ確実に当てはまると思われる。一般的な文章を作成するために、他の人に原稿を依頼する必要はなくなるのだ。一方、大規模言語モデルは、新しい働き方を可能にし、まだ想像もつかないような新しい仕事にもつながっていくだろう。

そのために、大規模言語モデルの欠点を3つだけ考えてみよう。まず、望ましい出力を得るためのプロンプトを作成するには、かなりの（人間の）知恵が必要だ。プロンプトを少し変えるだけで、出力が大きく変わることがある。

第二に、大規模な言語モデルは、警告なしに不適切な出力や無意味な出力を生成する可能性がある。

第三に、AI研究者が知る限り、大規模な言語モデルは、何が真か偽か、何かが正しいか間違っているか、何が単なる常識か、といった抽象的で一般的な理解を持っていない。特に、比較的簡単な計算もできない。つまり、その出力は、思いがけず誤解を招いたり、偏ったり、論理的に間違っていたり、あるいは単に間違っていたりすることがあるのだ。

このような欠点は、クリエイティブワーカーやナレッジワーカーにとってはチャンスである。多くのコンテンツ制作では、たとえ一般読者向けであっても、人間のクリエイティブワーカーやナレッジワーカーの判断が依然として必要で、機械の出力を促し、導き、照合し、キュレートし、編集し、特に補強する必要がある。専門的で高度な技術を要する言語の多くは、当分の間、機械の手に負えないままであろう。また、新しいタイプの仕事も生まれるだろう。たとえば、社内で大規模な言語モデルを微調整して、特定の市場に向けた特殊なテキストを生成するような仕事をする人たちだ。

つまり、大規模言語モデルは、クリエイティブな仕事に携わる人々や知識労働者に混乱をもたらすが、この強力な新しいツールに適応し、統合しようとする人々には、まだまだ多くの貴重な機会が待ち受けているのである。

技術の飛躍が新たなスキルを生む

コロラド大学アンシュッツ・メディカル・キャンパス生物医学情報学教授 Casey Greene氏

テクノロジーは仕事の本質を変えるが、ナレッジワークも同じである。過去20年間、生物学と医学は、高速で安価なDNA配列決定などの分子特性解析の急速な進展と、アプリ、遠隔医療、データ解析などの医療のデジタル化によって変容を遂げてきた。

テクノロジーの進歩の中には、他よりも大きく感じられるものもある。Yahoo!はWorld Wide Web（WWW)の黎明期に、人間のキュレーターを配備して新興コンテンツのインデックスを作成した。Web上のリンクパターンに埋め込まれた情報を利用して検索結果に優先順位をつけるアルゴリズムの登場は、検索のあり方を根本的に変え、今日の人々の情報収集のあり方を一変させた。

OpenAIのChatGPTのリリースは、もう一つの飛躍を意味する。ChatGPTは、チャット用にチューニングされた最先端の大規模言語モデルを、ユーザビリティの高いインターフェースに包んでいる。10年にわたる人工知能の急速な進歩を、指先ひとつで実現することができるのだ。このツールは、カバーレターを書くことができ、ユーザーが選択した言語スタイルで一般的な問題に対処することを指示することができる。

Googleの登場でインターネット上の情報を探すスキルが変わったように、言語モデルから最適なアウトプットを引き出すために必要なスキルは、望ましいアウトプットを生み出すプロンプトやプロンプトテンプレートの作成が中心になるだろう。

カバーレターの例では、複数のプロンプトが可能である。「仕事のためのカバーレターを書いて」というプロンプトは、「データ入力スペシャリストのポジションのためのカバーレターを書いて」よりも一般的なアウトプットを生成することができる。また、職務経歴書や履歴書、具体的な指示（例えば、「細部へのこだわりを強調する」など）の一部を貼り付けることで、さらに具体的なプロンプトを作成することができるだろう。

多くの技術的進歩と同様に、広くアクセス可能なAIモデルの時代には、人々の世界との関わり方が変わっていくだろう。問題は、社会がこの瞬間を公平性を高めるために利用するか、それとも格差を悪化させるために利用するかということだ。

本記事はThe Conversationに掲載された記事「AI and the future of work: 5 experts on what ChatGPT, DALL-E and other AI tools mean for artists and knowledge workers」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。