Googleが25周年を迎える：検索エンジンは情報へのアクセス方法に革命をもたらしたが、AIに耐えられるか？

今日はインターネットの歴史において重要な節目である、Googleの25回目の誕生日なのだ。毎日何十億もの検索クエリが送信され、私たちが検索エンジンなしで生活していたことを思い出すのは難しい。

Googleが情報アクセスに革命をもたらした理由は何だったのだろうか？人工知能（AI）はGoogleを時代遅れにするのか、それとも強化するのか？

高度なAIとGoogle検索がますます密接になっていく中で、私たちの情報へのアクセスがどのように変化してきたのか、そしてどのような方向に向かっていくのかを見てみよう。

1950年代：コミュニティの拠点としての公共図書館

第二次世界大戦後の数年間、戦後成功した都市とは、市民的機能を提供できる都市であり、情報へのオープンなアクセスを含むものであることが一般的に受け入れられるようになった。

1950年代、欧米諸国では、情報は主に地域の図書館によって提供されていた。図書館員自体が一種の「人間検索エンジン」だった。彼らは企業からの電話問い合わせに応じ、手紙に応じ、人々が情報を素早く正確に見つけられるよう手助けした。

図書館は単に本を借りるだけの場所ではなかった。親が健康情報を探しに行く場所であり、観光客が旅行のヒントを求める場所であり、企業がマーケティングのアドバイスを求める場所でもあった。

検索は無料だったが、図書館員のサポートが必要で、かなりの労力とカタログ主導のプロセスが必要だった。今では数分で解決できる質問でも、数時間、数日、あるいは数週間かかっていたのだ。

1990年代：有料検索サービスの台頭

1990年代までに、図書館はパーソナルコンピューターと情報サービスへのオンラインアクセスを含むまでに拡大した。図書館が高額な購読サービスを通じて情報にアクセスできるようになったことで、営利目的の検索会社が繁栄しました。

これらのシステムは非常に複雑で、訓練を受けた専門家でなければ検索できず、消費者は結果に対して対価を支払っていた。1960年代にロッキード・マーティンで開発されたダイアログは、その最たる例である。現在では、「140を超える査読付き文献データベース17億件以上」へのアクセスを顧客に提供しているという。

もうひとつの商業的検索システムであるFinancial Times紙のFT PROFILEは、5年間にわたって英国のすべての新聞記事へのアクセスを可能にした。

しかし、このシステムでの検索は簡単ではなかった。ユーザーは、特定の単語を使って返される文書のリストを減らし、コレクションを選択するためにタイプしたコマンドを覚えなければならなかった。記事は日付順に並べられ、読者は最も関連性の高い項目をスキャンすることになる。

FT PROFILEは、ビジネス界以外の人々にも貴重な情報を迅速に提供したが、その代償は大きかった。1990年代のアクセス料金は1分1.60ポンドで、現在の4.65ポンド（848円）に相当する。

Googleの台頭

1993年のWorld Wide Web開始後、Webサイトの数は飛躍的に増加した。

図書館は一般にWebアクセスを提供し、ビクトリア州立図書館のビックネットのようなサービスは、組織向けに低料金でアクセスを提供した。図書館員は、利用者にオンラインで情報を検索し、ウェブサイトを構築する方法を教えた。しかし、複雑な検索システムは、爆発的に増加するコンテンツ量と新規利用者の多さに苦戦を強いられた。

1994年、ニュージーランドのコンピューター科学者3人が執筆した『Managing Gigabytes』という本が、この問題に対する解決策を提示した。1950年代から研究者たちは、高速で誰もがアクセスでき、関連性によって文書を分類する検索エンジンを想像していた。

1990年代、シリコンバレーの新興企業がこの知識を応用し始めた。Larry PageとSergey Brinは、『Managing Gigabytes』の原則をGoogleの象徴的なアーキテクチャの設計に用いた。

1998年9月4日のローンチ後、Google革命は動き出した。検索ボックスのシンプルさと、検索されたページがクエリにどのようにマッチしているかを要約した斬新な結果表示が人々に支持された。

機能面において、Googe検索が効果的だった理由はいくつかある。ページ内のWebリンクをカウントして結果を出すという革新的なアプローチを採用していた（PageRankと呼ばれるプロセス）。さらに重要なのは、そのアルゴリズムが非常に洗練されていたことだ。検索クエリをページ内のテキストにマッチさせるだけでなく、そのページにリンクしている他のテキスト（これをアンカーテキストと呼ぶ）にもマッチさせたのである。

Googleの人気は、AltaVistaやYahoo! Searchといった競合をあっという間に追い抜いた。現在、市場シェアの85％以上を占め、最も人気のある検索エンジンであり続けている。

New favourite fact: the earliest known use of google as a transitive verb was in Buffy the Vampire Slayer, 2002. pic.twitter.com/qvAgQw4QRz
— Daniel Benneworth-Gray (@gray) April 13, 2020

しかし、Webが拡大するにつれ、アクセスコストが争われるようになった。

現在、消費者はGoogleを無料で検索しているが、特定の記事や書籍をダウンロードするには支払いが必要だ。一方、図書館自身は、無料で提供する資料を購入するコストの上昇に苦しんでいる。

次の25年はどうなるのか？

Googleは検索の枠をはるかに超えて拡大してきた。Gmail、Googleドライブ、Googleカレンダー、Pixelデバイス、その他のサービスは、Googleのリーチが広大であることを示している。

GoogleのBardや最近発表されたGemini（ChatGPTの直接の競合）を含むAIツールの導入により、Googleは再び検索に革命を起こそうとしている。

Googleが生成AI機能を検索に導入し続けるにつれて、自分で情報を探すのではなく、結果ページの上部にある簡単な情報要約を読むことが一般的になるだろう。重要な課題は、生成されたアウトプットを盲目的に信頼するほど人々が満足しないようにすることである。

オリジナルの情報源と照らし合わせるファクトチェックは、これまでと同様に重要であり続けるだろう。結局のところ、我々はChatGPTのような生成AIツールが「幻覚」や誤った情報によって見出しを飾ったのを見てきた。

不正確な、あるいは不完全な検索サマリーが修正されなかったり、さらに言い換えられたり、ソースなしで提示されたりすれば、誤報の問題は悪化するばかりだ。

さらに、AIツールが検索に革命を起こしたとしても、アクセスには革命を起こせないかもしれない。AI産業が成長するにつれ、コンテンツへのアクセスは有料、あるいは有料購読を通じてのみという方向にシフトしつつある。

AIの台頭は、パブリックアクセスとますます強力になる商業団体との間の緊張関係を見直す機会を提供する。

本記事は、Mark Sanderson氏、Julian Thomas氏、Kieran Hegarty氏、Lisa M. Given氏らによって執筆され、The Conversationに掲載された記事「Google turns 25: the search engine revolutionised how we access information, but will it survive AI?」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。