AIは世界をどのように「見る」のか？貧困を識別するためにディープラーニング・モデルを訓練して判明した驚くべき事実

貧困を緩和するための援助を最も効果的に行うには、最も必要としている人々がどこにいるのかを知る必要がある。多くの国では、家計調査でこれを行うことが多い。しかし、このような調査は頻繁に行われるものではなく、対象地域も限られている。

最近の人工知能（AI）の進歩は、貧困やその他の人間開発指標を測定する方法を一変させた。私たちのチームは、深層畳み込みニューラルネットワーク（DCNN）として知られるAIの一種を用いて衛星画像を調査し、家計調査に近い精度で貧困の種類を特定した。

このAI技術の利用は、例えば土地利用が急速に変化している発展途上国などで役立つ可能性がある。AIは衛星を使って監視し、援助が必要な地域を発見できる可能性がある。これは、地上調査に頼るよりもはるかに迅速だろう。

さらに、我々のディープラーニング・モデルが作り出した夢のような画像は、AIがどのように世界を視覚化するかについてのユニークな洞察を与えてくれる。

DCNNは、視覚イメージの処理や分析に一般的に使用される高度なAIアルゴリズムの一種である。その名前に含まれる「ディープ」は、データが処理される複数のレイヤーを意味し、より広範なディープ・ラーニング・テクノロジー・ファミリーの一部となっている。

今年初め、我々のチームはDCNNを使って重要な発見をした。このネットワークは最初、ImageNetリポジトリにある膨大な数のラベル付き画像で訓練された。ネットワークが様々な物体を認識することを学習したこの初期段階の後、私たちは人口の多い場所の昼間の衛星画像を使って微調整を行った。

私たちの研究結果は、この特殊な訓練によって強化された DCNN は、衛星画像から貧困レベルを正確に評価するという点で人間の能力を超える可能性があることを明らかにした。具体的には、AI システムは、人間が高解像度の画像を分析するよりも高い精度で、低解像度の昼間の衛星画像から貧困レベルを推定する能力を実証したのだ。

このような習熟度は、チェスや囲碁のエンジンが常に人間の棋士を凌駕しているように、他の領域におけるAIの超人的な成果と呼応する。

学習段階が終了した後、我々はDCNNが衛星画像からどのような特徴を「高富裕」を示すものとして識別しているかを理解するための探索に取り組んだ。このプロセスは、私たちが「ブランク・スレート」と呼ぶ、識別可能な特徴のないランダムなノイズだけで構成された画像から始まった。

段階的に、モデルはこのノイズ画像を「調整」する。各調整は、モデルが前の画像よりもより豊かな場所の衛星画像とみなす方向への移動である。これらの修正は、モデルの内部理解と訓練データからの学習によって行われる。

調整を続けるうちに、最初はランダムだった画像は徐々に、モデルが自信を持って裕福さを示すと分類する画像へと変化していく。この変化は、衛星画像においてモデルが富と関連付ける特定の特徴、パターン、要素を明らかにしたため、啓示的なものとなった。

このような特徴には、道路の密度、都市部の配置、あるいはモデルの訓練中に学習されたその他の微妙な手がかりが含まれる（ただし、これらに限定されない）。

上に示した一連の画像は、我々の研究において重要な役割を果たしている。これはタンザニアのある村のベースライン衛星画像から始まり、私たちのAIモデルは、おそらく道路や建物がまばらに存在することから「貧しい」と分類している。

この仮説を検証し確認するために、私たちはその後の画像を徐々に修正し、建物や道路などの特徴を追加していく。これらの画像は、AIモデルによって知覚される富と発展の増加を表している。

この視覚的な進行は、道路や家などを追加するにつれて、AIがどのように「豊かさ」を視覚化しているかを示している。私たちがモデルの「理想的な」富のイメージから推測した特徴（道路や建物など）は、モデルの富の評価に実際に影響を及ぼしている。

このステップは、AIの意思決定プロセスにおいて重要であると考えられる特徴が、実際に、より高い富の予測に対応していることを確認するために不可欠である。

そのため、画像を繰り返し調整することで、結果として得られる視覚化は、ネットワークが「考える」富の姿へと徐々に進化していく。この結果はしばしば抽象的または超現実的である。

上の画像は、DCNNに「高い富」から連想するものを尋ねたところ、白紙の状態から生成されたものである。これらの画像は幽玄な質を持っており、典型的な日中の衛星写真とは似ても似つかない。しかし、”塊”や “線”が存在することから、道路や街路によって相互接続された住宅群があることがわかる。青い色調は沿岸地域を暗示しているのかもしれない。

夢のような画像

この方法にはランダム性が内在している。このランダム性によって、視覚化の試みはそれぞれユニークなイメージを生み出すが、ネットワークが理解する基本的なコンセプトはすべて同じである。

しかし、これらのビジュアライゼーションは、富の客観的な表現というよりも、むしろネットワークの「思考プロセス」の反映であることに注意することが重要である。これらはネットワークの訓練によって制約を受けており、人間の解釈と正確には一致しない可能性がある。

AIの特徴の視覚化は、ニューラルネットワークに関する興味深い洞察を提供する一方で、人間の知覚と理解を反映する機械学習の複雑さと限界を浮き彫りにするものであることを理解することは極めて重要である。

貧困を理解することは、特に地理的あるいは地域的な背景において、複雑な試みである。従来の研究では、貧困の個々の側面に焦点が当てられてきたが、衛星画像を活用したAIは、地域の貧困の地理的パターンを浮き彫りにする上で大きな進歩を遂げた。

既存の貧困調査を補完し、より的を絞った効果的な介入策の立案に役立つ空間的なニュアンスのある視点を提供するという点で、貧困評価におけるAIの真の価値はここにある。

本記事は、Ola Hall氏、Hamid Sarmadi氏、Thorsteinn Rögnvaldsson氏らによって執筆され、The Conversationに掲載された記事「How AI ‘sees’ the world – what happened when we trained a deep learning model to identify poverty」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。