データに円グラフを使うべきでない理由がここにある

The Conversation
投稿日 2024年1月8日 11:23
3d pie chart

私たちの生活はますますデータ主導になっている。私たちの携帯電話は私たちの時間やインターネットの使用状況を監視し、オンライン調査は私たちの意見や好みを判別する。これらのデータ収集は、私たちがどれだけよく眠れたか、あるいは私たちが何を買いたいかを知るために使われている。

数字は日常生活でより重要になってきているが、人々の計算能力は遅れをとっている。例えば、オーストラリアでは、12年生で高等・中級数学を履修する生徒の割合が、ここ数十年減少している

一般人がビッグデータや数字を理解するために、私たちはしばしば円グラフのような視覚的なサマリーを使用する。しかし、数字に疎い人は数字を避けるが、数字に強い人の多くは円グラフを避ける。その理由がここにある。

円グラフとは?

円グラフ(英語では、pie chart)は、数値のパーセンテージを表す円形の図である。円はスライスに分割され、各スライスの大きさは、それが表すカテゴリーに比例します。スライスされたパイに似ており、さまざまな方法で「盛り付ける」ことができることから、この名前が付けられた。

下の円グラフの例は、前回の選挙前のオーストラリアの二大政党支持率を示しており、労働党が55%、連合が45%となっている。半円に近い2つの円は、比較的拮抗したレースを示しており、これは円グラフの便利な例である。

円グラフの何が問題なのか?

カテゴリーが2つ以上になると、円グラフは簡単にパーセンテージを誤魔化し、読みにくくなる。

下の3つの円グラフはその良い例で、5つのエリアのうち、どれが一番大きいかを判断するのは非常に難しい。円グラフが円形であることは、各領域に共通の基準点がないことを意味する。

円グラフは、カテゴリーがたくさんある場合にもうまくいかない。例えば、COVIDデータの可視化に使用されたデータ・ソースに関する研究からのこのチャートは、1つの円グラフの中に何百ものカテゴリーを示している。

小さなスライス、明確なラベルの欠如、万華鏡のような色彩は、誰にとっても解釈を難しくする。

色覚異常者にとってはなおさら難しい。例えば、これは重度色覚異常や緑色光に対する感度が低下している人にとって、上のチャートがどのように見えるかをシミュレーションしたものである。これは最も一般的な色覚異常で、人口のおよそ4.6%が罹患している。

円グラフを立体化すると、さらに悪くなる可能性がある。これはデータのひどい誤魔化しにつながる。

下の図では、黄色、赤、緑の部分はすべて同じ大きさ(3分の1)だが、角度やどのスライスをパイの底に置くかによって違って見える。

では、なぜ円グラフはどこにでもあるのか?

円グラフの問題点はよく知られているが、円グラフはどこにでもある。学術論文、博士論文、政治調査、書籍、新聞、政府報告書。オーストラリア統計局でも使われている。

統計学者は何十年もの間、円グラフを批判してきたが、この論理に反論するのは難しい:「円グラフがそんなに悪いものなら、なぜこんなにたくさんあるのか?

円グラフがそんなに悪いものなら、なぜこんなにたくさんあるのだろう?“人気があるから人気がある”のかもしれない。

円グラフに代わる良い方法は?

小さなスペースで大きなデータを効果的に要約し、なおかつクリエイティブな配色を可能にするシンプルな修正がある。

それは地味な棒グラフだ。上の5つのカテゴリーを使った脳を刺激する円グラフの例を覚えているだろうか?同じ例を棒グラフにすると、どのカテゴリーが一番大きいかが一目瞭然だ。

直線的な棒グラフは、円グラフの非直線的なセグメントよりも目に優しい。しかし、3D効果を加えることで、地味な棒グラフをより面白く見せようとする誘惑には気をつけよう。すでに見たように、3Dチャートは知覚をゆがめ、参照点を見つけにくくする。

下の図は、1992年のアメリカ大統領選挙の有権者数を世帯収入別(15,000ドル未満から75,000ドル以上まで)に分けた、標準的な棒グラフと3Dの代替図である。3Dバージョンを使って、最も所得の高いカテゴリーに属する各候補者の有権者数を知ることができるだろうか?簡単にはわからない。

円グラフは使ってもいいのか?

円グラフの最悪の例をいくつか示して、論点を整理してみた。円グラフは、カテゴリーがいくつかあり、パーセンテージが異なる場合、例えば、大きなカテゴリーと小さなカテゴリーが1つずつあるような場合には、問題ないことがある。

全体として、円グラフは控えめに使うのがベストであり、特に、棒グラフという、より「消化しやすい」代替案がある場合はなおさらである。

円グラフを見るたびに、私たちは次の2つのうちのどちらかを考える。作成者は自分たちが何をしているのか分かっていない、または自分たちが何をしているのか分かっていて意図的に誤解を与えようとしているのではないか、ということをだ。

グラフの要約は、データを簡単かつ迅速に伝えることを目的としている。もし、あなたがそれを洗練させる必要性を感じているのであれば、意図せずして理解を減らしている可能性が高い。


本記事は、Adrian Barnett氏とVictor Oguoma氏によって執筆され、The Conversationに掲載された記事「Here’s why you should (almost) never use a pie chart for your data」について、Creative Commonsのライセンスおよび執筆者の翻訳許諾の下、翻訳・転載しています。



この記事が面白かったら是非シェアをお願いします!


  • beamo subhero
    次の記事

    体温、心電図、聴診器、SpO2の測定が可能なデバイス「BeamO」をWithingsが発表

    2024年1月8日 14:57
  • 前の記事

    世界最速のスパコンFrontier、搭載GPUのわずか8%でGPT-4並みの1兆パラメータモデルを実行

    2024年1月8日 7:54
    Frontier Supercomputer

スポンサーリンク


この記事を書いた人
The Conversation

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

おすすめ記事

  • average

    「平均値」は科学研究に革命をもたらしたが、それへの過度の依存は差別と傷害につながった

今読まれている記事