第2回:データの可視化

  • 人間にとって読みとりやすいグラフとそうでないグラフがあることを知ること
  • 基本的なグラフ(棒グラフ・点グラフなど)が、どのような仕組みでデータを表現しているのかを知ること
  • グラフの表すデータと尺度水準の間の関係が理解できること
  • 余計なものを入れず、必要最低限のデータのみ図示できるようになること

複雑なデータを分かりやすく伝えたいときには、グラフを使うことが必要になってきます。世の中には様々な種類のグラフがありますが、そのすべてが人間にとって分かりやすいわけではありません。適切なグラフを使わないと、かえって伝わりにくくなります。今回は、科学的な論文を書く際に、どのようなグラフを使うと良いのかについて見ていきたいと思います。

グラフが表すもの

グラフについて考える際には、グラフの中でどのような仕組みでデータが表現されているのかを考えることが必要です。

例えば、棒グラフの場合、長さでデータの大小を示しています。円グラフならば、扇形の角度で、全体に占める割合を示しています。

基点が0でない棒グラフが描かれることがしばしばあります。しかし、こうした棒グラフは描いてはいけません。棒グラフは、比率尺度のデータを示すために用いるので、基点の0を記すことに意味があるのです。

グラフを描くときは、データを表すために必要なものだけを描くようにし、余計なものを入れないようにしましょう。棒グラフならば、データの大小を表すには、長さの情報だけあれば十分です。3Dにして奥行きを持たせるというのは蛇足です。

左側に普通の棒グラフ、右側に3D棒グラフが描かれている。
この例では右側のグラフのように奥行きを描く意味は全くありません。かえって値が読み取りにくくなります。左側のように単純な棒グラフにしましょう。

グラフと認知能力

どんなグラフを描いたとしても、それを読み取るのは人間です。このため、他の人が見て分からないようなグラフは、まったく無意味ということになります。見て分かりやすいグラフを描くためには、人間がグラフをどう知覚するかについて知っておくと良いでしょう。

Cleveland & McGill (1985) という論文では、以下で番号が小さいものほど、人間は正確にデータを読み取れると述べられています。

  1. 基点が同じ位置
  2. 基点が異なる位置
  3. 長さ
  4. 角度・傾き
  5. 面積
  6. 体積・色の濃さ・彩度
  7. 色相

これはどういうことでしょうか? 具体的な例を通じて考えてみましょう。例えば、上記の基準では、長さの方が面積よりも正確に読み取れるとされています。ある直線が与えられたとき、その(およそ)2倍の長さの直線を見つけることは簡単です。しかし、ある円が与えられたとき、その(およそ)2倍の面積の円を見つけることは、かなり難しくなります。この点で、長さの方が面積よりも読み取りやすいのです。

上記の基準を知っていると、どのようなグラフが適切で、どのようなグラフが不適切であるかということが分かります。例えば、円グラフは、角度を使ってデータの量を表しています。角度は人間にとってあまり読み取りやすいものではありません。ですので、円グラフは適切なグラフであるとは言えないのです。

上段に3つのよく似た円グラフが並んでおり、下段にそれに対応する棒グラフが並んでいる。円グラフでは違いがよく分からないが、棒グラフでは違いが一目瞭然である。
円グラフと棒グラフでの比率の分かりやすさの違い(Wikipedia Commons 上のPD画像 File:Piecharts.svgを利用)

上の図を見れば一目瞭然でしょう。上段に並ぶ3つの円グラフは、一つ一つの扇の大きさの違いが極めて分かりにくくなっています。これに対して、下段は同じことを棒グラフで表しています。こちらの方がずっと分かりやすくくなっています。

日常ではあまり見かけませんが、以下に挙げるような点グラフというグラフもあります。これは認知的に分かりやすいグラフとされています。棒グラフが棒の長さで量を表すのに対し、点グラフは位置で数量を示すからです。上に挙げた Cleveland & McGill (1985) の基準では、位置の方が長さより分かりやすいのでした。

点グラフが描かれている。X軸は“Speaker”、すなわち話者数を示している。Y軸には言語の名前が10個並んでいる。
点グラフの事例。世界の言語を話者数(単位:百万人)が多い順に10個並べたデータを示しています。

棒グラフを使う前に、代わりに点グラフが使えるか考えてみるとよいでしょう。

図表の載せ方

学術論文に図表を載せるときは、図表のキャプションをしっかり書きましょう。単にタイトルを書くだけでなく、解説を加えるようにします。自分では意味が分かっているつもりでも、他の人からは理解されないということがしばしばあります。「見れば分かる」と思わずに、はっきりと解説の文章を付けましょう。

また、図表の説明をするための英語の語彙もあらかじめ知っておくと便利です。例えば、「軸」は“axis”になるなどということを覚えておきましょう。学術的文章のためのライティングの教科書にはたいてい書いてあるので、それを見るのがよいでしょう。

なお、学術雑誌は基本的に白黒印刷されるので、グラフに色を付けても意味はありません。

  • 棒グラフはなぜ基点が0でなくてはならないのでしょうか。逆に、点グラフが基点が0でなくても良い理由は何でしょうか。
  • なぜ円グラフは適切なグラフとは言えないのでしょうか。
  • グラフに対数軸を用いることには、どのような長所と短所があるでしょうか。
  • 学術論文にグラフを載せるときには、どのようなことに注意しなくてはならないのでしょうか。