第6回:分布の可視化

  • ヒストグラムと棒グラフは別物であることを理解すること
  • ヒストグラムを正確に描けるようにすること

データを見る際は、単にその平均や分散を見るだけでは、うまくいかないことが多々あります。データの分布を図示して、データがどのようにちらばっているのか、あるいは集中しているのかについて調べることが重要になってきます。

データの分布を図示する方法には、さまざまなものがありますが、ヒストグラムと呼ばれるグラフが、簡便で強力な道具になるでしょう。

ヒストグラムは、形の上では棒グラフと類似していますが、果たす役割は大きく違います。先に述べたように、ヒストグラムはデータ全体の分布を表すグラフです。これに対し、棒グラフは個別のデータそれぞれの数量を示すグラフです。外形も、ヒストグラムと棒グラフとでは異なっています。第一に、ヒストグラムは棒と棒をくっつけて描きますが、棒グラフは棒と棒を離して描きます。第二に、ヒストグラムは面積で量を表しますが、棒グラフは棒の長さで量を表します。ヒストグラムの場合、棒の幅が一定とは限らないため、幅と長さを乗じたものを量として捉えるのです。

  • 棒グラフとヒストグラムの違いについて述べてください。
  • 何か適当なデータ(身長、年収など)を自分で探してきて、その分布を示すためにヒストグラムを描いてください。