第1回:尺度水準

  • 尺度水準の考え方に基づけば、データは、名義尺度・順序尺度・間隔尺度・比率尺度の4つに分類できることを知ること
  • 与えられたデータがどのような尺度に属するか分類できるようにすること
  • 尺度によって、適用することが可能な統計的手法が異なることを確認すること
  • にわかにはどの尺度に属するか決められない例もあることを知ること

データには様々な尺度があります。そのデータの特性を把握し尺度を使い分けることで、データを適切に分析することが出来ます。尺度には大きく分けて名義尺度・順序尺度・間隔尺度・比率尺度の4つがあります。

  • 名義尺度はただデータを分類しただけの尺度であり、順序は存在しません。
    • 例えば、性別は基本的には「男性・女性」のいずれかに分類出来ますが、男女という性別自体に順序は存在しません。
  • 順序尺度はデータに順序をつけた尺度です。この時、データ同士での順序は定められますがその間の間隔が一定とは限りません。
    • 例えば競技の順位等で1位が2、3位を大きく引き離してゴールし、2、3位は接戦だった場合がありますが、この時1、2、3位間の成績は一般に一定ではありません。
  • 間隔尺度はデータ間に順序があり、またその間隔も一定である尺度です。この時、データの平均や標準偏差は求められますが、0となる点が恣意的であるためデータ同士に比例関係はありません。このことは場合によって0となる点が異なることを考えれば確かめられます。
    • 例えば温度(摂氏)は間隔尺度ですが、「摂氏30度は15度の2倍暑い」と言うことは出来ません。0点の取り方が異なる温度の基準には華氏があります。
  • 比率尺度は間隔尺度へ更に数値間の比率の等しさを加えた尺度です。この時、0となる点は「何も無い」点として一意に定められます。
    • 例えば競技の得点や時間は比率尺度になります。

後の尺度はそれより前にある尺度を包含しているため、書いた順に尺度に対して使える演算は増えます。

まとめると次のようになります。

  • 名義尺度…最頻値のみ
  • 順序尺度…上記+中央値
  • 間隔尺度…上記+平均や偏差・相関等
  • 比率尺度…上記+幾何平均・調和平均まで求められます。

データを収集する際には、そのデータがどれだけの範囲において有効か考える必要があります。

例えばセンター試験は大抵の大学受験生のその時点での英語力を測るには有効です。しかし零点や満点等、端点にいる学生の英語力を測ることは難しくなります。極端な話、英国で10年過ごした帰国子女と英語を中学からよく勉強した一般人はともにセンター試験で満点を取ったとしても、両者の英語力には差が見られると十分に考えられます。

収集したデータの性質を良く知ることで、適切な手法を考えることが出来ます。

尺度を混同してしまうと、本来は許されない演算を行ってしまう場合があるため、注意しなければなりません。

比率尺度と間隔尺度の混同にはさほど問題はありません。何故なら標準偏差等統計でよく使われる手法は間隔尺度でも用いることが出来るからです。

間隔尺度と順序尺度の混同は問題を引き起こす場合があります。平均や標準偏差を順序尺度に用いてしまったため正しい分析とならない、ということがしばしば見られるからです。例えば評価基準が等間隔であるとは保証されていないため、アンケートの五段階評価の数値を平均するのは好ましくありません。このような誤った手法は論文においてよく見られますが、平均ではなく順序尺度でも使える中央値や最頻値を用いるべきです。

実際の研究で扱うデータを適切に分析するためには、それぞれの尺度の意味と計算を正確に理解する必要があります。(文責:ほしたべよ)

  • 尺度水準における4つの尺度とは何でしょうか。
  • 平均・分散が適用できるのは、何尺度以上でしょうか。
  • 平均が適用できない尺度の場合、平均の代わりに何を代表値とすればよいでしょうか。