統計での4つの尺度 | 薬剤師トピックス

統計学を学習するときに、データをいうものが非常に重要になってくるのですが、このデータを考えたときに、それが量的データなのか、質的データなのかを考えることは大切になってきます。

量的データと質的データ

『データ(data)』とは何かというと、特定の項目に関する通史の集まりになります。

統計学の最初に、データの意味を理解し、量的データか質的データかを区別うる理由は、このデータのタイプによって使える分析手法が違ってくるからです。

『量的データ』は、数量として意味のあるデータでになります。

『量的データ』にはどんなものがあるのかというと、年齢、テストの点数、購入量、値段、評価スコアなどといったように数量として表せるものになります。

『質的データ』とは、カテゴリや順位を表すデータになり数量としての意味がないデータになります。

『質的テータ』の具体例は、単に分類や区分するためのデータなどで、個人情報でいうと年齢などが量的データになるのに対して、血液型とか趣味とかなどが質的データになります。

4つのデータ尺度

まずはデータが量的データなのか質的データなのか見極めることが大切なのですが、量的データも質的データもそれぞれ2つに分類され、合わせると計4つに分類することができます。

『量的データ』、『比率データ』と『間隔データ』に分類することができ、『質的データ』は、『順位データ』と『カテゴリーデータ』に分類することができます。

それぞれの尺度の具体例

『比率データ』は、質量・長さ・時間・絶対温度・金額などというように、物理量や金額などを数値で表してデータで、この比率データを測るのが『比率尺度』になります。

つまり、gやm、秒、円、ドルなどというものが比率尺度になります。

『間隔データ』は、数値で表されるデータですが、数値の0が絶対的な意味を持たずに、数値の差だけに意味があるもので、代表的なものに年齢や知能指数があります。

これらを測るのが『間隔尺度』になります。

『順位データ』の例としては商品の満足度などがあり、大満足が5、満足が4、どちらでもないが3、不満が2、大いに不満が1といったような5段階で答えるアンケート結果などがそれに当たり、これらの測定尺度になるのが『順位尺度』です。

『カテゴリーデータ』は、比率データでも間隔データでも順位データでもないもの全てということになり、これを表現するための分類基準が『名義尺度』になります。

『名義尺度』にはどういったものがあるかというと、性別・血液型・氏名・住所・電話番号などといった個人情報は全て名義尺度になります。

よく勘違いされるのが、男性を1、女性を2として表せば、1と2の数値になるので、量的データになるのではないかということなのですが、このように分類した1と2は、数値としての意味はなく、単なる記号と同じになるので、量的データではなく、質的データになり名義尺度になるのです。

最新情報をチェックしよう!