統計データは、いろいろな医学薬学論文でも出てきて、数字が示されると妙に説得力が増したりしてくるものですが、いろいろな問題があるのです。
きちんとした公平なモノサシが不可欠
もし、きちんとした統計と言うことであれば、きちんとしたモノサシが必要になります。
例えば、あるものを評価するときに5段階に分けるとします。
そのモノサシが客観的な数字ででてくるものであるのではなく、主観で評価していたら、評価する人によってその評価は変わってきてしまいます。
だからこそ、統計データを見るときは、その背景まできちんと精査する必要があるのです。
同じことでも違った結果になる統計
統計、特にアンケート調査などは、同じようなアンケートでも、かなり違った結果が出てくる場合があります。
例えば、内閣支持率でも、NHKの調査と、朝日新聞の調査と、読売新聞の調査と、毎日新聞の調査とではその支持率、不支持率が全然違ってくるといったことがあります。
場合によっては、倍近く違ってきてしまうことがあります。
数パーセントの違いならともかく、もう誤差というレベルではないですが、なぜこのようなことが起こるのでしょうか。
- これには大きく3つの原因が考えられます。
標本によるバイアス
観測・調査方法の違い
集計・分析方法の違い
これらによって、大きく違ってくるのです。
標本によるバイアス
アンケートの対象に、偏りがあると、それに結果も影響されてしまいます。
アンケートの対象者の多くが高齢者であったとか、男性であったとか、ある地域の人が多く偏っていたとか、与党支持者が多かったなどということがあれば、そこのバイアス(偏り)がかかってしまいます。
もちろん、意図的にそういう人たちを選んでアンケート取ったというのであれば論外ですが、たいていの場合は、無作為抽出によりアンケート対象を選びます。
しかし日本国民全員にアンケート取れば別ですが、その中の1000人とかいうレベルであれば、どうしてもバラつきがでて当然なのです。
観測・調査方法の違い
これは、アンケートの調査質問や集計法により違ってくるということです。
同じ質問をしたとしても、その質問の順番であったり、その前後に何か意図的に誘導するような文章が記載されていたりすれば、当然結果もそれに作用されます。
例えば、「今の内閣は●●●をしてきて、海外では評価されてきました」などという文章が入っていれば、結果も肯定的な結果になりやすくなります。
さらに、質問の順番が違うだけでも、その前の質問でもつイメージに引っ張られることがあります。
集計・分析方法の違い
また、選択肢についても、「大変そう思う」「そう思う」「どちらともいえない」「そう思わない」「全然そう思わない」「わからない」といった形にしたときと、「大変そう思う」「そう思う」「そう思わない」「全然そう思わない」と4択にしたときだと変わってきます。
これをさらに、「大変そう思う」と「そう思う」を合わせるなどして「そう思う」か「そう思わないか」で集計すれば、さらに変わってきてしまいます。
実際のアンケートにおいては、さらに問題があります。
しっかりとアンケ―トを取ったのか、回答者がすべて真面目に答えているとは限りません。
冷やかし半分に適当にいい加減な回答している可能性もあります。
統計データ、特にアンケートともなると、いろいろな要素によって左右され、ちょっとしたことで結果が変わってきます。
統計的に言うと、1000人程度にアンケートして、それが日本の民意を正確に反映しているとは言い難いのです。
アンケートの集計結果を見るときは、ざっくりとした傾向を見るという感じでいいのかもしれません。