一口に検定といっても、いろいろな検定法がありますが、検定とは何をやっているのでしょうか。
ある統計に対して、有意差があるかどうかを調べるときに検定が行われますが、どんな意義があるのでしょうか。
検定とはどういうことなのか
例えば日本で街を歩いていたときに、身長が2mの人をみかけたとします。
すると、その人は外国人ではないのかなと思ったりします。
日本人の平均身長は、男性でも170cmなので、2mというとそれに比べてかけ離れた身長なので、日本人ではないんじゃないかと思ったのですが、これが検定の原理になります。
つまり、平均170cmの日本人が街を歩いている中で、2mの人を見かけるという確率がかなり小さなことが思ったため、その2mの人は日本人ではなく、外国人ではないかという仮説を立てたことになります。
検定でくじのいかさまを検証
検定を身の回りのわかりやすい事例で説明すると、くじ引きが説明しやすいかもしれません。
よく商店街などで行われるくじですが、なんかあやしいと思ったことがある人もいると思います。
当たりくじが入っていないんじゃないかとか、ウソの広告をしているのではないかということです。
くじの福引で3分の2が当たりという広告につられて、3回福引をしたけど、3回ともはずれてしまった場合、はたして福引が当たる確率は実際は3分の2より小さいのではないかということを有意水準5%で検定するというような場合に、検定が用いられます。
検証ですが、福引のくじが実際に当たる確率をθとします。
そして差がないとする『帰無仮説(null hypothesis)』は、福引が当たる確率が3分の2ということと差がないとするので、確率は3分の2になります。
一方、逆に差があるとする『対立仮説(alternative hypothesis)』は、3分の1になります。
3回とも外れる確率は、1回外れる確率が3分の1なので、その3乗となり、27分の1、つまり0.037になります。
帰無仮説が正しいという仮定のもとで、実際に起こった出来事がどれくらいの確率で起こるかを計算したのが、0.037、つまり3.7%と小さな値になるので、帰無仮説、つまり福引が当たる確率が3分の2であるという広告が疑われるわけです。
有意水準5%とは
さて『有意水準5%』とはどういうことかというと、同じような調査を行った場合、5%つまり20解に1回は得られた結果が間違っているというレベルかどうかということになります。
実際に帰無仮説で検証した結果、3.7%となり、これは5%よりも小さいので、帰無仮説は間違っていて、対立仮説が採択となるわけです。
もしこれが、2回福引して2回ともはずれた場合は、2回とも外れる確率は、3分の1の2乗なので、9分の1となり、0.111、つまり11.1%となり、5%とよりも大きくなるので、帰無仮説を棄却することはでず、帰無仮説が採択されます。
その場合の判断は、福引が当たる確率は3分の2より小さいとはいえないということになります。