よくいろいろな薬が本当に効くのかどうかという場合に、『有意差』という言葉を耳にします。
薬や治療法の効果判定
新薬が出た場合や、新しい治療法が出てきた場合、臨床試験が行われ、それが従来の治療薬や治療法より優れているかどうかが統計学的な手法を用いて証明されます。
この時使われる統計学の手法が検定であり、検定の結果、P値が0.05未満とあれば、統計学的に有意差があったとみなされ、その新薬や新治療法が、従来の治療よりも誰がみても納得できるような差で優れているということになります。
十中八九、違いない差で優れていると判定されることになります。
統計的検定のエラー
統計的というと、何かすごく正確のようなイメージがありますが、データを用いた推測ですので、その推測が間違ってしまうという可能性も多々あります。
統計学的検定によるエラーについては、2種類のエラーがあります。
効果がある薬や治療法であるのにないと判定してしまうエラーと、効果がない薬や治療法であるのにあると判定してしまうエラーです。
前者を2型エラー、後者を1型エラーと言ったりすることもあります。
一般的に、1型エラーは5%以下に抑えなければならないのに対して、2型エラーは20%までなればOKとされています。
エラーはエラーでも罪の重さが違う
実は、同じエラーでも罪の重さが違うのです。考えてみてください。
効果がないのに効果があると判定されて市場に薬が出回ってしまうのが1型エラーになります。
一方、効果があるのに効果がないと判定されて市場に出回らないというのが2型エラーになります。
どちらのほうが重篤な事態をまねいてしまうかというと、1型エラーということはすぐにわかります。
効果がないのにあるとして薬が出回ってしまうと、その薬を信じていつまでも飲み続けることになります。副作用も出てくるでしょうし、効果がないため別の治療を行う機会を逸してしまうことになります。
一方、2型エラーのほうは、効果があるのに薬が出回らないということから、その薬を使って行う治療の機会は逸したことになりますが、従来の治療薬や治療法によりある程度効果があるのであれば、選択肢はあるのです。
もっとも、他に治療薬や治療法がないといった場合は別ですが、通常の場合、別の治療薬や治療法があるのであれば、2型エラーのほうが罪は軽いということになります。
したがって、1型エラーは5%以下に抑えなければならないのに対して、2型エラーは20%までなればOKとなりゆるくなるのです。
喩えるならば、1型エラーは罪なき者を有罪にする誤審であり、2型エラーは罪ある者を無罪にする誤審になり、こう考えるとわかりやすいかと思います。
どちらが許されないかというと、どちらも許されないと思いますが、強いて言うならば、冤罪、つまり1型エラーのほうがダメということになるのでしょう。
まあ、司法の問題に喩えるのは果たして適切かどうかという問題もありますが、医療統計の分野においては、1型エラーは5%、2型エラーは20%というのが一般的になっています。