世の中には疑似相関というものがいくつも存在します。
相関関係がみられることで、一見因果関係があるかのように見えるものが、実は無関係だったりするのです。
擬似相関とは
擬似相関(Spurious relationship、Spurious correlation)は、実際には2つの事象に因果関係がないのに、見えない要因である潜伏変数によって、因果関係があるかのように推測されてしまうケースのことを言います。
まずは、非常にわかりやすい例から見ていきましょう。
ある街ではアイスクリームの売上が最も高い時期に、プールでの溺死事故が最も多かった。そこでアイスクリームの売上増が、プールでの溺死増の原因になったのではないかという主張があった。
さすがに、これはおかしい、アイスクリームの売上が上がることによって、プールでの溺死が増えるわけがない、どうみても因果関係もなにもないはずであるとすぐにわかると思います。
実際は、アイスクリームの売上が上がったのも、プールでの溺死が増えたのも、猛暑が原因だと考えるのが妥当です。
この場合、猛暑が見えない要因、つまり潜在変数になっていて、アイスクリームの売上増とプールでの溺死増があたかも因果関係があったように見えてしまうのです。
ウソじゃないけど、間違いのニセ相関
「理系か文系かということと、指の長さの間には相関関係があります。理系の人たちは人差し指が薬指より短く、文系の人たちは同じぐらいだという人が多いのです。」
この文章は事実であり、ウソではありません。
実際にそうなのであるから、「理系か文系か」ということと「指の長さの違い」という2つの間には、相関関係があるのです。
しかし、実はこの2つの量の間には、「男性」という潜在変数が隠れているのです。
つまり、「理系か文系か」ということと「指の長さの違い」は、「男性」という潜在変数を介しての疑似相関、見せかけの相関となっていて、直接の関係である因果関係はないのです。
もし、人差し指が薬指よりも短いのであれば、それは理系だからというのではなく、男性だからなのです。
ニセ相関を見抜き、潜在変数、主張の間違いを見つけよう
いくつか、ニセ相関をご紹介しますので、隠れた潜在変数、主張の間違いがわかるでしょうか。
日本人男性は体重が重いほど年収が高い
日本人男性とその年収には相関関係があります。体重が重い人ほど、年収が高い傾向にあるのです。
ビールの販売を制限すれば水難事故が減る
ビールの販売額と水難事故の件数の間には相関関係があります。ビールの販売を制限すれば、水難事故が減るかもしれないのです。
灯りをつけたまま寝ると近視になる
灯りをつけたまま眠る習慣がある若者は、その後、近視になる可能性が高いので、灯りを決して眠るように指導すべきである。
子供の靴のサイズを見ればその子の読解力がわかる
靴のサイズが大きい子供は、文章の読解能力が高い。だから足をみることでその子の読解力がわかります。
図書館をつくると薬物犯罪が増える
図書館が多い街ほど、違法薬物の使用による検挙数が多い。だから街にもう1つ図書館を作ったら、薬物使用の犯罪が増えるかもしれないのです。
ニセ相関の答え合わせ
「日本人男性は体重が重いほど年収が高い」の潜在変数は年齢
日本男性は歳を重ねるごとに体重が増える傾向があり、さらに年収が上がる傾向にもある。
「ビールの販売を制限すれば水難事故が減る」の潜在変数は季節・気温
水難事故は夏に多いが、ビールもまた暑くなる夏によく売れる。
「灯りをつけたまま寝ると近視になる」の潜在変数は両親の近視
これは、ちょっとわかりずらかったかもしれません。
両親が近視だと子供も近視になる傾向がある。また両親が近視の親は子供が眠るときに灯りをつけている傾向があることがわかった。
「子供の靴のサイズを見ればその子の読解力がわかる」の潜在変数は年齢
子供は成長するに従い、靴のサイズが大きくなっていきますし、文章の読解力も上がってくる傾向にあります。
「図書館をつくると薬物犯罪が増える」の潜在変数は人口密度
人口が多ければ、それに比例して犯罪の検挙数が多くなりますし、図書館をはじめとした公共施設も多くなってきます。