池にいるコイの数を数えよといったときに、正確な数は数えることはできませんが、統計学的な考え方をすれば良いのです。
世論調査なども、特定のサンプル数を抽出し、それをもって全体の数値や割合を割り出していきます。
例えば、法案Aに賛成か反対かどちらでもないといったアンケートを数千人に行い、それから日本全体の数を割り出していく方法です。
もちろん、バイアスがかかっていたら正確な値はでてこないので、いかにバイアスがあまりかかっていない状態のサンプルを抽出できるかがカギになります。
池にいるコイ
池にいるコイも、池に行き、コイを何匹か捕獲します。
そのコイに印をつけてリリースします。
印をつけてコイをリリースし、そのコイが他のコイと十分池の中で混ざったころあいを見計らって、再びコイを捕獲します。
その割合から池全体のコイの数を推定するという方法です。
例えば、池全体のコイの数をN匹とし、最初に10匹のコイを捕まえて印をつけ、池にリリースしたとします。
再びコイを捕獲したところ、12匹捕獲したうち3匹に印がついていたとします。
すると、母集団N匹に対して10匹に印をつけてリリースした段階で、池にいる印をつけたコイの割合は、10/Nになります。
その後12匹捕獲したうち3匹に印がついていたとするならば、このサンプルの中で印がついたコイの割合は3/12になります。
もし、池の中のコイが、印がつけたコイだけどこかに固まっているとかではなく、均一に分布していたとするならば、10/N=3/12が成り立ちます。
すると、N=40となり、池のコイは約40匹と推定できます。
統計はすでに取られている
マイナンバーカードで国民を管理していくというようなことい関して、信用ならぬ国に嫌悪感を抱いている人も多いと思います。
しかし、私たちはもうすでの、多くの情報を管理されているのです。
今では情報社会となり、何をするにもスマホがなければ不便な時代になってしまいました。
例えば、ネットやLINEもやらないという人でも、携帯電話としては使っていたりします。
携帯電話がだんだんと、ガラケからスマホに移行し、便利ということで位置情報などをONにしたりもします。
さすがにそのスマホを持っているのがあなただということまではわかりませんが、リアルタイム人口統計などに利用されています。
スマホで管理されている
よく主要駅の人出や、人の移動に関連したニュースが出たりしますが、これは別に街角に人が座って、通行人の数をカチャカチャとカウンターでカウントしているわけではありません。
携帯電話やスマホの情報をもとに調べられていて、携帯単発のもつビッグデータが利用されているのです。
今や、スマホなしでは1日も生活ができないという人が増えているくらい、老若男女問わず、ほとんどの人がスマホを持っている時代になっています。
携帯電話の基地局は、端末に電話やメールを着信させるために、エリア内の携帯電話を定期的に把握しています。
リアルタイム人口統計などでは、これらから電話番号などの個人情報を識別できる情報を消去した上で、基地局内の携帯電話の台数を数えます。
その数字をもとにして、各携帯電話事業者のシェアを掛け合わせ、国勢調査による人口統計も参考にし、エリアの人口を推計しているのです。
実際に、携帯端末を用いた人口統計データは24時間365日、10~15分ごとに提供されています。
このシステムを使って、主要駅の昼間の人口であったり、移動人口を出しているわけで、性別や年代別といった属性別にも処理することができ、町づくりや、防錆計画、商圏調査などにも利用されているのです。