(毎週火・木・土曜日は、パートナーエッセイにお付き合いください。)
板倉雄一郎事務所パートナーのK.Shimodaです。
本日も統計の時間がやってまいりました!
“読むだけで数字に対する直感力が身に付く”
「統計のお話し 第10回」をお届けいたします。
============================================
1. 【日常生活編】検定の危うさ
============================================
確率と統計の違いって分かりますか?
学校では「確率・統計」は同時に学ぶものですし、
書籍でもセットで扱うことが多いようです。
なんとなく近いようなイメージがありますよね。
実際、確率と統計は親戚のようなものです。
というのも、確率を考えるときには、統計を知っている必要があり、
逆に、統計を考えるときには、確率を知っている必要があるんですね。
なんだか、ニワトリが先か卵が先か、みたいな話ですが、
その違いはどこにあるのか、を具体的に考えていきます。
■確率的考え方
手元にサイコロがあるとします。
サイコロを投げたとき、起こりうるパターンは6通りで、
1になりうるパターンは1通りなので、
1が出る確率は1/6と言えます。
同様に、2回連続で1が出る確率は1/6 × 1/6 で1/36 です。
■統計的考え方
サイコロを600回投げてみたら、1が出たのは102回だった。
そこからどのような事ことが明らかになるだろうか。
両者の違いのイメージ湧きますでしょうか。
もう一つ例を出します。
■確率的考え方
サイコロを600回投げたら、1が出たのは180回だった。
本来は100前後であるはずなので、偏ったサイコロなのかもしれない。
■統計的考え方
サイコロを600回投げて、1が180回出たので、
このサイコロにはゆがみがあると推測されるが、
どのくらい“ありえない出来事”なのか、具体的に検証してみよう。
このように、
“確率”というのは、
ある出来事の起こりやすさの程度、起こる割合を
数量的に求めるものであり、
“統計”というのは、
ある出来事の結果を元に、その出来事の現在の状況や特徴などを
明らかにしたり、全体像を把握したり、予測したりするものです。
確率の方が実生活になじみは深いと思いますが、
統計には、統計なりの価値があるわけですね。
本日はその最たる例である“検定”を取り上げます。
例えば、ある学校のクラスAとクラスBの同じテストの
数学の平均点が3点異なりました。
クラスAとクラスBに違いはありますか?
というような話に結論を出すのが、検定です。
イメージをつかんでいただくために、
ITAKURASTYLE「思い込み」にあった面白い例を
統計的に見ていきましょう。
再掲になりますが、以下の文章を読んでください。
================================================
1、「私は株価の将来がみえる」と嘘をつき、騙す人を100人集めます。
2、50人ずつ、AとBの2つのグループに分け、
Aグループには、「この企業の株価は明日上がります」と伝え、
Bグループには、「この企業の株価は明日下がります」と伝えます。
3、翌日、株価は、上がるか下がるかのどちらかになりますが、
仮に下がったとすると、
Aグループのメンバーは、「この嘘つきめ!」と去ってゆきますが、
Bグループのメンバーは、「確かに当たったが、まだ信頼できないの
で引き続き検証しよう」と思います。
4、残ったBグループを、25人ずつ、CとDの2つのグループに分け、
Cグループには、「この企業の株価は明日上がります」と伝え、
Dグループには、「この企業の株価は明日下がります」と伝えます。
5、以上を繰り返すことによって信者の「数」は
毎回半数に減少していきますが、
残った者が、イカサマ師を信じる度合いは、増して行きます。
何せ、残ったグループのメンバーにとっては、
彼の言葉は「毎度当たる」わけですから。
6、最後の2人になったあたりで、
「私のように明日の株価が当たるようになりたいかね?
なりたければ、このツボを買いなさい。」
================================================
この内容で、統計的に検定をするとします。
まず、検定という手法は、
あらかじめ、統計結果に関する予想を立てておき、
その予想が正しいかどうかを、得られた情報から判定することです。
この場合だと、
「イカサマ師は明日の株価を当てることができる」
という予想を立てて、これを検定します。
(予想の文章の主語がイカサマ師である時点で
この文章から結果が分かってしまいますね・・・笑)
さて、まず最初に伝えた100人のうち、
Bグループに属する人にとっては、
イカサマ師は明日の株価を当てたことになります。
しかしこの時点では、わかりません。
確率が50%もあるからです。
ところが、これを6回繰り返すと、
最後の一人(or二人)になりますが、
その時点での確率は(1/2)^6≒1.563%になります。
これは、6回連続で株価を当てることができるのは、
1.563%しかないということです。
偶然であれば、1.563%でしか起き得ないことが
起きたわけですから、
言い換えると、98.438%(=1?1.563%)の確率で
イカサマ師は明日の株価を当てられる、という予想は
正しいことになります!
めったに起きないこと(100回に1.5回)が起きたのだから、
これは、正しいと言っても良いのではないだろうか。
ということです。
最後の一人(or二人)にとって、この予想を採択したくなる
気持ちは、“統計的には”分からないこともありません(笑)。
実際、統計の世界では、有意水準(危険率)は
5%か1%に設定されることがほとんどです。
(有意水準というのは、意味の有る水準ということで、
5% or 1%しか起こりえないことがおきたのだから、
この予想は採択(棄却)しようよ、ということです)
他の例を挙げますと、
例えば、サイコロを10回振って、1が6回出たとします。
こういった場合、感覚的には、珍しいなぁと思いますが、
絶対ありえない話ではありませんよね。
統計的に判断する必要がある場合は、
サイコロを10回振って、1が6回出る確率を求めて、
その確率が、有意水準を下回れば、
そのサイコロは偏ったサイコロである、と言えますし、
有意水準を上回っていれば、棄却され、
普通のサイコロがたまたまそういう現れ方をしただけだ、
ということになります。
ここで有意水準について、疑問に思うもいらっしゃる方も
いらっしゃいますよね?
5%にするか1%にするかによって結論が変わってしまうじゃないか!
って。
確かにその通りなんです(笑)。
統計的には、有意水準は5%が良いのか1%が良いのか、というのは
最初に立てた予想内容によって変えるようになっています。
どちらにするかの明確な規則はありません。
イカサマ師の場合も有意水準を5%とした場合は、
約1.5%しか起こらないことが起きたため、
株価を当てられる、という予想を採用し、
結果的に騙されてしまいます。
1%の有意水準にしておけば、怪しいイカサマ師から
身を守る、財産を守ることはできるかもしれません。
しかし、それさえも、もっと巧妙なイカサマ師が現れて、
あなたの財産を脅かす可能性も否定できません。
結局のところ、目の前におきた事実を
適切に判断できる知見こそが、一番大事ですね、
という当たり前の結論になってしまいました。
============================================
2. 【ビジネス編】統計をあなたのビジネスに活かす方法
============================================
検定の考え方はお分かりになりましたでしょうか?
検定は色々な場所で使われています。
医学・薬学系では、投薬したグループと
そうではないグループの比較を行い、
グループ間に有意差(意味の有る差)が有るかどうかを調べます。
工場では、
A工場とB工場の製品の品質に違いがあるかどうかを
統計的に検定できます。
あらゆる事象に対し、
意味の有る差があるかどうか、分からないとき。
それは検定の出番です。是非お試し下さい。
個人的には、こちらの書籍が良く出来ていると思います。
入門 統計解析法(永田靖著 日科技連出版社)
数式にアレルギーがない方は是非。
2007年3月13日 K.Shimoda
ご意見ご感想、お待ちしております!
統計のお話バックナンバー
統計のお話 第9回「統計本の選び方」
次回のパートナーエッセイは3月15日(木)にTakamura氏が担当します。