条件が付いている状況での統計確率的な評価・判断の留意点

条件が付いている状況での統計確率的な評価・判断の留意点
一般に統計的あるいは確率的な判断では、勘違いや錯誤など、注意すべき「落し穴」が多くあります。
ビジネス上の意思決定で確率的な計算に基づく期待値が使われる場合に、「こうすれば期待値(期待効
用)が最大になる」という案が理解しにくかったり直感に反することも少なくないと思われます。人間
の直感は錯覚にとらわれることも多く、一般に人間は確率的な判断が得意とは言えません。たとえば普
通のコイン投げで、表が何回も続けて出れば次は裏が出やすいだろうと思いがちですが、毎回のコイン
投げで出る表裏の確率は過去と独立に一定(50%)なので、これは一種の錯覚です。このような思い違い・
錯誤は、心理学や行動経済学で数多く調べられています。
本文では特に、条件がついている状況での確率的・統計的な判断で注意すべき点を簡単な例を通して
説明します。
1.プロジェクト・アセス用ツールの例
【ストーリー】
Ⅹ社はシステム開発がメイン・ビジネスです。同社では過去の苦い経験を踏まえてプロジェクト案件
を事前にアセスするためのチェックシートを作りました。アンケート調査の形でプロジェクトのプロフ
ァイルをチェックシートの項目に入れると、プロジェクト成否の予想判定が得られる仕組みです。今ま
での経験と勘だけに頼っていた状態を改善し、より適切に危ない案件を回避しつつ、事前の準備や交渉
などでプロジェクト失敗リスクを引き下げることが狙いでした。
Ⅹ社のプロジェクト成功率は 90%(実績値)で、今回導入するチェックシートの事前判定精度は 95%
と見込まれています。
(失敗するプロジェクトの 95%は「失敗」と事前判定され、成功するプロジェク
トの 95%も「成功」と事前判定されます。)
さて、新たにこのチェックシートでプロジェクト案件 a が「失敗」と事前評価された場合、どのよう
に判断すべきでしょうか。
まずは少し計算をしてみましょう。事前評価が「失敗」の意味合いを調べるために、仮想的にⅩ社の
サンプル案件 1000 件を想定すると、実績
から 900 件が成功、100 件が失敗と想定で
図1 失敗判定の的中率は?
きます。
成功判定
95%
(855件)
900 件の成功案件のうち、95%(855 件)
成功案件
は「成功」と判定され、5%(45
件)は「失
(900件)
失敗判定
5%
敗」と誤判定されます。また、失敗案件
誤判定
(45件)
100 件のうち、95%(95 件)は「失敗」と判
サンプル案件
(1000件)
定され、5%(5 件)は「成功」と誤判定され
成功判定
5%
ます。その結果、サンプル案件中「成功」
誤判定
(5件)
失敗案件
と判定されるのは合計 860 件、うち誤判
(100件)
定分(失敗案件の混入)は5件で、860 件
失敗判定
95%
(95件)
の約 0.6%にとどまります。一方、
「失敗」
と判定されるのは合計 140 件で、うち成
功案件のはずの 45 件(約 32%)について
成功判定
失敗判定
合計
誤って「失敗」と判定しています。言い換
成功案件
855
45
900
えると、「失敗」判定の結果を鵜呑みにし
失敗案件
5
95
100
て機械的な判断をした場合は、3分の1近
合計
860
140
1000
くの案件で間違うことになります。
上記の計算例から分るように、このような事前判定の仕組みを利用する際は、一見、判定精度が高そ
うでも鵜呑みの判断は危ないので、事前評価項目でカバーされない要因への目配りなど事前判定の仕組
みを補完する判断も交える必要があります。
CircleWave Corporation, 2011
1
このケースで理解いただきたいことは、条件の付いたパーセント値(確率)をきちんと把握すること
の大切さです。この例での条件とは、
『「失敗」と事前評価されたこと』です。この条件の付いた判定精
度(約 68%)は全体での判定精度 95%を大きく下回りました。単純に考えての判断は誤りやすく、要
注意という訳です。
理論的には、このような条件付確率の計算には「ベイズの定理」が使われます。
図2 条件付確率の参考図
A
A且B
B
ベイズの定理は、
P ( B | A) =
P( A Ù B)
P ( A | B) P( B)
=
P ( A)
P ( A | B) P( B) + P ( A | B)P ( B)
のように式で表わせます。
ここで、
P ( B | A) :事象 A が起こったときに事象 B が起こる確率(条件付確率)
P ( A Ù B ) :事象 A と事象 B が同時に起こる確率(同時確率)
P ( A) :事象 A が起こる確率
P (B ) :事象Bが起こらない確率
P(B) は A が起こる前の確率として「事前確率」、 P ( B A) は A が起きた後の確率として「事後確率」と
呼ばれます。
先のⅩ社のケースについて、上記の式で事後確率を確認してみます。
A:チェックシートで「失敗」と判定
B:プロジェクトが成功
とすれば、
P ( B ) = 0. 9
P ( B ) = 0. 1
P ( A | B ) = 0.05
P ( A | B ) = 0.95
から
P( B | A) = (0.05 × 0.9) (0.05 × 0.9 + 0.95 × 0.1) = 0.321
改めて、約32%もの誤判定が出る背景を考えると、元々X社のプロジェクトの9割は成功し、失敗
するのは1割に過ぎないことがあります。あるプロジェクトが「失敗」と事前評価されたとしても、成
功するはずの多くの案件の誤判定だった可能性を無視できないことが、誤判定の事後確率が高い理由と
いえます。ただ、このような計算は人間の直感に馴染みにくく、しばしば「A だったときの B の確率」
と「B だったときの A の確率」が混同されたりもするので、条件付確率には要注意です。
CircleWave Corporation, 2011
2
2.事務ミス発生の例
もう一つ、条件付確率を考える例を挙げます。
個人情報あるいはセキュリティ管理が求められる情報に関わる事務ミスの一つに、FAXの誤送信の
問題があります。金融機関ではFAX誤送信が起きないようにするため大変手間のかかる対策がとられ
たりしているようですが、果たしてFAX誤送信のリスクはどの程度でしょうか。
A :FAX 送信作業完了(ダイヤルした先に FAX 送信できた状況)
B :正しく FAX 送信先をダイヤル
B :間違えて FAX 送信先をダイヤル
として、事務ミスの予想発生率を1%、着信される FAX 専用番号の比率がダイヤル先の3%とすれば、
P ( B ) = 0.99
P ( B ) = 0.01
P ( A | B ) = 1.0
P ( A | B ) = 0.03
となり、
P ( B | A) = (1.0 × 0.99) (1.0 × 0.99 + 0.03 × 0.01) = 0.999697
となります。
上記では、
事務ミスの予想発生率を1%としましたが、
実際はもっと低いと考えられるので、
仮に 0.1%
とすれば、同様の計算で P ( B | A) は 99.997%となります。別の言い方をすると、実際に起きるミス発
生率は事務ミスの予想発生率よりも2桁小さいと考えられます。ただし、現実の FAX 送信作業で「FAX
番号一覧表」のようなものを参照している場合など、事務手順によっては事務ミスの起こり方も変り、
誤送信の予想発生率が高くなって、実際のミス発生率も高いかもしれません。
このようなミス発生見込とバランスが見合う事務ミス対策の導入は経営的な判断になります。
3.ブラック・スワン
少し抽象的な問題に触れます。「ブラック・スワン」は、タレブが「大きな衝撃をもたらす予期しな
い事象」の象徴として言い出して以来すっかり有名になりました。
「白い白鳥しか見たことがないから、白鳥は白い」などとデータに基づいてものを言う場合、帰納的
推論が使われています。しかし、この白鳥に関する命題は「黒い白鳥」が観測された時点で否定されま
す。一方、白い白鳥のデータだけが存在する限り、もちろん「白鳥は白い」は否定されませんが、「白
鳥は白い」が証明された訳ではありません。「すべての白鳥が白いとは限らない」という命題も否定さ
れていないからです。帰納的論理の本質的に弱いところで、ヒュームの有名な「太陽がこれまで毎朝昇
ってきたという事実は明日も太陽が昇ることの根拠にならない」という懐疑論が生まれる背景です。
また、データが全くなければ、どんな仮説も否定されません。たとえば「宇宙人」について何を言っ
てもデータがないので否定はされないわけです。極端な場合として「データの取りようがない」ような
命題は否定され得ないので科学的な命題とは言い難く、カール・ポパーは反証可能性を科学的な言説の
条件としました。
ブラック・スワンの存在について、ベイズ流の解釈を試みます。
B 0 :すべての白鳥は白い
CircleWave Corporation, 2011
3
B1 :白鳥の1万羽に1羽はブラック・スワンである
A :白い白鳥を1回観測
として、事前確率と事後確率が
P ( B0 ) = 0.5
P ( B1 ) = 0.5
P ( A | B0 ) = 1.0
P ( A | B1 ) = 1.0 - 10 - 4 = 0.9999
とすれば、 B 0 と B1 は背反ではないので P ( A | B0 ) と P ( A | B1 ) の比から考えると、
1万回(=N)白い白鳥が観測された時点で二つの比は、
1 : 0.9999 N = 1 : 0.368
となり、 B 0 の可能性が大きくなっています。さらに多くの白い白鳥が観測されれば B 0 の可能性は一層
高くなりますが、実際にはブラック・スワンはオーストラリアで見つかっているそうです。
前記の計算は、裏付けデータの蓄積が帰納的推論の補強材料とみなせる程度を示したまでで、タレブ
の言わんとしたこと(偶然や不確実性に対する人間の判断の誤り等)は別の話になります。
4.最後に
以上、条件が付いている場合の統計的・確率的な判断の問題について、簡単な例を挙げて説明をしま
した。ビジネス上の判断では、しばしば分からないことや不確かなことをベースに最善を追求しますが、
分からないこと等に対しては数字を無理に決め付けずに確率的な分布を想定して、前記の例で示したよ
うにベイズの定理を応用したベイズ統計学の考え方で分析や判断を行うことがプラクティカルと考え
られます。
前項の例で触れたように、ベイズ流のアプローチも帰納的な論理に基づいていて万能ではなく限界は
あります。それでもベイズ統計の考え方を十分に理解してうまく利用すれば、思い違いや誤った判断を
減らしてビジネスの意思決定の質的向上に役立てることができるはずです。
本文では理論的なことやベイズ統計の詳細には触れませんでしたが、関連のことも含めてさらに詳し
く知りたい方は下記の参考文献(理論面に詳しい学術的な書籍は除外)を参照ください。
【参考文献】
C.R.ラオ「統計学とは何か」丸善、1993
佐伯・松原他「実践としての統計学」東京大学出版会、2000
N.タレブ「まぐれ」ダイヤモンド社、2008
N.タレブ「ブラック・スワン(上/下)」ダイヤモンド社、2009
涌井良幸「道具としてのベイズ統計」日本実業出版社、2009
CircleWave Corporation, 2011
4