自主ゼミ(ベイズの定理).

自主ゼミ(ベイズ統計)
修士2年: 新井雅也 & 小野良太
始めに…
皆さんベイズの定理って知っていますか?
ウォーミングアップ

ガンを診断するための検査法があるとしよう
C : 被検査者はガンであるという事象
 A : 検査の結果、被検査者はガンであるという
事象 → 検査結果が陽性となる事象

例題を考えてみる

問1:


P(A | C)=0.95, P(AC|CC)=0.95であれば、検査法
は一応信頼できるものといえよう。検査を受ける人の
中で、実際にガンの確率がP(C)=0.005のとき、
P(C|A)を求めよ。
問2:

問1において検査の信頼性が0.95ではなく、一般に
R(0<R<1)としよう。P(C)=0.005は変わらないとき、
P(C | A)≧0.90となるためには、Rはどの範囲の値であ
るべきか。
本当に解けるのか?

このままじゃ解けない….
P(C  A)
P(C | A) 
P( A)
すなわち、P(C | A)を求めるにはP(C∩A)を求め
ないといけない
ベイズの定理を使えば、P(C∩A)が
わからなくても推測できてしまう!
確率の定義

ベイズの定理に移る前に、「確率」の定義をしておこう

「確率」とは、標本空間Ωの任意の可測事象Eに対し、
実数P(E)を対応させる関数Pで、以下の3つの公理を
満たす



任意の可測事象Eに対し、P(E)≧0
P(Ω)=1
可測事象 E1, E2 ,... が互いに排反(i≠j なら Ei∩ E =Φ)ならば、
j
  
P  Ei    PEi 
 i 1  i 1
すなわち、P(E)
事象列{E1 , E2 ,...}は事象Eの分割という
条件付き確率式の整理 1/2

条件付き確率の定義
P( A  B)
P( A | B) 
P( B)

ただし、P(B)>0
条件付き確率式の変形

今、Ωの分割 {E1 , E2 ,...}、および任意の事象Fが
与えられたとき、A= Ei 、B=F(P(F)>0)と
おけば、
P( Ei  F )
P( Ei | F ) 
・・・(Ⅰ)
P( F )
条件付き確率式の整理 2/2

今度はA=F、B= Ei とおき、定義を用いて
P ( F  Ei )
P ( F | Ei ) 
P ( Ei )
 P( F  Ei )  P( Ei )  P( F | Ei )
ここで、 P( Ei  F )  P( F  Ei ) であるから
P( Ei  F )  P( Ei )  P( F | Ei )
・・・(Ⅱ)
確率の公理からのP(F)導出
 {E1  F , E2  F ,...} がFの分割であることに注
意すると、

P F    P E j  F 
・・・(Ⅱを利用)
j 1

  P Ei   P F | Ei 
j 1
・・・(Ⅲ)
ベイズの定理の導出

Ⅰ式にⅡ、Ⅲを代入すると
P( Ei | F ) 
PEi   PF | Ei 


j 1
PEi   PF | Ei 
ベイズの定理が導出された!
実際に先ほどのガンの問題を2つ解いてみよう
問題1の解答
C
E

C
,
E

C
,F  A
 ベイズの定理において、 1
2
とすると、
PC   P A | C 
P(C | A) 
PC   P A | C   P C C  P A | C C
0.005  0.95

0.005  0.95  (1  0.05)  1  P AC | C C
 0.08715
  



著しく低いね!!!

問題2の解答
C
E

C
,
E

C
,F  A
 ベイズの定理において、 1
2
とすると、
PC   P A | C 
P(C | A)  0.90 
PC   P A | C   P C C  P A | C C
0.005  R

0.005  R  (1  0.05)  1  R 
  
Rを求めると
R  0.99950
過酷なほど高いね!!

ベイズの定理の応用例

いくつかの壺に赤と白の玉が入っている。玉
を取り出した結果を得たときに、どの壺から
取り出したかを推定したい。
問題

結果Aから原因H1,H2,...,Hkを推定したい。
結果A:玉の色が[白|赤]だった。
 原因Hk:取り出した壺がk番目の壺だった。

どの壺から
取り出した?
原因
壺2
壺1
壺3
結果
事前確率の決定
どの壺から取り出すか事前に確率が決めら
れるか?(例えばこの人は大きい壺が好き、
とか...)
 そういう知識がない時は確率を均等にする。
(理由不十分の原則という)

壺2
壺1
壺3
壺
1
2
確率
1/3
1/3
3
1/3
事後確率の計算

取り出した玉の色からどの壺から取り出した
かという確率を計算する。
(ベイズの定理を利用)
P( H i )  P( A | H i )
P( H i | A) 
 P( H i )  P( A | H j )
壺2
壺1
壺3
実際に計算

壺1

壺2

壺3はいくつ?
1  2
  
4
 3  3
P( H1 |白) 

1  2 1  0 1 1 7
          
 3  3  3  2  3  2
1  0
  
3  2
P( H 2 |白) 
0
1  2 1  0 1 1
          
 3  3  3  2  3  2
確率の更新(ベイズ更新)
今、確率が以下のように更新された。
 もう一度同じ壺から玉を取り出すならば、
こっちを事前確率として使うことができる。

事前確率
事後確率
壺
1
2
確率
1/3
1/3
壺
1
2
確率
4/7
0
3
1/3
3
3/7
繰り返すことでだんだん確率が正確なものになっていく