第2章 確率と確率分布

第2章補足 条件つき確率とベイズの定理
統計学 2006年度
※ 条件つき確率と乗法定理
•
P(E)>0のとき、事象Eの起こることを条件として、事象Fが起こることを、
(Eを条件とする)Fの条件つき確率といい、P(F|E)であらわす。
(例) 5本中2本の当たりのあるくじを、5人で順番に引く。2番目に引く人が
あたりくじを引く確率は?
⇒ この問題に答えるときに、条件つき確率と乗法定理が用いられている。
(解)
1番目の人 当たり A1 はずれ A2
2番目の人 当たり B1 はずれ B2
とする。
1番目の人が当たりとわかったあとで、2番目の人も当たりくじを引く確
率は
○○×××
P( B1 | A1 ) 
1
4
1番目の人がはずれとわかったあとで、2番目の人が当たりくじを引く確
率は
○○×××
P( B1 | A2 ) 
2 1

4 2
よって、2番目の人が当たりくじを引く周辺確率は
P(B1 )  P(A1  B1 )  P(A2  B1 )
 P(A1 )  P( B1 | A1 )  P(A2 )  P( B1 | A2 )
2 1 3 1 1 3 2
      
5 4 5 2 10 10 5
B1
B2
計
A1
A2
計
P(A 1∩B1) P(A 2∩B1) P(B1)
となる。(これは1番目の人がくじを引く前の確率と考えられる)
さらに、次のようなことを考える。
(例) 2番目に引く人があたりくじを引いたとき、1番目に引いた人があたりを
引いた確率は?
(解) 2番目に引く人があたりを引いたという条件のもとで、1番目の人があ
たりを引く条件つき確率なので
P( A1 | B1 )
を求めればよい。
この条件つき確率は
P(A1 | B1 ) 
として求めることができる。
P(A1  B1 )
P(B1 )
これはさらに
P(A1  B1 )
P(A1 )  P( B1 | A1 )

P(B1 )
P(A1 )  P( B1 | A1 )  P(A2 )  P( B1 | A2 )
と変形することによって、
2 1
1

1
5 4
P(A1 | B1 ) 
 10 
2 1 3 1
2 4
  
5 4 5 2
5
と計算できる。
※ ベイズの定理
•
条件つき確率P(A1|B1)は、周辺確率P(A1)と条件つき確率P(B1|A1)を用
いて次のように求めることが可能であった。
P(A1 | B1 ) 
P(A1 )  P( B1 | A1 )
P(A1 )  P( B1 | A1 )  P(A2 )  P( B1 | A2 )
この定理をベイズの定理 という。
ベイズの定理は、A1についての事前確率P(A1)が事象B1がおこったこと
によって、事後確率P(A1|B1)に更新されたと解釈することができる。
(ここでは、1番目の人が当たりを引いた確率が、2番目の人が当たりくじ
を引いたことがわかることによって更新される)
この考え方は、迷惑メールのフィルタなどにも応用されている。
次のような例を考えてみよう (森田優三(1993)『新統計概論』p.361より引用)
(例) ある銀行で貸出金が貸倒れ(返済されないこと)になる確率は5%であ
る。あるとき、この銀行が新しい審査基準を設けた。この審査基準を過去
の借り手に適用すると、貸倒れにおわった借り手の20%はこの審査に合
格、順当に返済した借り手は90%が合格であった。この審査に合格した
新しい借り手が貸倒れにおわる確率はいくらか。
(解)
貸出金が
審査に
とする。
貸倒れ A1
合格 B1
完済 A2
不合格 B2
求める確率はP(A1|B1)である。
例の設定から次のようなことがわかる
P(A1)=0.05、 P(A2)=0.95
P(B1|A1)=0.2、 P(B1|A2)=0.9
ベイズの定理を用いてP(A1|B1)を求めると
P (A1 | B1 ) 

P (A1 )  P( B1 | A1 )
P (A1 )  P( B1 | A1 )  P (A2 )  P( B1 | A2 )
0.05 0.2
0.01

 0.01156
0.05 0.2  0.95 0.9 0.01 0.855
となる。貸倒れの事前確率P(A1)= 0.05が審査という追加情報によって、
P(A1|B1)=0.012という事後確率に更新されたと解釈できる。