1章 データの整理

2章 確率
2.3 独立な事象と条件つき確率
(続)
2.3 独立な事象と条件つき確率
Ω
B
A
A and B
全体の中で B が起きる割合と
A の中で B が起きる割合
条件つき確率 (A の条件下で B が起きる):


P
A
and
B


P
A

B


P
B
|A






P
A
P
A
(一般の)乗法定理:




P
A
and
B

P
A

B



P
B
|A
P
A
例:東京、2日間の昼間の天気
度数(相対度数)
2006年
前日\当日
R
R
52 (14%)
69 (19%)
121 (33%)
N
69 (19%)
174 (48%)
243 (67%)
計
121 (33%)
243 (67%)
364 (100%)
N
計
( R: 雨または雪あり、 N: なし )
A:「前日 R」 B:「当日 R」
P( B | A ) = P( A and B ) / P( A )
= P( RR ) / P( RR or RN )
= (52 / 364) / (121 / 364) = 52 / 121
≒ 43 %
P( B | not A ) = 69 / 243 ≒ 28 %
P( B ) = P( RR or NR ) = 121 / 364 ≒ 33 %
■統計的独立性
(Statistical Independency)
事象
A
A
B
A∩B
事象
B
集合
事象
A ∩ B = φ 互いに排反
確率
事象
P( B | A)
= P(B)
互いに独立
事象 A, B の
統計的独立性:
独立な場合の乗法定理
事象A, B が
統計的に独立な時:
同等条件
事象B, Aの
統計的独立性:
PA  B
P  B | A 
 P B 
P  A
P  A and B   P  A  B 
 P  A P B 
PA  B
PA | B 
 P  A
P B 
例:2回のコイン投げ
1回目\2回目
表
裏
表
P(表表)
=1/4
P(裏表)
=1/4
P(2回目が
表) = 1 / 2
裏
P(表裏)
P(1回目が
=1/4
表) = 1 / 2
P(裏裏)
P(1回目が
=1/4
裏) = 1 / 2
P(2回目が
裏) = 1 / 2
・P(2回目が表|1回目が表) = P(表表) / P(1回目が表)
= 1/2 = P(2回目が表)
・P(2回目が表|1回目が裏) = P(裏表) / P(1回目が裏)
= 1/2 = P(2回目が表)
例:2×2分割表型の標本空間
B
Bc
A
P(AB)
=a
P(ABc)
=b
Ac
P(AcB)
=c
P(AcBc)
1–P(A)
=d
P(B)
1 – P(B)
統計的独立性 ⇔
⇔ ad = bc
P(A)
数値
例
B
Bc
A
1/12
2/12
3/12
Ac
3/12
6/12
9/12
4/12
8/12
a:b=c:d ⇔a:c=b:d
2.4 ベイズの定理
Thomas Bayes (1763)
■条件の入れ替え
(テキスト:■原因と結果の入れ替え)
例:ウィルス感染検査
あるウィルスの感染を簡単に検査できる方法がある。
感染者の 98 % を陽性反応によって検出できる。
ただし非感染者の 5 % でも陽性反応が出る。
対象集団のウィルス感染率は 1 % と推定されている。
検査の結果が陽性になった「ある人」が、
ウィルスに感染している確率を求めよ。
与えられた情報
状態
検
査
感染(A)
非感染(Ac)
陽性
(B)
P(陽性|感染)
= 0.98
P(陽性|非感染)
= 0.05
–
陰性
(Bc)
–
–
–
P(感染)
= 0.01
–
検
査
感染(A)
P(陽性 and 感染)
= P(陽性|感染)
陽性
× P(感染)
(B)
= 0.98 × 0.01
= 0.0098
陰性
(計算可)
c
(B )
P(感染) = 0.01
状態
非感染(Ac)
P(陽性 and 非感染)
P(陽性)
= P(陽性|非感染)
= 0.0098
× P(非感染)
+ 0.0495
= 0.05 × 0.99
= 0.0593
= 0.0495
(計算可)
P(非感染)
= 1 – P(感染)
= 0.99
よって、
P(感染|陽性) = P(陽性 and 感染) / P(陽性)
= 0.0098 / 0.0593 ≒ 0.17
(計算可)
ベイズの定理
PA | B
P B  A 

P B 
P B  A 

c
P B  A   P B  A
P B | AP  A

c
c
P B | AP  A  P B | A P A



  
■一般の場合
事象 A1, A2, …, Ak :標本空間の分割
B
Bc
A1
P(B | A1)
–
P(A1)
A2
P(B | A2)
–
P(A2)
…
…
…
…
Ak
P(B | Ak)
–
P(Ak)
–
–
注) P(Ai)の1つは、1から他の合計を引けば求まる。
一般の乗法定理 P( B ∩ Ai ) = P( B | Ai ) P( Ai ) を用いて
A1
A2
…
Ak
計
P(B)
P(B | A1)
P(B | A2)
P(B | Ak)
B
…
=ΣiP(B | Ai )
×P(A1)
×P(A2)
×P(Ak)
×P(Ai)
求める確率
P B  Ai 
P  Ai | B  
P B 
P B | Ai P  Ai 
 k
 P B | Ai P  Ai 
i 1