スライド 1

ベイジアンネットワーク概説
第3章 ベイジアンネットワークモデルの
数学的基礎
3.1 ベイジアンネットワークモデルの概要
3.2 ベイジアンネットワークモデルの定式化
岩崎唯史
3.1.1 相互情報量による因果の計量化(1)
2変数 x と y の因果の強さを計量化
→ 相互情報量 I(x,y)
I ( x, y )   p( xi , y j ) log
i
j
p( xi , y j )
p( xi ) p( y j )
0
p( xi :) xiの生起確率
p( yi :) yiの生起確率
p( xi , y j :) xiと y jの同時生起確率
※ x と y が互いに独立 → 最小値 I(x,y)=0
3.1.1 相互情報量による因果の計量化(2)
I ( x, y )   p( xi , y j ) log
i
j
p( xi , y j )
p( xi ) p( y j )
  p( xi , y j ) log p( xi )   p( xi , y j ) log p( xi | y j )
i
j
i
j
  p( xi ) log p( xi )   p( y j ) p( xi | y j ) log p( xi | y j )
i
i
j
 H ( x)   p( y j ) H ( x | y j )  H ( x)  H ( x | y )  H ( y )  H ( y | x)
j
H ( x:) xのあいまいさ (エントロピー )
H ( x | y:) yを知ったときの
xのあいまいさ (エントロピー )
相互情報量とは:一方を知ることで他方が何で
あるかについて得られる情報量
3.1.1 相互情報量による因果の計量化(3)
[データ1] x={0,1}, y={0,1}
p( x  1)  0.01
p( y  1 | x  1)  0.8, p( y  0 | x  1)  0.2,
p( y  1 | x  0)  0.8, p( y  0 | x  0)  0.2
• x の値によらず y の確率が一定
→ x と y は互いに独立
• 相互情報量を計算すると I(x,y)=0
→ 因果関係なし
3.1.1 相互情報量による因果の計量化(4)
[データ2] x={0,1}, y={0,1}
p( x  1)  0.01
p( y  1 | x  1)  0.8, p( y  0 | x  1)  0.2,
p( y  1 | x  0)  0.2, p( y  0 | x  0)  0.8
• x の値で y の確率が変化
→ y は x に依存
• 相互情報量を計算すると I(x,y)=0.00356
→ 因果関係あり
3.1.2 因果モデルはなぜ必要なのか
われわれは、因果モデルを用いて将来の事象を予測
し、意思決定を行っている
目的達成のためには、予測精度と効率の高い因果モ
デルが必要
ただし、因果モデルも時には人間の判断を誤らせる
-人間の傾向(Gilovich, 1991)-
• ランダムデータに対し何らかの因果モデルを見出そ
うとする
• わずかなデータから全てを決めてしまう
• 思い込みや願望でものごとを見てしまう
3.2 ベイジアンネットワークモデルの定式化(1)
・ p( X  k | Y  h,  :バックグラウンド情
)
報 , Y  h
を所与したとき , X  kとなる条件付き確率
・ ( Bs, :確率構造
)
Bsと条件付き確率パラメ
ータ
集合で指定されるベイジア ンネットワーク
n
・ p( X 1 , X 2 ,..., X n | Bs)   p( X i | pa( X i ), Bs) (3.1)
i 1
n 個の離散変数をもつベイジアンネットワーク
の同時分布(条件付き確率と確率の連鎖法則)
3.2 ベイジアンネットワークモデルの定式化(2)
癌転移 p( X1  1)  0.8
p( X 2  1 | X1  1)  0.8
1
p( X 2  1 | X1  0)  0.2
p( X 3  1 | X 1  1)  0.8
p( X 3  1 | X 1  0)  0.2
血清中のカルシ
2
ウム量の増加
3 脳腫瘍
p( X 5  1 | X 3  1)  0.8
p( X 4  1 | X 2  1, X 3  1)  0.8
p( X 5  1 | X 3  0)  0.2
p( X 4  1 | X 2  0, X 3  1)  0.6
p( X 4  1 | X 2  1, X 3  0)  0.6
4
p( X 4  1 | X 2  0, X 3  0)  0.2
昏睡状態
5
激しい頭痛
図3.1 ベイジアンネットワークの因果モデル例
3.2 ベイジアンネットワークモデルの定式化(3)
・ 図3.1の構造に対する同時確率分布
p( X 1 , X 2 ,..., X 5 | Bs)
 p( X 1 ) p( X 2 | X 1 ) p( X 3 | X 1 ) p( X 4 | X 2 , X 3 ) p( X 5| X 3 )
・ 図3.1の因果モデルから発生させた20個の事例サン
プル → 表3.1
※ ベイジアンネットワークの因果モデルの学習
→ 事例データから因果モデルを推定
3.2 ベイジアンネットワークモデルの定式化(4)
表3.1 データ例
ノード番号
ノード番号
No.
1
2
3
4
5
No.
1
2
3
4
5
1
1
0
1
1
1
11
0
0
0
0
0
2
0
0
0
1
0
12
1
1
1
1
1
3
1
1
1
1
1
13
0
0
1
1
1
4
1
1
1
1
0
14
1
1
1
1
1
5
1
1
1
1
0
15
1
0
1
1
1
6
1
1
0
0
0
16
1
1
1
0
0
7
1
0
0
0
0
17
1
1
0
1
0
8
0
0
0
0
0
18
1
1
1
0
0
9
0
0
0
0
0
19
1
1
0
1
0
10
0
1
1
1
1
20
1
1
1
0
1
平均
0.70
0.60
0.60
0.60
0.40