ベイジアンネットワーク概説
3.3 ベイジアンネットワークの母数推定
茨城大学工学部
佐々木稔
はじめに
サンプルデータ数の影響を考慮した推論
母数(パラメトリック)モデルの導出
母数モデル
確率構造 BS のとき、3.2節より
n
p( X 1 , X 2 ,, X n | BS ) p X i | pa X i , Bs
i 1
θijk : 親ノード変数集合 pa(Xi) のうち、j 番目の
パターンをとり、Xi = k となる条件付き確率の母数
Θ= {θijk}
(i=1, ・・・, n ; j=1, ・・・, qi ; k=0, ・・・,ri-1)
W = (a1, a2, ・・・, at)がパターン
このパターンが qi 個存在
W1 = a1
Xi = k
Wt = at
i
W = (a1, a2, ・・・, at)と Xi = k
となるデータ数が Nijk
Θについての尤度
Xを所与としたときのパラメータΘについての尤度
多項分布に従う
この尤度が最大となる母数を求める
ri 1
n
qi
i 1
j 1
p X | , Bs
N
k 0
ri 1
ijk
!
qi
ri 1
i 1
k 0
N
!
ijk
k 0
n
ri 1
j 1 k 0
N ijk
ijk
N ijk
ijk
独立試行確率の計算
全試行回数
ri 1
N
k 0
ri 1
ri 1
ijk
N
!
ijk
!
ri 1
N ijk
ijk
k 0
N
k 0
ijk
!
N ij 0 ! N ij1! N ij ( ri 1) !
N ij 0
ij 0
N ij 1
ij1
N ij ( ri 1)
ij ( ri 1)
k 0
ラベル
確率
回数
0
θij0
Nij0
1
θij1
Nij1
・・・
・・・
・・・
ri - 1
θij(ri -1)
Nij(ri -1)
事前分布の推定
パラメータθについての事前分布 p(θ|BS)
自然共益事前分布の導入
ディリクレ(Dirichlet)分布
事前、事後の分布形を同一にする
N’ijk は Nijk に対応するハイパーパラメータ
n
qi
p | Bs
i 1
j 1
ri 1
N ijk
k 0
ri 1
Nijk
k 0
ri 1
k 0
1
N ijk
ijk
事前分布の推定
i, j, k 以外は積分するとベータ分布になる
pijk | Bs pijk | Bs d110 d nqi ( ri 1)
2 Nijk
Nijk
2
1
N ijk
ijk
母数値とベータ分布の形状
5
ホールデン事前分布
4
β(0.5, 0.5)
3
β(10, 9)
2
β(1.0, 1.0)
1
0
母数推定
事後分布 p(X, θ|BS)
尤度と事前分布の積
n
qi
pX, | Bs
i 1
j 1
ri 1
N ijk
k 0
ri 1
N ijk
ri 1
k 0
k 0
n
qi
ri 1
ijkijk
i 1
j 1 k 0
N
N ijk 1
N ijk 1
N ijk
ijk
母数推定
事後分布 p(X, θ|BS) を最大化する
qi ri 1
Nijk 1 logijk
log pX, | Bs Nijk
n
i 1 j 1 k 0
このとき、
ri 2
ij ( r 1) 1 ijk
i
より、
k 0
ri 2
ri 2
N ijk 1log ijk N ijk
N ijk 1log1 ijk
log pX, | Bs N ijk
i 1 j 1 k 0
k 0
n
qi
母数推定
θijkで偏微分したものが 0 となる θijk を求める
d log pX, | Bs
d ijk
n qi ri 2 N N
1
N
N
1
ijk
ijk
ijk
ijk
0
ijk
ri 2
i 1 j 1 k 0
1 ijk
k 0
母数推定
推定値は
ただし、
Nijk
N
ijk
ˆijk
Nij Nij
ri 1
ri 1
k 0
k 0
, Nij Nijk
Nij Nijk
数値例
θijk の推定値と真の値との平均二乗誤差
3.2節のデータを利用
3.2節のデータの推定値
真の値 N’ijk=0 N’ijk=1 N’ijk=1/2
p(X2=1|X1=1)
0.8
0.8
0.76
0.78
p(X2=1|X1=0)
0.2
0
0.14
0.08
p(X3=1|X1=1)
0.8
0.8
0.76
0.78
p(X3=1|X1=0)
0.2
0
0.14
0.08
p(X4=1|X2=1, X3=1)
0.8
0.66
0.64
0.65
p(X4=1|X2=1, X3=0)
0.2
0.5
0.5
0.5
p(X4=1|X2=0, X3=1)
0.6
0.5
0.5
0.5
p(X4=1|X2=0, X3=0)
0.2
0.4
0.43
0.41
p(X5=1|X3=1)
0.8
0.67
0.64
0.42
p(X5=1|X3=0)
0.2
0.33
0.35
0.34
0.0193
0.015
0.028
真の値との二乗誤差
© Copyright 2026 ExpyDoc