ベイジアンネットワーク概説 3.3 ベイジアンネットワークの母数推定 茨城大学工学部 佐々木稔 はじめに サンプルデータ数の影響を考慮した推論 母数(パラメトリック)モデルの導出 母数モデル 確率構造 BS のとき、3.2節より n p( X 1 , X 2 ,, X n | BS ) p X i | pa X i , Bs i 1 θijk : 親ノード変数集合 pa(Xi) のうち、j 番目の パターンをとり、Xi = k となる条件付き確率の母数 Θ= {θijk} (i=1, ・・・, n ; j=1, ・・・, qi ; k=0, ・・・,ri-1) W = (a1, a2, ・・・, at)がパターン このパターンが qi 個存在 W1 = a1 Xi = k Wt = at i W = (a1, a2, ・・・, at)と Xi = k となるデータ数が Nijk Θについての尤度 Xを所与としたときのパラメータΘについての尤度 多項分布に従う この尤度が最大となる母数を求める ri 1 n qi i 1 j 1 p X | , Bs N k 0 ri 1 ijk ! qi ri 1 i 1 k 0 N ! ijk k 0 n ri 1 j 1 k 0 N ijk ijk N ijk ijk 独立試行確率の計算 全試行回数 ri 1 N k 0 ri 1 ri 1 ijk N ! ijk ! ri 1 N ijk ijk k 0 N k 0 ijk ! N ij 0 ! N ij1! N ij ( ri 1) ! N ij 0 ij 0 N ij 1 ij1 N ij ( ri 1) ij ( ri 1) k 0 ラベル 確率 回数 0 θij0 Nij0 1 θij1 Nij1 ・・・ ・・・ ・・・ ri - 1 θij(ri -1) Nij(ri -1) 事前分布の推定 パラメータθについての事前分布 p(θ|BS) 自然共益事前分布の導入 ディリクレ(Dirichlet)分布 事前、事後の分布形を同一にする N’ijk は Nijk に対応するハイパーパラメータ n qi p | Bs i 1 j 1 ri 1 N ijk k 0 ri 1 Nijk k 0 ri 1 k 0 1 N ijk ijk 事前分布の推定 i, j, k 以外は積分するとベータ分布になる pijk | Bs pijk | Bs d110 d nqi ( ri 1) 2 Nijk Nijk 2 1 N ijk ijk 母数値とベータ分布の形状 5 ホールデン事前分布 4 β(0.5, 0.5) 3 β(10, 9) 2 β(1.0, 1.0) 1 0 母数推定 事後分布 p(X, θ|BS) 尤度と事前分布の積 n qi pX, | Bs i 1 j 1 ri 1 N ijk k 0 ri 1 N ijk ri 1 k 0 k 0 n qi ri 1 ijkijk i 1 j 1 k 0 N N ijk 1 N ijk 1 N ijk ijk 母数推定 事後分布 p(X, θ|BS) を最大化する qi ri 1 Nijk 1 logijk log pX, | Bs Nijk n i 1 j 1 k 0 このとき、 ri 2 ij ( r 1) 1 ijk i より、 k 0 ri 2 ri 2 N ijk 1log ijk N ijk N ijk 1log1 ijk log pX, | Bs N ijk i 1 j 1 k 0 k 0 n qi 母数推定 θijkで偏微分したものが 0 となる θijk を求める d log pX, | Bs d ijk n qi ri 2 N N 1 N N 1 ijk ijk ijk ijk 0 ijk ri 2 i 1 j 1 k 0 1 ijk k 0 母数推定 推定値は ただし、 Nijk N ijk ˆijk Nij Nij ri 1 ri 1 k 0 k 0 , Nij Nijk Nij Nijk 数値例 θijk の推定値と真の値との平均二乗誤差 3.2節のデータを利用 3.2節のデータの推定値 真の値 N’ijk=0 N’ijk=1 N’ijk=1/2 p(X2=1|X1=1) 0.8 0.8 0.76 0.78 p(X2=1|X1=0) 0.2 0 0.14 0.08 p(X3=1|X1=1) 0.8 0.8 0.76 0.78 p(X3=1|X1=0) 0.2 0 0.14 0.08 p(X4=1|X2=1, X3=1) 0.8 0.66 0.64 0.65 p(X4=1|X2=1, X3=0) 0.2 0.5 0.5 0.5 p(X4=1|X2=0, X3=1) 0.6 0.5 0.5 0.5 p(X4=1|X2=0, X3=0) 0.2 0.4 0.43 0.41 p(X5=1|X3=1) 0.8 0.67 0.64 0.42 p(X5=1|X3=0) 0.2 0.33 0.35 0.34 0.0193 0.015 0.028 真の値との二乗誤差
© Copyright 2024 ExpyDoc