VB for Frequency-based Infinite Relational Model 中川研究室 藤田 稔 1 参考文献 Kurihara K., Kameya Y. and Sato T. : Discovering Concepts from Word Cooccurrences with a Relation Model, 人工知能学会論文誌, 2007. Kemp C., Tenenbaum J. B., Griffiths T. L., Yamada T. and Ueda N. : Learning systems of concepts with an infinite relational model, Proc. 21st AAAI, 2006. 2 outline Infinite Relational Model (IRM) Frequency-based Infinite Relational Model (FIRM) Inference based on Gibbs Sampling Inference based on Variational DP experiments 3 Infinite Relational Model 0,1の行列が、ブロックごとに独立に潜在変数に より決定されているモデル。ブロックの分け方は DP(CRP)に従うため、クラスタ数は可変。 4 Hidden Variables 0.01 0.99 Beta(β,β) η Bernoulli(η) 5 Likelihood 属するブロックのηに近い値ほど、 大 きくなる。 6 Frequency-based Infinite Relational Model 非負整数からなる行列が、ブロックごとに独立 に潜在変数により決定されているモデル。 7 Hidden Variables 0.01 0.99 Beta(β,β) η Bernoulli(η) 8 Likelihood 行ごと、列ごとに、重みを変化 させている。ηが1に近いところ でuが高くなっていると、尤度は 大きくなる。 ※IRM 9 Inference based on Gibbs Sampling 事後確率を最大化させるクラスタ分割 (z^R,z^C)を、Gibbs samplingにより見つ ける。 最大値を見つけたいので、Hill Climbingで 十分。 Gibbs samplingの対象を狭めることで効 率を高める手法がある。(split-merge) 10 Inference based on Variational DP 事後確率を最大化させるクラスタ分割 (z^R,z^C)を、変分EMにより見つける。 Gibbs samplingよりも精度は悪いが、高速 に求めることができる。 11 preparation(row only) DPの stickbreaking 12 factorization を最大化 各qは積分すると1、という制約のもとで、ラグランジュの未定 13 乗数法を適用して、最適なqを求めることができる。 algorithm 1. 2. 行列D,ハイパーパラメータ α,β,γ,T^R,T^Cと初期値 q(Z^R),q(Z^C)を決める。 F(q)が収束するまで、次を繰り返す。 1. 2. 3. q(v^R),q(v^C),q(η),q(u^R),q(u^C)を更 新する。 q(Z^R),q(Z^C)を更新する。 q(Z^R)とq(Z^C)を出力する。 14 approximate posterior q(v) 15 approximate posterior q(η) 16 approximate posterior q(u) この値は、初期値のみで決まっている ので、q(u)は更新されない。 17 approximate posterior q(z_a^A) ψはダイガンマ関数。 18 experiments 毎日新聞8年分をCaboChaで解析し、 [形容詞→名詞]の組を210,605個抽出。 1291×3705の共起行列を作成し、これに 対し、IRM_VBとFIRM_VBを行う。 精度測定の指標として、Semantic Aggregate Modelを使用する。 19 20 21 result (purity) 各ブロック での、それ をcoverし ている SAMクラス タの頻度 の割合。 iは上位i個 という意味 らしい。 22 result (coverage) 各ブロック内 の頻度を、 SAMのクラス タに照らし合 わせて、合計 頻度が一番大 きいSAMのク ラスタが、その ブロックを coverする。 SAM:50個 IRM:43個 FIRM:50個 23 conclusion FIRM_VBは、IRM_VBより良い。 実行時間は5分程度(MATLAB,Opteron 254) 精度測定の仕方が怪しいのでそれ以外の アルゴリズムと比較してどれほどいいのか は謎。 24
© Copyright 2024 ExpyDoc