日時: 12/27(火)16:00-17:30 場所: 横浜市大附属市民総合医療センター

日時: 12/27(火)16:00-17:30
場所: 横浜市大附属市民総合医療センター
講演者: 藤澤洋徳(統計数理研究所)
テーマ: 『ロバストでスパースなガウシアン・グラフィカル・モデリングと遺伝子発現データへの
応用』
Abstract:
連続値データのグラフィカルモデルを同定する問題を考える。その問題に対処するには幾つかの手
法があるが、ここでは、正規分布を仮定して共分散行列の逆行列を推定して、逆行列の成分が 0 と
推定されたときは二つの成分を繋がず、0 以外で推定されたときは二つの成分を繋ぐという手法を
考える。それによってグラフィカルモデルが提案できる。推定値として正確に 0 が欲しいので、そ
れを実現するためにスパース推定が利用される。そのような手法は既に標準的でありソフトウェア
も提供されている。
本研究では、その手法において、外れ値に対して強くなるロバスト化を組み込む。そこでガンマ・
ダイバージェンスを利用する。多くのロバスト法は、平均構造の推定には強いが、分散構造の推定
には強くない。ガンマ・ダイバージェンスに基づく手法は分散構造の推定に強いので採用すること
にした。
その場合に問題となるのはパラメータ推定アルゴリズムである。ガンマ・ダイバージェンスを提案
した論文では、ピタゴリアン関係に着目して、目的関数が単調減少するパラメータ推定アルゴリズ
ムが提案されている。しかし、ガンマ・ダイバージェンスにスパース罰則を組み入れたとき、その
アイデアはうまく使えない。本研究では、MM アルゴリズムの考えを使って、目的関数が単調に減
少するパラメータ推定アルゴリズムを提案する。
まずは、数値実験において、提案手法が過去に提案された幾つかの手法を圧倒していることを紹介
する。提案手法を適用した結果と、外れ値を除いて通常の手法を使った結果が、驚くほど似通って
いる。これは、外れ値を存在していなかったかのように解析が行われたことを示している。平均二
乗誤差などの意味でも、過去に提案された手法を圧倒している。
また、遺伝子発現データ解析の事例も幾つか紹介する。ある事例では、これまでに同定されていな
かった外れ値を発見し、より良い結果を提示している。真の遺伝子ネットワークが分かっている部
分に適用した事例では、提案手法に比べて、より良い遺伝子ネットワークを同定できている。