線形混合モデルにおける予測情報量規準 東京大・経済・院 川久保 友超 東京大・経済 久保川 達也 本報告では,ベイズ予測分布にもとづいた予測情報量規準(predictive information criterion, PIC)を,線形混合モデルの変数選択の枠組みで導出し提案する. 以下のような線形混合モデル y = Xβ + Zb + ϵ における説明変数 X の変数選択問題を考える.b は確率ベクトルで,Xβ は固定効果,Zb は変量 効果と呼ばれ,ϵ は誤差項である.このモデルにおける未知パラメータを集めたベクトルを ω と する.線形混合モデルの変数選択に対しては,Vaida and Blanchard (2005) で提案された条件付 赤池情報量規準(conditional AIC, cAIC)が広く用いられている.この規準は,変量効果を所与 ˆ ω b ) の Kullback-Leibler divergence にもとづいたリスク とした条件付プラグイン予測分布 f (˜ y |b, { } ∫∫∫ f (˜ y |b, ω) log f (˜ y |b, ω)f (y|b, ω)π(b|ω)d˜ y dydb, ˆ ω b) f (˜ y |b, ˆ は b の何らかの予測量,ω b は ω の推定量,y ˜は (の一部)の推定量とみることができる.ここで b b を所与としたうえでの y の独立な複製とする.しかし,ベイズ予測の観点に立つと,ω が既知の もとではプラグイン予測分布よりもベイズ予測分布(事後予測分布) ∫ ∫ f (˜ y |b, ω)f (y|b, ω)π(b|ω)db ˆ ∫ fπ (˜ y |y, ω) = f (˜ y |b, ω)π(b|y, ω)db = , f (y|b, ω)π(b|ω)db の方が小さいリスクを達成する,すなわち, { } ∫∫∫ f (˜ y |b, ω) log f (˜ y |b, ω)f (y|b, ω)π(b|ω)d˜ y dydb fˆπ (˜ y |y, ω) } { ∫∫∫ f (˜ y |b, ω) ≤ log f (˜ y |b, ω)f (y|b, ω)π(b|ω)d˜ y dydb, ˆ ω) f (˜ y |b, が成り立つ.そこでベイズ予測分布にもとづいたリスク関数として, ∫∫∫ b )}f (˜ P I = −2 log{fˆπ (˜ y |y, ω y |b, ω)f (y, b|ω)d˜ y dydb, を定義し,これの(漸近)不偏推定量として予測情報量規準(predictive information criterion, PIC)を導出する.こうしたベイズ予測分布にもとづいた情報量規準の発想は,Akaike (1980) で 最初に提案された.本研究ではこれを上記の線形混合モデルの枠組みで議論する. 参考文献 [1] Akaike, H. (1980). On the use of the predictive likelihood of a Gaussian model. Ann. Inst. Statist. Math., 32, 311-324. [2] Vaida, F. and Blanchard, S. (2005). Conditional Akaike information for mixed-effects models. Biometrika, 92, 351-370.
© Copyright 2024 ExpyDoc