線形混合モデルにおける予測情報量規準 参考文献

線形混合モデルにおける予測情報量規準
東京大・経済・院 川久保 友超
東京大・経済 久保川 達也
本報告では,ベイズ予測分布にもとづいた予測情報量規準(predictive information criterion,
PIC)を,線形混合モデルの変数選択の枠組みで導出し提案する.
以下のような線形混合モデル
y = Xβ + Zb + ϵ
における説明変数 X の変数選択問題を考える.b は確率ベクトルで,Xβ は固定効果,Zb は変量
効果と呼ばれ,ϵ は誤差項である.このモデルにおける未知パラメータを集めたベクトルを ω と
する.線形混合モデルの変数選択に対しては,Vaida and Blanchard (2005) で提案された条件付
赤池情報量規準(conditional AIC, cAIC)が広く用いられている.この規準は,変量効果を所与
ˆ ω
b ) の Kullback-Leibler divergence にもとづいたリスク
とした条件付プラグイン予測分布 f (˜
y |b,
{
}
∫∫∫
f (˜
y |b, ω)
log
f (˜
y |b, ω)f (y|b, ω)π(b|ω)d˜
y dydb,
ˆ ω
b)
f (˜
y |b,
ˆ は b の何らかの予測量,ω
b は ω の推定量,y
˜は
(の一部)の推定量とみることができる.ここで b
b を所与としたうえでの y の独立な複製とする.しかし,ベイズ予測の観点に立つと,ω が既知の
もとではプラグイン予測分布よりもベイズ予測分布(事後予測分布)
∫
∫
f (˜
y |b, ω)f (y|b, ω)π(b|ω)db
ˆ
∫
fπ (˜
y |y, ω) = f (˜
y |b, ω)π(b|y, ω)db =
,
f (y|b, ω)π(b|ω)db
の方が小さいリスクを達成する,すなわち,
{
}
∫∫∫
f (˜
y |b, ω)
log
f (˜
y |b, ω)f (y|b, ω)π(b|ω)d˜
y dydb
fˆπ (˜
y |y, ω)
}
{
∫∫∫
f (˜
y |b, ω)
≤
log
f (˜
y |b, ω)f (y|b, ω)π(b|ω)d˜
y dydb,
ˆ ω)
f (˜
y |b,
が成り立つ.そこでベイズ予測分布にもとづいたリスク関数として,
∫∫∫
b )}f (˜
P I = −2
log{fˆπ (˜
y |y, ω
y |b, ω)f (y, b|ω)d˜
y dydb,
を定義し,これの(漸近)不偏推定量として予測情報量規準(predictive information criterion,
PIC)を導出する.こうしたベイズ予測分布にもとづいた情報量規準の発想は,Akaike (1980) で
最初に提案された.本研究ではこれを上記の線形混合モデルの枠組みで議論する.
参考文献
[1] Akaike, H. (1980). On the use of the predictive likelihood of a Gaussian model. Ann. Inst.
Statist. Math., 32, 311-324.
[2] Vaida, F. and Blanchard, S. (2005). Conditional Akaike information for mixed-effects
models. Biometrika, 92, 351-370.