ゼロ過剰モデルにおける客観事前分布の導出

ゼロ過剰モデルにおける客観事前分布の導出
大阪大学大学院基礎工学研究科 田辺 竜ノ介
大阪大学大学院基礎工学研究科 熊谷 悦生 1. 導入
ゼロ過剰モデルは,度数 0 が極端に多く観測されるカウントデータに対して使用される.ゼロ
過剰モデルには 2 種類の表記があり.確率関数 f (x|θ), (x = 0, 1, . . .) を用いて


p
ω + (1 − ω)f (0|θ) (x = 0)
(x = 0)
fh (x|p, θ) =
or
f
(x|ω,
θ)
=
w
(1 − p) f (x|θ)
(1 − ω)f (x|θ)
(x = 1, 2, ...)
(x = 1, 2, ...)
1−f (0|θ)
前者を hurdle モデル,後者を with zeros モデルと呼ぶ.客観ベイズの立場から解析を行う場合,
客観事前分布の導出が必要である.一般的に使用される客観事前分布は Jeffreys prior, reference
prior, matching prior の3種類である.先行研究では Bhattacharya, Clarke and Datta(2008) が
ゼロ過剰 with zeros 級数モデルに対して Jeffreys prior を,Hai-Yan Xu(2013) がゼロ過剰 hurdle
ポアソンモデルに対して3種類の客観事前分布を導出した.しかし,客観事前分布が導出されてい
ないゼロ過剰モデルの式はまだ多く存在する.本報告はその先行研究では導出されていない,一
般的なゼロ過剰分布の客観事前分布を構成し,その性質を示す.
2. 客観事前分布と性質
θ を 1 次元と仮定する.fT (x|θ), (x = 1, 2, . . .) をゼロトランケートされた f (x|θ) の確率関数と
し,このモデルの Fisher 情報量を J(θ) と置く.このとき hurdle モデルの客観事前分布 πa は
πa (p, θ) ∝ p−1/2 (1 − p)a |J(θ)|1/2 ,
で書かれる.a = 0 のとき Jeffreys prior, a = −1/2 のとき θ と p に興味がある場合の reference
prior かつ matching prior である.同様に with zeros モデルの客観事前分布 πb は
(
)−1/2
f (0|θ)
πb (ω, θ) ∝ ω +
(1 − ω)b (1 − f (0|θ))1/2+b |J(θ)|1/2 ,
1 − f (0|θ)
b = 0 のとき Jeffreys prior, b = −1/2 のとき θ に興味がある場合の reference prior かつ matching
prior である.観測 xn = (x1 , . . . , xn ) が fh (x|p, θ) から得られたとして,r0 = #{xi |xi = 0}, r1 =
n − r0 と置くと,客観事前分布 πa を用いたときの事後期待値は
∫
θ|J(θ)|1/2 fT (xr1 |θ)dθ
r0 + 1/2
, pˆa = Eha [p|xn ] =
θˆa = Eha [θ|xn ] = ∫Θ
1/2
n
+ a + 3/2
fT (xr1 |θ)dθ
Θ |J(θ)|
と書ける.また with zeros モデルの場合,観測 xn = (x1 , . . . , xn ) が fw (x|p, θ) から得られたとし
て,客観事前分布 πb を用いたときの事後期待値は事後期待値は
]
[
1
ˆ
xn + 1,
θb = Ewb [θ|xn ], E[ω|xn ] = (ˆ
pb − 1) E
1 − f (0|θ) ただし,pˆb = (r0 + 1/2)/(n + b + 3/2) である.この E[ω|xn ] は常に存在するわけではない.その
条件の詳細は当日発表する.
3. 参考文献
[1] Bhattacharya, A., Clarke, B. S., and Datta, G. S. (2008). A Bayesian test for excess zeros in a zeroinflated power series distribution. in IMS collections, Beyond Parametrics in Interdisciplinary Research:
Festschrift in Honor of Professor Pranab K Sen, 1, 89–104.
[2] Hai-Yan Xu, Min Xie, Thong Ngee Goh. (2013). Objective Bayes Analysis of Zero-Inflated Poisson
Distribution with Application to Healthcare Data IIE Transactions