線形混合モデルとEBLUPを利用した小地域推定の新展開

線形混合モデルと EBLUP を利用した小地域推定の新展開
東京大学
久保川達也
線形混合モデル (LMM) と最良線形不偏予測量 (BLUP) についての研究は C.R. Henderson の論文以来 50 年以上にわたって発展してきた。当初は,家畜育種学の分野で個体
のもつ遺伝的能力などの推定を行うために研究されたが,次第に線形混合モデルの有用性
が広く認識され,またベイズモデルとの関連においてベイズ推測の理論と計算方法につい
ての顕著な発展に伴って,現在では実に広い分野で利用されている。ここでは,LMM の
応用例の一つとして小地域推定の問題を取り上げ,LMM から誘導される経験最良線形不
偏予測量 (EBLUP) が小地域の安定した推定値を与えるのに役立つことを説明する。ま
た,ベンチマーク問題や母数型変換モデルなど最近の展開を紹介するとともに,異分散モ
デルに関する研究についてもこれまでの研究成果を紹介する。
最もよく使われる個体レベルのモデルは,枝分かれ誤差回帰モデル (NER) である。m
個の地域があり,各地域から ni 個のデータが取られていて,i 地域のデータ yij が
yij = xTij β + vi + εij , i = 1, . . . , m, j = 1, . . . , ni
(1)
なるモデルに従うとする。ここで,vi ∼ N (0, σv2 ), εij ∼ N (0, σe2 ) であり,vi は地域の差
異を表す変量で,変量効果を呼ばれる。各地域の平均 ξi = xTi β + vi を推定するのに標本
平均 y i を用いるのが基本であるが,小地域問題では ni が小さいので y i では推定誤差が大
きくなってしまう。そこで地域の差異を変量効果としてモデルに取り込むことによって,
b GLS の方向へ縮小することによ
y i を縮小する作用が生じ,y i をプールされた回帰推定量 β
り,推定精度の改善が図られる。
Battese, Harter and Fuller (1988, JASA) で取り上げたデータの分布を地域毎に描いて
みると,地域によりバラツキが異なることが観察できる。そこで Jiang and Nguyen (2012,
Candian J. Statist.) は yij − xTij β の分散が地域により異なり σi2 に比例するモデルを考案し
た。これは,NER モデル (1) において vi ∼ N (0, λσi2 ), εij ∼ N (0, σi2 ) となる分散構造を想
定することに対応し,異分散をもる NER モデル (HNER) と呼ばれる。m を大きくする漸
近論を考えると未知分散 σi2 の個数が増えるため, Neyman and Scott (1948, Econometrika)
の問題から推定量の一致性が成り立たないと予想されるが,Jiang and Nguyen は λ, β, ξi
の推定については一致推定量が得られることを示した。しかし,σi2 の推定については一
致推定量は存在しない。特に小地域推定においては ni が小さいため σi2 の推定には問題が
ある。そこで σi2 を変量として扱うモデルが考案される。
今回の発表では,HNER モデルにおいて分散を変量とするモデルを導入し,ξi の経験
ベイズ推定量を与える。また未知母数の最尤推定の漸近的性質を与え,それに基づいて,
経験ベイズ推定量の通常の平均2乗誤差 (MSE) と条件付き MSE の漸近近似を与える。従
来の NER もしくは HNER モデルでは, MSE と条件付き MSE は漸近的に同等であるが,
変量分散モデルにおいては異なってくる。最後に,MSE 及び条件付き MSE の 2 次漸近不
偏推定量をパラメトリック・ブートストラップ法に基づいて与え,数値実験及びデータ解
析の結果を与える。