LMSR-methodによる多変量非線形回帰とその応用

LMSR-method による多変量非線形回帰とその応用
島根大・総合理工学研究科 内藤貫太
島根大・総合理工学研究科 清水祥太
LMSR-method は,Cole (1990, EJCN) や Cole and Green (1992, Statist.Med.) で議論された LMSmethod の多変量回帰への一般化であり,(x, y) の観測値であるデータ (x1 , y 1 ), ..., (xn , y n ) に適用
される.ここで,xi ∈ R であり,y i = (yi1 , ..., yid )T ∈ Rd+ である.各共変量 xi において,パラ
メータ
(Lj (xi ), Mj (xi ), Sj (xi )), i = 1, ..., n; j = 1, ..., d, Rkℓ (xi ), 1 ≤ k < ℓ ≤ d
で制御される多変量べき変換を対応する y i , i = 1, ..., n に適用する.これらのパラメータには Nat-
ural Cubic Spline (NCS) の構造を仮定し,まずは罰則付き尤度法を用いて (Lj (xi ), Mj (xi ), Sj (xi ))
および Rkℓ (xi ) の推定量
ˆ j (xi ), M
ˆ j (xi ), Sˆj (xi )), i = 1, ..., n; j = 1, ..., d,
(L
ˆ kℓ (xi ), 1 ≤ k < ℓ ≤ d
R
ˆ j (xi )), i = 1, ..., n に NCS 平滑化を適用し,成
を得る.このようにして作られるデータ (xi , L
ˆ
ˆ j (x) が求められ,これらから d 次元空間における 1 次元曲線 L(x)
分ごとの滑らかな曲線 L
=
ˆ (x) =
ˆ 1 (x), ..., L
ˆ d (x)) が構築される.同様にして,d 次元空間における 2 つの 1 次元曲線 M
(L
ˆ
ˆ 1 (x), ..., M
ˆ d (x)),S(x)
ˆ kℓ (x), 1 ≤ k < ℓ ≤ d も得られる.
(M
= (Sˆ1 (x), ..., Sˆd (x)) も得られ, 曲線 R
ˆ j (x) は多変量べき変換のべきパラメータであり,本質的には y の第 j 成分 yj の分布の歪度
曲線 L
ˆ j (x) であり,変動係数が Sˆj (x) となっている.更に,曲線 R
ˆ kℓ (x)
を示す.yj の分布のメジアンが M
ˆ
ˆ (x), S(x)
ˆ ,R
ˆ kℓ (x), 1 ≤ k < ℓ ≤ d
は, yk と yℓ の相関となっている.得られた全ての曲線 L(x),
M
を用いて, (x, y) の多変量構造が説明される.
ˆ (x) であり,多次元応答 y のトレンドを d 次元空間にお
この方法の最も重要な利点は,曲線 M
ける 1 次元曲線で捉えているものとなっている.これは生物の多次元的成長を見る際の,スタン
ダード曲線を得ることにも応用される.
ˆ
2 つ目の利点として,多変量べき変換を施された y に正規性を仮定することで, 曲線 L(x),
ˆ (x), S(x),
ˆ
ˆ kℓ (x), 1 ≤ k < ℓ ≤ d で特徴付けられた分布を求めることができる.このことは,
M
R
新たに得られた d 次元のデータが正常値かどうかを,その分布の領域に入るか入らないかで判断
するルールを提供する.
ˆ kℓ (x), 1 ≤ k < ℓ ≤ d の利用である.これらの
LMSR-method の 3 つ目の利点は,相関の曲線 R
相関曲線によって y の相関構造が x と共にどう変化するかがわかり,y の背後にある構造につい
てより深い洞察が可能となる.実データへの適用を通し,LMSR-method の有用性を紹介する.
References
1. Cole,T.J.(1990). The LMS method for constructing normalized growth standards,European
Journal of Clinical Nutrition,44,45-60.
2. Cole,T.J. and Green,P.J.(1992). Smoothing reference centile curves: the LMS method and
penalized likelihood,Statistics in Medicine,11,1305-1319.