外れ値にロバストなスパース線形回帰:交互最適化アルゴリ ズムとその統計的収束 東京工業大学大学院 社会理工学研究科 片山 翔太 統計数理研究所 数理・推論研究系 藤澤 洋徳 線形回帰問題において,外れ値に対してロバストな回帰係数の推定を考える.ある未知 の n 次元ベクトル w∗ を加えた次のモデルを仮定する: y = Xβ ∗ + w∗ + ε. ここで,y は n 次元応答ベクトル, X は n × p 説明変数行列,β ∗ は未知の p 次元回帰係数 ベクトル, そして ε は E(ε) = 0, Var(ε) = σ 2 Ip をみたす p 次元誤差ベクトルである.な お,上記の w∗ が外れ値を意味していることに注意しておく.外れ値 w∗ にスパース性を 仮定することは自然であるため,She and Owen (2011) は,チューニングパラメータ λw,i を持つスパースペナルティ関数 P (·; λw,i ) を用いて (β ∗ , w∗ ) を次のように推定している: ∑ 1 ˆ w) ˆ = argmin ∥y − Xβ − w∥22 + (β, P (wi ; λw,i ). 2n β,w i=1 n (1) ここで wi は w の第 i 要素である.これにより,外れ値に対してロバストに β ∗ が推定で きる.実際,She and Owen (2011) は従来のロバスト推定量と βˆ の関係性を与えている. 例えば, P (·; ·) として LASSO ペナルティを用いれば βˆ は Huber 型となり,SCAD ペナル ティを用いれば Hampel 型となることなどが示されている. しかしながら,説明変数の次元 p が大きな場合,上記の推定量 βˆ が不安定になることは 明らかである.そこで本報告では,(1) の自然な拡張である次の推定量 ∑ ∑ 1 argmin L(β, w) := ∥y − Xβ − w∥22 + λβ,i |βi | + P (wi ; λw,i ) 2n β,w i=1 i=1 p n を考える.陽な解を求めることは一般に不可能なため,β, w に対して交互に繰り返し最 適化を行うと,第 k + 1 ステップでの解は次で与えられる: β k+1 = argmin L(β, wk ), β wik+1 = Θ(yi − xTi β k+1 ; λw,i ). 1 ここで,xi は X の第 i 行ベクトルであり,Θ(x; λw,i ) = argminwi 2n (x − wi )2 + P (wi ; λw,i ) である.なお,β k+1 は Coordinate Descent アルゴリズムなどで容易に計算できる.この とき,適切にチューニングパラメータを与えると,ある条件の下で,∥β k+1 − β ∗ ∥2 の非漸 近上界が得られることを示す.得られた上界から,推定アルゴリズムの初期値の影響がス テップサイズの指数オーダで減少するための条件や,∥β k+1 − β ∗ ∥2 の収束レートが確認 できる.詳細は当日報告する.
© Copyright 2024 ExpyDoc