三相主成分分析の階層関係と新展開 大阪大学 大阪大学 大阪大学 足立浩平 中村裕子 池本大樹 1. 目的 三相データ{xijk; i = 1, … , I; j = 1, … , J; k = 1, … , K}の三相構造を考慮して(通常の二相)主成分分析法 (PCA)を修正した手法に Tucker2, Tucker3, Parafac があり,三相 PCA と総称される.これらと(二相)PCA の階層関係を示した後,三相 PCA について著者らが行っている研究を論じる. 2. 階層関係 xijk を(i,j)要素とする I×J のデータ行列を Xk と表すと,三相データに対する通常の PCA と 3 種の三 相 PCA は,次の最小二乗基準によって定式化される.ここで,モデル部は Xk より低階数である. PCASEP PCASUP Σk||Xk − AkBk′|| 2 Σk||Xk − ABk′|| Tucker2 2 Tucker3 Σk||Xk − AHkB′|| 2 Σk||Xk − AΣrckrGrB′|| Parafac 2 PCAAVE Σk||Xk − ADkB′|| 2 Σk||Xk − AB′||2 PCASEP は個々の Xk の PCA,PCASUP は[X1, … , XK]の PCA, これに制約 Bk′ = HkB′を加えたものが Tucker2, これに制約 Hk = ΣrcrGr を加えたものが Tucker3,これに制約ΣrckrGr = Dk(対角行列)を加えたものが Parafac,これに制約 Dk = I (単位行列)を加えたものが,K−1Σk Xk の PCA に相当する PCAAVE であり, PCASEP f PCASUP f Tucker2 f Tucker3 f Parafac f PCAAVE (1) の階層関係がある.ここで,A f B は,A に制約を加えた方法が B であることを表す.なお,Tucker3 と Parafac の最小二乗基準は,それぞれ,Σi,j,k(xijk−Σp,q,r aipbjqckrgpqr)2,Σi,j,k(xijk−Σp aipbjpckp)2 のようにスカラ ー表現できる.ここで,A = (aip), B = (bjq), Gr = (gpqr), Dk = diag(ck1, … , ckp)である. 3. 回転とスパース Tucker2 Tucker2 と Tucker3 には多重の回転の不定性があり,例えば Tucker2 では,AHkB′ = AS−1SHkT′T′−1B′ より AS−1, BT−1, SHkT′も A,Hk,B′の解と見なせる.Adachi(2011)は,AS−1, BT−1 が単純構造を持ち,SHkT′ が異なる k の間で等化するように,S と T を同定する方法を提案している.こうした方法でなく,池 本・足立(2014)は,次のスパース Tucker2 を提案して,回転の不定性を回避している. min A , B , H k Σk||Xk − AHkB′||2 s.t. Cardinality(Hk) = 所与の整数, A′A = I, B′B = I . 4. Parafac の拡張 (1)より Parafac は三相 PCA の中で最も制約が強いが,制約を緩和すべく,山口・足立(2014)は, min A, B, D k , Pk Σk||Xk − ADkPkB′||2 s.t. Dk = 対角行列, Pk = 置換行列,A′A = I, B′B = I と定式化できる置換 Parafac を提案している.これは,Tucker3 と Parafac の中間に位置づけられる. 5. 数量化を伴う Tucker3 中村(2014)は,カテゴリー変数 xijk が 1, … , hj の整数(カテゴリー番号)をとるケースを考慮して, min A , B ,C, G r , q j Σk||[N1q1, … , NJqJ] − AΣrckrGrB′||2 s.t. qj′Nj′Njqj = I, A′A = I, B′B = I を提案している.ここで,Nj (j = 1, … , J)は,xijk に対応する要素が 1 を取る I×hj の二値行列である. 参考文献 Adachi, K (2011). Three-way Tucker2 component analysis solutions of stimuli × responses × individuals data with simple structure and the fewest core differences. Psychometrika, 76, 285-305. 池本大樹・足立浩平 (2014). 成分間のリンク数を制約した三相 Tucker2 分析. 日本計算機統計学会第 28 回大会論文集, 151-154. 中村裕子 (2014). 順序データの数量化を用いた三相主成分分析法. 日本計算機統計学会第 28 回大会論文集, 155-158. 山口奈津実・足立浩平 (2014). PARAFAC の拡張 ―成分リンク行列の置換を許す方法―. 日本行動計量学会第 42 回発表論文抄 録集(印刷中).
© Copyright 2024 ExpyDoc