三相主成分分析の階層関係と新展開

三相主成分分析の階層関係と新展開
大阪大学
大阪大学
大阪大学
足立浩平
中村裕子
池本大樹
1. 目的
三相データ{xijk; i = 1, … , I; j = 1, … , J; k = 1, … , K}の三相構造を考慮して(通常の二相)主成分分析法
(PCA)を修正した手法に Tucker2, Tucker3, Parafac があり,三相 PCA と総称される.これらと(二相)PCA
の階層関係を示した後,三相 PCA について著者らが行っている研究を論じる.
2. 階層関係
xijk を(i,j)要素とする I×J のデータ行列を Xk と表すと,三相データに対する通常の PCA と 3 種の三
相 PCA は,次の最小二乗基準によって定式化される.ここで,モデル部は Xk より低階数である.
PCASEP
PCASUP
Σk||Xk − AkBk′||
2
Σk||Xk − ABk′||
Tucker2
2
Tucker3
Σk||Xk − AHkB′||
2
Σk||Xk − AΣrckrGrB′||
Parafac
2
PCAAVE
Σk||Xk − ADkB′||
2
Σk||Xk − AB′||2
PCASEP は個々の Xk の PCA,PCASUP は[X1, … , XK]の PCA, これに制約 Bk′ = HkB′を加えたものが Tucker2,
これに制約 Hk = ΣrcrGr を加えたものが Tucker3,これに制約ΣrckrGr = Dk(対角行列)を加えたものが
Parafac,これに制約 Dk = I (単位行列)を加えたものが,K−1Σk Xk の PCA に相当する PCAAVE であり,
PCASEP f PCASUP f Tucker2 f Tucker3 f Parafac f PCAAVE
(1)
の階層関係がある.ここで,A f B は,A に制約を加えた方法が B であることを表す.なお,Tucker3
と Parafac の最小二乗基準は,それぞれ,Σi,j,k(xijk−Σp,q,r aipbjqckrgpqr)2,Σi,j,k(xijk−Σp aipbjpckp)2 のようにスカラ
ー表現できる.ここで,A = (aip), B = (bjq), Gr = (gpqr), Dk = diag(ck1, … , ckp)である.
3. 回転とスパース Tucker2
Tucker2 と Tucker3 には多重の回転の不定性があり,例えば Tucker2 では,AHkB′ = AS−1SHkT′T′−1B′
より AS−1, BT−1, SHkT′も A,Hk,B′の解と見なせる.Adachi(2011)は,AS−1, BT−1 が単純構造を持ち,SHkT′
が異なる k の間で等化するように,S と T を同定する方法を提案している.こうした方法でなく,池
本・足立(2014)は,次のスパース Tucker2 を提案して,回転の不定性を回避している.
min A , B , H k Σk||Xk − AHkB′||2
s.t. Cardinality(Hk) = 所与の整数, A′A = I,
B′B = I .
4. Parafac の拡張
(1)より Parafac は三相 PCA の中で最も制約が強いが,制約を緩和すべく,山口・足立(2014)は,
min A, B, D k , Pk Σk||Xk − ADkPkB′||2
s.t. Dk = 対角行列, Pk = 置換行列,A′A = I, B′B = I
と定式化できる置換 Parafac を提案している.これは,Tucker3 と Parafac の中間に位置づけられる.
5. 数量化を伴う Tucker3
中村(2014)は,カテゴリー変数 xijk が 1, … , hj の整数(カテゴリー番号)をとるケースを考慮して,
min A , B ,C, G r , q j Σk||[N1q1, … , NJqJ] − AΣrckrGrB′||2 s.t.
qj′Nj′Njqj = I, A′A = I,
B′B = I
を提案している.ここで,Nj (j = 1, … , J)は,xijk に対応する要素が 1 を取る I×hj の二値行列である.
参考文献
Adachi, K (2011). Three-way Tucker2 component analysis solutions of stimuli × responses × individuals data with simple structure and the
fewest core differences. Psychometrika, 76, 285-305.
池本大樹・足立浩平 (2014). 成分間のリンク数を制約した三相 Tucker2 分析. 日本計算機統計学会第 28 回大会論文集, 151-154.
中村裕子 (2014). 順序データの数量化を用いた三相主成分分析法. 日本計算機統計学会第 28 回大会論文集, 155-158.
山口奈津実・足立浩平 (2014). PARAFAC の拡張 ―成分リンク行列の置換を許す方法―. 日本行動計量学会第 42 回発表論文抄
録集(印刷中).