探索的因子分析における変数の選択(2)

1
指定討論
by 狩野裕(大阪大学)
心理学研究の自己点検(6):
心理学研究における
探索的因子分析の基本問題
企画・講演:堀 啓造氏
2
ないよう
• 主成分分析 vs. 因子分析
• 斜交解 vs. 直交解
• 最尤法 vs. 反復主因子法
3
主成分分析 vs. 因子分析
• 理論的観点...Which to use
– 記述的方法・統計モデル
– 適用する状況が異なる
• 実際的観点...How different
– 共通性の大きさ
– 尺度不変性,変数に関する不変性
• 少し高度な理論的観点
– 適合度:反証可能性
– 変数の数が大きいと両者の分析結果は一致
理論的比較
• 記述的方法・統計モデル
• 適用する状況が異なる
– 尺度化・信頼性等の議論をするときはFA
– 情報圧縮をするときはPCA
– 情報量減少が最小である代表値を求めるにはPCA
• たとえ分析結果が近くとも,使用すべき方法を
使用する
4
5
実際的比較
• 主成分分析の方が因子負荷が大きく推定
– 一見,よさそうな分析結果になることが大問題
• 尺度不変性,変数に関する不変性
6
少し高度な理論的観点
• 適合度
– 科学的研究には反証可能性が必要
• どのような仮定をおいたのか
• その仮定の妥当性は
• 変数の数が大きいと両者の分析結果は
一致(Schneeweiss-Mathes 1995; Bentler-Kano 1990)
– PCAはFAの代用として使える
– モデル探索に利用価値
7
SMCと最終共通性の比較
SMC
事前共通性
ゲール語
英 語
歴 史
計 算
代 数
幾 何
0.30
0.30
0.21
0.42
0.42
0.30
合計
1.94
反復
主因子法
主因子法
(PFA)
(IPFA)
SMC
SMC
0.41
0.49
0.39
0.41
0.30
0.36
0.52
0.62
0.52
0.57
0.37
0.37
2.51
2.81
SMCは最終共通性の
下限である
SMC
0.49
0.41
0.36
0.62
0.57
0.37
主成分
分析法
(PCA)
1
0.63
0.56
0.67
0.72
0.69
0.59
2.82
3.86
最尤法
(ML)
SMCと最終共通性の比較
共通性の反復経過
7
6
共通性合計
5
PCA
ML
PFA
IPFA
4
3
2
1
0
0
1
2
3
4
5 6 7
反復回数
8
9
10 11
8
SMCと最終共通性の比較:ズーム
共通性の反復経過
73
共通性合計
6
5
2.5
PCA
ML
PFA
IPFA
4
3
2
2
1
0
1.5
0 0 11 22
33
44
55 66 7
反復回数
反復回数
8
9
10 11
11
10
9
10
直交解 vs. 斜交解
• 近年,斜交解の報告が増加
– 因子が無相関であることはまずない
– SEMの影響
• 斜交か直交かはデータから決める
ものではない
• 研究者自身が決定すべきもの
11
直交解 vs. 斜交解
X1
X2
X3
X4
X5
X6
X7
X8
X9
F1
0.70
0.70
0.70
0.20
0.20
0.20
0.20
0.20
0.20
F1
F2
F3
1
0
0
Varimax
F2
0.20
0.20
0.20
0.70
0.70
0.70
0.20
0.20
0.20
0
1
0
F3
0.20
0.20
0.20
0.20
0.20
0.20
0.70
0.70
0.70
F1
0.74
0.74
0.74
0.02
0.02
0.02
0.02
0.02
0.02
Promax
F2
0.02
0.02
0.02
0.74
0.74
0.74
0.02
0.02
0.02
0
0
1
1
0.52
0.52
0.52
1
0.52
F3
0.02
0.02
0.02
0.02
0.02
0.02
0.74
0.74
0.74
Procrustes
F1
F2
0.75 0.00
0.75 0.00
0.75 0.00
0.00 0.75
0.00 0.75
0.00 0.75
0.00 0.00
0.00 0.00
0.00 0.00
F3
0.00
0.00
0.00
0.00
0.00
0.00
0.75
0.75
0.75
0.52
0.52
1
1
0.56
0.56
0.56
0.56
1
0.56
1
0.56
12
パス図でみると
13
最尤法 vs. 反復主因子法
• Myth
– 最尤法(ML)
• 正規分布のときに利用する
• 適合度の検定で棄却されるから使わない
• エラーが出ることがあり不安定だから
使わない
– 反復主因子法(PRINIT,PAF,PFA)
• 正規分布以外のときに利用する
– 最小2乗法(ULS)
• 正規分布以外のときに利用する
14
どのように対応する?
Case
Case
Case
Case
1
2
3
4
最尤法
OK
エラー
OK
エラー
反復主因子法
OK
OK
エラー
エラー
対応
最尤法
*
seldom
要検討
1.0より大きい1つまたは複数の共通性推定値が反復
間に発生しました。 結果の解を解釈する時は注意し
てください。
ERROR: Communality greater than 1.0.
15
Case 1
Case 1
最尤法
OK
反復主因子法
OK
対応
最尤法
• 最尤法で報告する
– せっかく厳しいチェックに合格しているのに
「反復主因子法」で報告するのはもったいない
– 「反復主因子法」で報告すると,「最尤法」では
解けないのではないかと誤解される
16
Case 2
Case 2
最尤法
エラー
反復主因子法
OK
• 「反復主因子法」で報告
– しばしばある対応
• 「最尤法」で報告
– オプション heywood をつけて分析
– 「エラー」の原因を解明することが大切
対応
*
17
推定方式の2つの側面 -1
反復主因子法
最尤法
規準
最小2乗
尤度
アルゴリズム
循環法
ニュートン法
最小2乗規準 :    ' とおく と

1
min tr S   2
( , ) 2
尤度規準


  
min ln   ln S  tr S 1  p
( , )
18
推定方式の2つの側面 -2
循環法
ニュートン法
最小2乗
反復主因子法
最小2乗法
尤度
*
最尤法
• 最小2乗法と反復主因子法は,多くの場合推定結果が
一致する
– 反復主因子法が最終解に到達した場合に一致する
– 循環法である反復主因子法は最終解に到達しない
ことがある
19
循環法 vs. ニュートン法
• 循環法
– 収束が遅い
– 反復の途中で止まり最終解に到達しない
ことがある
– 計算は簡単
– 「手回し計算機」時代の遺物?
• ニュートン法
– 現代科学の標準的最適化法
– 「鋭すぎる」ため不適解などを発見しやすい
20
最小2乗規準 vs. 尤度規準
• 最小2乗法と最尤法の選択は難しい.
議論はやや哲学的である
– データが多変量正規分布していると考えられるとき
は最尤法が良い(標準誤差が小さい,検出力が高
い)
– 多変量正規分布でないときは,標準誤差・検出力の
大小に関して優劣がない
– 最小2乗法の方が少し安定した解が得られるよう
– 最小2乗法は尺度不変でない
– 最小2乗法は適合度に関する情報が得にくい
21
推奨方法
• 因子分析の初級者は「反復主因子法」
– 質の良いデータでは推定結果は大きく違わない
– 最尤法は sensitive 過ぎて使いにくい
• 因子分析の中級者以上は「反復主因子法+最尤法」
– 解析の初期では反復主因子法,その後,最尤法に移行する
– 細かい解釈をするときは最尤解でないと不安がある
– モデルの適合に関する情報は最尤法でのみ出力される
• 最小2乗法(ULS)や一般化最小2乗法(GLS)などは分析
結果の吟味に使う
22
理由
• 反復主因子法・最尤法で問題なく解け,
推定値が近い場合
– 分析の信頼度・再現性が高い
– 将来,第三者が研究しても同じ結論が
得られる可能性が高い
• その他の場合
– 分析の信頼度・再現性が高くない
– 将来,第三者が研究しても同じ結論が
得られないかもしれない
23
適合度の見方
• 記述目的の場合は気にしない
– 変数のグルーピングなど
• 推測統計的に利用するときは重要
– 尺度化・信頼性の吟味
– 因子負荷量を細かく推測したい場合
• 使い方
– 中小標本の場合は適合度検定
– 大標本の場合はTucker-Lewisの指標
実例では
プロマックス斜交回転解
因子1 因子2
代数
0.61
0.10
幾何
0.66
-0.02
解析
0.76
-0.01
英語
0.39
0.55
国語
-0.05
0.80
古文
0.01
0.65
バリマックス直交回転解
因子1 因子2
代数
0.61
0.30
幾何
0.62
0.20
解析
0.71
0.25
英語
0.55
0.64
国語
0.23
0.74
古文
0.23
0.61
24
初
合
因子相関行列
因子1 因子2
因子1
1
0.64
因子2
0.64
1
因子相関行列
因子
因子1 因子2
因子1
1
0
因子2
0
1