因子分析と共分散構造分析

1997.11.20 行動談話会
因子分析と共分散構造分析
----- 最尤法のススメ ----狩野 裕
(行動工学・行動計量学)
http://koko15.hus.osaka-u.ac.jp/~kano/
1
自己紹介
専門:方法論,数理統計学・行動計量学
• 大阪大学理学部数学科卒業,
基礎工学研究科数理系専攻修了
•
•
•
•
•
海技大学校教養科 (運輸省)
大阪大学基礎工学部数理教室
大阪府立大学工学部数理工学科
筑波大学数学系情報数学
大阪大学人間科学部行動計量学
2
FACULTY OF HUMAN
SCIENCES
行動学専修
行動
工学
社会学専修
教育学専修
心理学実験:講座紹介
3
FACULTY OF HUMAN
SCIENCES
行動学専修
ボラン
ティア
社会学専修
教育学専修
心理学実験:講座紹介
4
関連学会など
日本心理学会
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
知覚 生理 思考 学習
発達 教育
臨床 人格 犯罪 矯正
社会 産業 文化
方法 原理 歴史 一般
日本
米国
行動計量学会 Psychometric
Society 600(22)
913
ASA
統計学会
15,000(??)
1,367
APA
心理学会
???(??)
5,500
5
Methodologist の仕事
• 方法論の研究
– 最適性,体系化,特長付,何をしているか
• 新しい統計解析法
– 開発・普及・ソフトウェア化
• 既存の統計解析法
– 評価・改良
• Do,or Don’t Do!!
– ガイドライン,使い分け,限界
• 応用研究(方法論を第一目的としない)
6
History of Academic Activities
1997
漸超
近高
理次
論の
不
適
解
の
問
題
楕
円
分
布
論
入共
門分
散
構
造
分
析
1990
推測の頑健性(CSA)
基礎
識別性
一致性
因子の
不確定性(FA)
非反復推定法
(FA)
臨床
1983 博士課程進学
7
本日のメニュー
• 因子分析モデルと因子抽出法
– 主成分分析 ・ 主因子法 ・ 最尤法
• 2組のデータの因子分析
– “ある”データ ・ 読解力のデータ
• なぜ最尤法か
• 検証的因子分析
• まとめ
8
因子分析モデルとは
観測変数間の内部相関(共分散)を
潜在変数からの影響の結果として
説明する統計モデル
9
イメージでの理解
10
因子分析の実行プロセス
•
•
•
•
•
•
•
•
データの吟味:2値データ,カテゴリカルデータ,偏りのあるデータ
主成分分析 vs 因子分析
相関行列 vs 分散共分散行列
因子抽出法:主因子法,最尤法,共通性の推定値は?
因子数の選定:1より大きい固有値数,スクリー法,適合度検定
因子抽出時の問題:共通性が1を超えました.反復が収束しません.
回転方法+直交軸か斜交軸か
結果の解釈
11
因子分析の因子抽出法
------ 探索的因子分析の推定方法 ------
•
•
•
•
•
•
•
主成分分析(PCA)
主因子法,主軸法(PFA,PAF)
反復主因子法(PFA,PAF)
最尤法(ML)
最小2乗法(ULS,LS)
一般化最小2乗法(GLS)
その他たくさん
12
簡便因子抽出法
非反復
ソフトウェア
SAS
反復
共通性
共通性
共通性
共通性
1
SMC
1
SMC
主成分分析 主因子法 反復主因子法 反復主因子法
M=PRIN
M=PRIN
PRIORS
=SMC
M=PRINIT
主成分分析 主成分分析 主因子法
SPSS
/EXTRACTION
PCA
Statistica 主成分分析
/EXTRACTION
PAF
/CRITERIA
ITERATE(1)
共通性=SMC
PAF: Principal Axis Factoring
/DIAGONAL
(1,1,....,1)
/EXTRACTION
PAF
M=PRINIT
PRIORS
=SMC
主因子法
/EXTRACTION
PAF
主軸法
13
二組のデータの因子分析
---- 因子抽出法の比較 ---• データ:“ある”データ,読解力のデータ
• 分析方法:主成分分析,主因子法,
反復主因子法,最尤法
14
“ある”データの分析(N=100)
X1
X1 1.000
X2 0.088
X3 0.024
X4 -0.089
X5 0.076
X6 0.095
X7 -0.099
X8 -0.110
X9 -0.028
X10 -0.006
X2
X3
X4
X5
X6
1.000
0.057
-0.096
0.073
0.009
-0.030
0.082
0.072
-0.183
1.000
-0.024
0.046
0.014
0.147
-0.023
0.066
0.006
1.000
-0.018
-0.126
-0.154
0.034
-0.020
-0.026
1.000
0.114
0.099
0.179
0.076
-0.047
1.000
0.020
-0.104
-0.108
0.176
X7
X8
X9
X10
1.000
-0.101 1.000
-0.230 0.161 1.000
-0.091 0.190 0.037 1.000
15
主成分分析+回転(バリマックス法)
回転後の空間の成分プロット
回転後の成分行列
1.0
成分
2
.386
.504
.347
-.511
.567
.386
.262
.100
.107
-.083
x5
x2
.5
x7
x6 x1
x3
x9x8
0.0
x10
x4
-.5
2
1
X1
-.069
X2
.175
X3
-.063
X4
.186
X5
.228
X6
-.215
X7
-.559
X8
.682
X9
.661
X10
.258
因子抽出法: 主成分分析
の
成
分
-1.0
-1.0
-.5
0.0
.5
1.0
1 の成分
16
主因子法+回転(バリマックス法)
回転後の因子行列
回転後の因子空間の因子プロット
回転後の因子空間の因子プロット
a
1.0
因子
1
X1
-.035
X2
.095
X3
-.037
X4
.098
X5
.143
X6
-.108
X7
-.358
X8
.445
X9
.401
X10
.191
因子抽出法: 主因子法
2
.194
.257
.184
-.289
.332
.246
.204
.052
.022
-.037
.5
x7
x6
x1
x3
x5
x2
x10
0.0
x9x8
x4
-.5
2
因
子
-1.0
-1.0
-.5
0.0
.5
1.0
因子1
17
反復主因子法+回転(バリマックス法)
回転後の因子空間の因子プロット
回転後の因子空間の因子プロット
回転後の因子行列
1.0
因子
2
.110
.198
.192
-.263
.415
.187
.339
.077
-.032
-.057
.5
x5
x7
x6 x3 x2
x1
x10
0.0
x8
x9
x4
-.5
因
子
2
1
X1
-.036
X2
.108
X3
-.024
X4
.087
X5
.207
X6
-.101
X7
-.345
X8
.516
X9
.414
X10
.148
因子抽出法=主因子法
反復回数=15
-1.0
-1.0
-.5
0.0
.5
1.0
因子1
18
最尤法+回転(バリマックス法)
共通性
初期の
X1
.060
X2
.078
X3
.039
X4
.063
X5
.094
X6
.103
X7
.147
X8
.145
X9
.107
X10
.134
因子抽出法: 最大尤度
因子抽出
.024
.007
.022
.024
.046
.011
.999
.999
.072
.041
1.0より大きい1つまた
は複数の共通性推定
値が反復間に発生し
ました。 結果の解を解
釈する時は注意してく
ださい。
19
最尤法+回転(バリマックス法)
回転後の因子空間の因子プロット
回転後の因子行列a
1.0
因子
.5
x5
x9 x10
x2
x4
x3
x1 x6
0.0
x7
-.5
因
子
2
1
2
X1
-.099
-.120
X2
-.030
.079
X3
.147
-.009
X4
-.154
.019
X5
.100
.190
X6
.020
-.103
X7
.999
-.004
X8
-.097
.995
X9
-.230
.139
X10
-.090
.182
因子抽出法: 最尤法
回転法: Kaiser の正規化を伴うバリマッ
クス法
a. 3回の反復で回転が収束しま
した。
-1.0
-1.0
-.5
0.0
.5
1.0
因子1
20
“ある”データの解析のまとめ
•
•
•
•
主成分分析:解釈可能な解
主因子法:解釈しにくい解
反復主因子法:解釈しにくい解
最尤法:解釈できない不適切な解
(共通性>1)
21
スクリープロット
因子のスクリー プロット
1.6
1.4
1.2
1.0
.8
固
有
値
.6
.4
1
2
3
4
5
6
7
8
9
10
因子の番号
22
読解力のデータ(Davis)
X1 語彙に関する知識
X2 与えられた状況に合致するように単語の意味を選択する力
X3 文章の構成を把握し,起こった事柄を識別する力
X4 文章の主題を捉える力
X5 文章中で正確に答えられている質問に答えられる力
X6 文章中とは異なった表現で問われた質問に答えられる力
X7 文章から内容に関して推論する力
X8 文学的表現を理解し,雰囲気を捉える力
X9 著者の意図を見抜く力
23
読解力のデータ:
相関行列(N=421)
X1
X2
X3
X4
X5
X6
X7
X8
X9
X1
X2
X3
X4
X5
X6
X7
X8
1
0.72
0.41
0.28
0.52
0.71
0.68
0.51
0.68
1
0.34
0.36
0.53
0.71
0.68
0.52
0.68
1
0.16
0.34
0.43
0.42
0.28
0.41
1
0.30
0.36
0.35
0.29
0.36
1
0.64
1
0.55 0.76
1
0.45 0.57 0.59
1
0.55 0.76 0.68 0.58
X9
1
24
スクリープロット
因子のスクリー プロット
6
5
4
3
2
固
有
値
1
0
1
2
3
4
5
6
7
8
9
成分番号
25
因子分析(1因子)
変数
主成分分析 反復主因子法
最尤法
X1
0.83
0.81
0.81
X2
0.84
0.81
0.81
度
X3
0.53
0.47
0.48
X4
0.47
0.41
0.41
由
2
i
X5
0.72
0.67
0.67
X6
0.89
0.89
0.89
X7
0.86
0.84
0.84
X8
0.71
0.66
0.66
X9
0.86
0.84
0.84
26
---- 2因子分析 ---主成分分析+回転(バリマックス法)
回転後の成分行列 a
回転後の空間の成分プロット
1.0
成分
1
2
.116
.277
-.338
.858
.201
.219
.213
.275
.234
.5
x8 x2
x7x6
x5 x9
x1
0.0
x3
-.5
2
X1
.834
X2
.789
X3
.657
X4
.237
X5
.694
X6
.868
X7
.832
X8
.660
X9
.824
因子抽出法: 主成分分析
x4
の
成
分
-1.0
-1.0
-.5
0.0
.5
1.0
1 の成分
27
主因子法+回転(バリマックス法)
回転後の因子空間の因子プロット
回転後の成分行列
1.0
因子
1
X1
.712
X2
.620
X3
.447
X4
.189
X5
.470
X6
.665
X7
.625
X8
.417
X9
.612
因子抽出法: 主因子法
2
.414
.523
.212
.409
.484
.586
.557
.525
.568
.5
x4
x7x6
x8x5 x9
x2
x1
x3
0.0
-.5
2
因
子
-1.0
-1.0
-.5
0.0
.5
1.0
因子1
28
反復主因子法+回転(バリマックス法)
因子行列
a 2個の因子の抽出が試みられました。反復
100 で変数の共通性が1.0を超えました。
抽出が終了しました。
29
最尤法+回転(バリマックス法)
回転後の因子行列 a
因子
1
X1
.380
X2
.616
X3
.380
X4
.408
X5
.608
X6
.784
X7
.713
X8
.587
X9
.710
因子抽出法: 最尤法
回転後の因子空間の因子プロット
共通性
2
.924
.526
.287
.135
.312
.445
.442
.310
.443
.999
.655
.227
.185
.467
.813
.704
.441
.701
x2
.5
x9 x6
x7
x5
x8
x3
x4
0.0
-.5
因
子
2
1.0より大きい1つまたは複
の共通性推定値が反復間に
数
発生しました。 結果の解を解
釈する時は注意してください。
x1
1.0
-1.0
-1.0
-.5
0.0
.5
1.0
因子1
30
読解力のデータの解析のまとめ
• 主成分分析:解釈できるかもしれない解
• 主因子法:解釈しにくい解
• 反復主因子法:解釈できない不適切な解
(共通性>1)
• 最尤法:解釈できない不適切な解
(共通性>1)
31
二組のデータの因子分析のまとめ
---- 解釈可能性 ---読解力の
“ある”データ
データ
主成分分析
○
○
主因子法
△
△
反復主因子法
△
共通性>1
最尤法
共通性>1 共通性>1
32
種明かし
• “ある”データ:互いに独立に分布する
10変数の相関行列
• 読解力のデータ:通常の因子分析では
適切に分析できないデータ(識別性の
問題)
33
共通性が1を超えるのは悪いことか?
---- 解析に対する警告 ---へんなデータ
きちんとしたデータ
不適切なモデル きちんとしたモデル
主成分分析 意味ありげな
安定
主因子法
結果
反復主因子法
警告(遅い)※
安定(遅い)※
最尤法
警告
ふつうは安定
※
収束判定基準を厳しくし(e.g., convergence=0.00001),
最大反復回数を十分大きく取る(e.g., iteration=500)
34
Methodologist からの提言
へんなデータに対しても意味ありげな解を
与える主成分分析・主因子法や
判定が遅い反復主因子法よりも
厳しい警告を瞬時に発する最尤法を利用
したい.
35
読解力のデータ:
検証的因子分析結果
変数
V1
V2
V3
V4
V5
V6
V7
V8
V9
語彙力
0.85
0.85
0
0
0
0
0
0
0
読解力
0
0
0.48
0.41
0.68
0.90
0.84
0.66
0.84
36
モデルの適合度
指標
検証的因子分析
カイ2乗値
36.412
df
26
p-value
0.08435
AIC
-15.58827
GFI
AGFI
CFI
0.982
0.969
0.995
1因子モデル
54.952
27
0.00116
0.95169
0.973
0.955
0.987
37
読解力のデータ:因子分析の吟味
---- なぜ通常の因子分析はうまくいかないのか ----
答:二つの変数にしか関連しない因子がある
ときは,通常の因子分析は不可能
*
*

因子パタ ーンが 0


0
*
*
*

*


 である と き ,



通常の因子分析は不可能.
38
証明
と なる . こ こ で,
因子モデルのパラ メ ータ が以下のよ う である と する .
11
 11


 

 21
  21

Cov(x)     0 2  0 2   

 

 
  

 0
  0

証明のポイ ント は, 因子負荷量などのパラ メ ータ が から
一意に決定さ れないこ と . つま り  から パラ メ ータ が識別
でき ないこ と を示す.
*
1
1
11
 11 11  1222
21 , *21  21 11  1222
21
11 
 
 21
* 
1/ 2
1/ 2
2  0 1222
 222
 

因子相関行列  は正定値であり , = 11 12 と 分割する と ,
21 22 
T
a
a

b
b




Cov(x)    0 *2 0 *2 




 

0
0

*
1  11

 a2


 2  *21  b2





3






 p 

と なって, 識別可能でないこ と が証明さ れる .
T
1
1/ 2  
1
1/ 2 

= 11  122221 1222  11  122221 1222 
1/ 2  
1/ 2 

0
22
0
22


と かける . こ のこ と に注意する と ,
T
*
*
11
11

 *
 *

21
21

   0 *2  0 *2   



 
 

 0
 0




 
  
 0 
である . さ て, a, bを ab  1121なる 任意の実数と する と
T
39
WISC-R
データの
因子分析
40
現在主流の分析方法
固有値による
因子数選定
+
主因子法
最尤因子分析
+
適合度の評価
検証的因子分析
+
適合度の評価
因子分析不可
41
まとめにかえて
---- 因子分析の手順 ----
• 分析の当初は主因子法などを行なってもよいが,論
文として出版するには最尤法(ML)による分析が要
求されるであろう.
• MLで共通性が1を超えたり(不適解),反復が収束
しないときは,検証的因子分析の適用を考える.
• 検証的因子分析では適合度の吟味が重要である.
• 因子分析的接近が成功しないデータもある.
• 従来の因子分析プログラムに加えて,共分散構造
分析のプログラムが必要な場合がある.
42
最近の興味
• 探索的因子分析のコンテックストにおける,
不適解(共通性が1を超える解)の原因と
処理 (紀要論文)
• (本来の)共分散構造分析とその効果的な
適用法
• Bootstrap法とその利用方法:多変量解
析でBootstrap法は有効か
43
共分散構造分析とは
直接観測できない潜在変数を導入し,その
潜在変数と観測変数との間の因果関係を同
定することにより社会現象や自然現象を理
解するための統計的アプローチ.基本的に
非実験多変量データの分析方法で,因子分
析と多重回帰分析(パス解析)の拡張.
44
参考文献
•
狩野(1997). AMOS EQS LISREL によるグラフィカル
多変量解析 --- 目で見る共分散構造分析 --- 現代数学
社.
• 狩野(1996.2~1997.3). 共分散構造分析とソフトウェア.B
ASIC数学連載記事.現代数学社.
• 狩野(1997).不適解の原因と処理:探索的因子分析.大
阪大学人間科学部紀要.
45