第3章 共分散構造分析で何ができる:応用編

1
第3章
共分散構造分析で何ができる:
応用編
平均構造モデル・多母集団の同時分析
実験データの分析
潜在曲線モデル
2
3.1節
平均構造モデルと多母集団の
同時分析
トレーニング効果の分析
出展:Sorbom(1978)
AMOSマニュアル 例9&例16
EQSマニュアル 第9章
狩野(1997/3) BASIC 数学
3
データ:Olsson(1973)
コントロール群(n=105)
トレーニング群(n=108)
一回目のテスト 二回目のテスト
類似語 反対語 類似語 反対語
分散・共分散
一回目のテスト 二回目のテスト
類似語 反対語 類似語 反対語
分散・共分散
37.626
24.933 34.680
26.639 24.236 32.013
23.649 27.760 23.565 33.443
50.084
42.373 49.872
40.760 36.094 51.237
37.343 40.396 39.890 53.641
平均
18.381 20.229 20.400 21.343
平均
20.556 21.241 25.667 25.870
4
データの素性
• 語彙(同意語と反対語)に関するテストを
一ヶ月おいて2回繰り返し実施する
• トレーニング群には,2回のテスト間に,
語彙に関するトレーニングを3回行う
• コントロール群には何もしない
5
解析目的と留意点
• 目的
– トレーニング効果の有無を検討したい
• 留意点
– 1回目のテストの練習効果を消す
– 2つの群への被験者割付のばらつきを
調整したい
– 2種のテストを同時に分析したい
• 次元縮小をしてから分析
• 希薄化を修正してから分析
6
平均の比較
反意語の得点
類似語の得点
30
30
25
25
20
20
15
15
10
10
一回目
トレーニング群
二回目
コントロール群
一回目
トレーニング群
二回目
コントロール群
7
平均構造モデル
コントロール群の分析
練習効果の評価
8
基本モデルと推定結果
Chi-square=0 (df=0)
9
標準解
Chi-square=0 (df=0)
通常は(潜在変数の)平均は0に
固定してある
0
0,
0
18.38
20.23
0,
0,
0
0,
0
0,
20.40
0,
21.34
0,
10
11
潜在変数の平均の意味
• 二回目のテストで平均が上昇しているのは
一回目のテストがトレーニングになってい
るからである
• これを,語彙に関する力が(やや)ついた
からだと解釈しよう
• つまり,E(post_verbal)>0 となったとして,
この平均に関する推測を行う
潜在変数に平均を導入する
18.58
0,
18.58
20.05
1.68
20.05
12
テスト受験効果あり
13
14
因子平均と切片
平均
データ モデル
pre_syn
pre_opp
post_syn
post_opp
18.38
20.23
20.40
21.34
18.58
20.05
20.26
21.48
切片
=
=
=
=
因子平均
18.58+1.00×0
20.05+0.90×0
18.58+1.00×1.68
20.05+0.85×1.68
切片:① データが採られた状況に依存する量
問題のレベル,採点の方法...
② 因子からの影響を受ける前の平均
15
多母集団の同時分析
16
多母集団の同時分析
• トレーニング群とコントロール群を二つの母集団
とみて分析する.
コントロール群(n=105)
トレーニング群(n=108)
一回目のテスト 二回目のテスト
類似語 反対語 類似語 反対語
分散・共分散
一回目のテスト 二回目のテスト
類似語 反対語 類似語 反対語
分散・共分散
37.626
24.933 34.680
26.639 24.236 32.013
23.649 27.760 23.565 33.443
50.084
42.373 49.872
40.760 36.094 51.237
37.343 40.396 39.890 53.641
平均
18.381 20.229 20.400 21.343
平均
20.556 21.241 25.667 25.870
17
個別分析:コントロール群
18
個別分析:トレーニング群
19
同時分析の手順
• 個別分析を行う
• 統計的検定により,群間のパラメータが
等しい(等置制約)かどうかを検討する
• 等置制約の無い最も制約のゆるいモデル
からスタートし,徐々に制約の数を増やし,
最後に全部のパラメータが等しいという
最も制約が強いモデルを検討する
20
モデルの検討
平均構造があるモデル
推定す
検討すべきモデル
る母数
の数
等置制約なし
25
因子負荷が等しい
23
因子間パス係数が等しい
22
V(pre_verbal)が 等しい
21
V(zeta)が 等しい
20
DF
3
5
6
7
8
モデルのカイ
2乗値
chi^2 P-値
3.04 0.39
3.28 0.66
4.56 0.60
9.27 0.23
19.35
0.01
RMS
EA
0.01
0.00
0.00
0.04
0.08
AIC
-2.96
-6.72
-7.44
-4.73
2.35
付加された等置制
約の直接検定
DF chi^2
P-値
2 0.24
1 1.28
1 4.71
1 10.90
0.89
0.26
0.03
0.00
最終モデル:コントロール群
21
最終モデル:トレーニング群
22
平均構造の入れ方
23
• 個別分析では,観測変数の平均(切片項)をPRE
とPOSTで等置することにより,潜在変数
pre_verbal と post_verbal の平均間の比較が
できるようになった
• 同時分析では,さらに,観測変数の平均(切片
項)を群間で等置する
• 潜在変数 verbal の4つの平均が比較可能になる.
• E[pre_verbal_c]=0 とおくことで, E[pre_verbal_t],
E[post_verbal_t], E[post_verbal_t] が推定できる
母集団の非均一性を調整した
トレーニング効果
E[post_v]
トレーニング群(T)6.94 =
コントロール群(C)1.61 =
差
5.33
E[pre_v]
5.31+0.90 × 1.81
1.61+0.90 × 0
3.70
24
25
平均差3.70の意味
• トレーニングによって,潜在変数 post_verbal
の平均が 3.70 上昇する.
– 被験者の割付けの偏りを修正したもの
– 一回目のテストの受験効果を除いた純粋な効果
• (一回目のテストを受けず)3回のトレーニング
だけすると, post_verbal の平均が 3.70 上昇
することが期待される
• テスト得点に関しては,synonyms は 3.70点,
opposites は 3.70×0.89=3.29点 の上昇が見
込める.
26
分析方法についてのまとめ
• 潜在変数(因子)の平均
– 同一の内容を測っている因子の平均は比較
可能である.一方の平均を0とおく
– 男女間の比較など,多母集団の同時分析で
因子平均の比較ができる
• 平均構造モデル
– 独立変数にはその変数の平均を,従属変数
には切片項を設定する
27
分析方法についてのまとめ:続
• 多母集団の同時分析
– 複数の母集団間で似た構造が認められること
がある
– 因果モデルが,どの程度母集団間で等置でき
るか
• 測定モデルの同等性,構造モデルの同等性を
検討する
– 母集団間で潜在変数平均が比較可能
28
簡便法
29
トレーニング効果の検定
簡便法
• training を表すグループ変数(X5=0,1)を
分析に組み入れる
• X5 を連続変数のように扱ってモデル構成
する
• 共分散行列の等質性の仮定が必要
30
データ
subject
1
2
3
…
105
106
…
213
pre-syn
15
18
25
…
15
14
…
19
pre-syn
pre-opp
post-syn
post-opp
training
pre-syn
1
0.783
0.782
0.704
0.163
SD
6.687
pre-opp
18
17
27
…
20
23
…
20
post-syn
20
16
30
…
24
28
…
23
post-opp
25
27
32
…
20
16
…
24
post-syn
post-opp
1
0.693
0.774
0.078
1
0.776
0.379
1
0.325
1
6.499
6.950
6.957
0.500
pre-opp
training
0
0
0
…
0
1
…
1
training
モデルと推定結果
31
32
分析結果のまとめ
• 簡便法からも,多母集団の同時分析と
同様の結論が得られるようである
• しかし,実は,群間で共分散行列が等質で
あるという仮定が必要である
• 多母集団の同時分析で,この仮定は偽で
あることが分かっている.
• このデータに対しては,簡便法は適切な分
析とは言いがたい.
二値変数を含む解析について
– 二値変数が独立変数であるときは,それを連続な
変数とみなして分析しても罪は重くない
• 群間で共分散行列が等質であるという仮定のチェックが
必要
– 二値変数が従属変数であるときは,特殊な推定
方法が要求される
• LISREL,EQS,Mplus などのプログラムでは分析可能
– 2群のデータを合併して分析するときは,群を0,1
で表した変数Xを導入し,この変数がどの様に他の
変数に効くかをモデル化して分析する必要あり
• 合併したデータを上記Xを入れずに分析するのはマズイ
33
34
実験データの分析について
• 共分散構造分析で実験データの分析を
することができる
• 代表的な分析方法が,多母集団の同時
分析である.
• 実験条件を0,1の記号で表し分析する
簡便法もある
– 共分散行列の等質性
• 比較する群が多いときには,簡便法しか
適用できないことがある
35
3.2節
実験データの分析
顧客満足度データの分析
出展:Churchill and Surprenant (1982 JMR)
An investigation into the determinants of
customer satisfaction
「菊の花」 の満足度を測定する
36
CSの基礎理論
期待度
(知覚された)
不一致度
(知覚された)
パフォーマンス
顧客満足度
不一致度(disconfirmation)
期待度とパフォーマンスの差
MRでの定訳は不確認
実験の手順と被験者の割付
2要因,各3水準の実験データ
菊の
期待度
高い
ほどほど
低い
菊のパフォーマンス
高い
ほどほど
低い
20人
20人
20人
20人
20人
20人
20人
20人
20人
37
期待度の操作(例)
38
3つの刺激文の中から一つを提示する
期待度を高める刺激: 「菊の花」はよろしいで.
なんというても心が和むわ.自分で育てるの
はムズイけど,売ってんのは花数も多いし立
派で形もきれいや.
期待度をそこそこにする刺激:
期待度を低める刺激: 「菊の花」なんて
自分で育てるのは難しいし,売ってんのは花
数が少ないしちっこい.買うんやったら,やっ
ぱり菊よりバラやカーネーションやな.
39
パフォーマンスの操作
コントロール
パフォーマンスレベル
する特徴
高い
ほどほど
低い
高さ
24 inches 15 inches 7 inches
花の数
18
8
5
幹の数
5
3
2
簡便法での分析
• 多母集団の同時分析は実行しにくい
– 2要因で各要因が3水準
– 9つの母集団の比較.......多すぎる
– 各母集団における標本サイズは20....
...小さすぎる
• 簡便法
実験水準を1,2,3 (or -1,0,1) で表し,これを
普通のデータとみなして分析
• 分析結果は因果の構造と平均の構造の
両方を表す
40
41
モ
デ
ル
と
分
析
結
果
42
潜在変数の平均
期待度
(V12)
-1
-1
-1
0
0
0
1
1
1
パフォーマンス
(V13)
-1
0
1
-1
0
1
-1
0
1
期待度 不一致度
(F1)
(F3)
-0.84
-0.51
-0.84
0.24
-0.84
0.98
0.00
-0.74
0.00
0.00
0.00
0.74
0.84
-0.98
0.84
-0.24
0.84
0.51
平均の計算例(3番目のF3)
0.98=(-1)*(-0.35+0.84*0.04+0.84*0.44*0.22)
+(+1)(0.64+0.47*0.22)
43
「実験データの分析」のまとめ
• 実験データの分析とは複数個の母集団の
比較である
– 母集団の数が少なければ「多母集団の同時
分析」を行う
– 普通は,母集団ごとに平均は異なるが,共分
散構造は同一であるという設定で分析する
(簡便法)
– パス図は,普通の共分散構造分析と同様に
因果関係を示すが,平均構造をも表す
44
3.3節
潜在曲線モデル
アルコールデータの分析
出展:Curran, P. J. (1999). A latent curve
framework for the study of development
trajectories in adolescent substance use
45
データ
46
全体平均の推移
アルコール消費回数と時間経過
アルコール消費回数
10
8
6
alc
alc+SD
alc-SD
4
2
0
-2
-4
観測時点
個人のプロフィール
アルコール消費回数と時間経過
回答者個人のプロフィール
アルコール消費回数
7
6
A君
Bさん
Cさん
線形 (A君)
線形 (Bさん)
線形 (Cさん)
5
4
3
2
1
0
0
1
2
観測時点
3
4
47
潜在変数モデルへ
48
A君の場合 Bさんの場合
 X 1( A)   0( A)  1( A) 0  e1( A)
 ( A)
( A)
( A)
( A)
X




1

e
 2
0
1
2
 X ( A)   ( A )   ( A ) 2  e ( A )
0
1
3
 3
 X 1( B )   0( B )  1( B ) 0  e1( B )
 ( B)
( B)
( B)
( B)
X




1

e
 2
0
1
2
 X ( B)   ( B)   ( B) 2  e( B)
0
1
3
 3
49
属性による違い
アルコール消費回数と時間経過
属性による違い
アルコール消費回数
7
A君
B君
Cさん
Dさん
線形 (A君)
線形 (B君)
線形 (Cさん)
線形 (Dさん)
6
5
4
3
2
1
0
0
1
2
観測時点
3
4
50
属性の違いを取り込んだモデル
属性の違いを取り込んだモデル:解説
• 属性によって系統的にβ0やβ1が影響を受
けることがある
• β0とβ1をその属性に回帰するのは自然
• 平均構造モデルで解析する
– α0,α1 は切片項
– E[性別]は“性別” の平均
• β0とβ1の相関は,この属性だけでは
完全に説明できない可能性あり
– D1とD2間に相関を許しておく
• 他にもβ0とβ1に影響する変数もあり得る
51
52
実際の分析モデル1
53
第4章
因果分析について
因果の方向を探る
因果の大きさを正確に測定する
54
因果推論
• 因果の方向を如何に探るか
– 同値モデル,操作変数法,共分散選択
• 因果の大きさを如何に正確に
(バイアスなく)測るか
– 第三変数の影響,共変量選択(バックドア規準)
相関係数から因果の方向は決まらない
---同値モデルの問題--相関構造
X
Y
X
1
r
Y
r
1
• データから区別できないモデルを同値モデルという
• 「区別できない」とは適合度が同一であることをいう
55
56
同値モデル例
57
因果の方向を決める:
操作変数法(Instrumental variable method)
相関構造
X
Y
Z
X
1
b12
b13
Y
1
0
相関構造
Z
1
X
Y
Z
X
1
b21
b13
Y
Z
1
b21b13
1
58
操作変数法とは
• X,Yのいずれかに影響を及ぼし,他方へ
の直接効果をもたない変数Z(操作変数)
を観測する.
• X,Y,Zの相関構造から,X→Y or Y←X を
判断する.
• 操作変数の適切さが検討できる.
双方向因果モデル(非逐次モデル)
59
60
ひとつの例
出展:
AMOSマニュアル
61
共分散構造分析による因果の決定
• 対立モデルが同値モデルにならないようにする.
• そのための一つの方法が操作変数の導入.
• 因果を決定したか?
– X→Y,X←Y,X←→Yのいずれかであるという仮定の
下で,どれがデータに矛盾しないかを決定しているに
すぎない.つまり,「因果関係にない」という可能性を
排除していない.
– 「X→Y」が分かっても,「XはYの“主要な”原因である
とは言いきれない.R2の大きさに注意すべきである.
R2=0.1でもモデルは適合する(モデルの適合度とR2
は別概念).このような場合,XはYの原因のごく一部
である.
62
因果の大きさを正確に測定する
第三変数(未分析変数)の影響
観察データ分析の最大の
ウィークポイント
63
観察研究と実験研究
• 実験研究
– 原因系の変数に水準を設定し,水準ごとに
無作為化を行いデータを採取する
– 水準の恣意性に問題
– 第三変数(未分析変数)の影響をシャットアウト
• 観察研究
– 無作為に被験者を抽出して全変数を観測する
– 第三変数(未分析変数)の影響
64
第三変数の影響
観察研究にはバイアスが生じる
Y
× ×
×
××
×
X
実験研究にはバイアスが生じない
Y
×
×
×
x1
×
×
×
x2
X
65
第三変数の影響:例
Cor(喫煙量,肺がん発症率)=b21  12
66
因果方向決定にも影響
X
Y
Z
X
1
*
*
Y
Z
1
0
1
誤ってY→Xと結論
してしまう
適合度による
第三変数の影響の検出
検出可能な例
モデル
真の状況1
真の状況2
67
「因果分析」のまとめ
• 共分散構造分析は,観察研究の弱点である
第三変数の影響を受ける.
– 状況によっては、適合度の悪化により第三変数
による影響を疑うことができよう.
• モデル構築の段階で,因果仮説を十分に吟
味し,重要な影響を与える変数を分析から
落とさないようにする.
– データを採る前が大事
• 因果の方向に興味があるときは,操作変数
法などを用いて,対立モデルを識別できるよ
うにしたモデル構成を行う.
68
69
応用編終了です
お疲れさまでした
早く飲みたい!
70
予稿集訂正:
参考文献の出版年,巻,ページにタイプミスが
ありました
• Bollen, K. A., & Paxton, P. (1998). 5, 267-293.
• Bullock, H. E., Harlow, L. L., & Mulaik, S. A.
(1994). 1, 253-267
• Chou, C. P., Bentler, P. M., & Pentz, M. A.
(1998). 5, 247-266.
• McArdle, J. J., & McDonald, R. P. (1984). 37,
234-251.
71
以下第3章・第4章の
参考スライド
72
質問項目 その1
• 期待度1
(7項目)
• 期待度2
• パフォ1
(7項目)
• パフォ2
• 不一致度1
(10項目)
花の色
美しい....美しくない
花の数
多い....少ない
全体的評価 すばらしい....よくない
花の色
優れている....劣っている
花の数
多い....少ない
全体的評価 すばらしい....よくない
私が期待していた花の数は
多すぎた...正確であった...少なすぎた
提示された花は
私が想定してい
たよりも少ない
• 不一致度2
提示された花は
私が想定してい
たとおり
提示された花は
私が想定してい
たよりも多い
私の全体的評価に関する期待度は
高すぎた...正確であった...低すぎた
提示された花は
私が想定してい
たよりも悪い
提示された花は
私が想定してい
たとおり
提示された花は
私が想定してい
たよりも良い
73
質問項目 その2
• 満足度1 花の数は十分多い
(10項目)
大いに賛成である.....まったく反対である
• 満足度2 これぐらいの花の数は
(10項目)
好きだ....どちらでもない....嫌いだ
• 満足度3 全体的評価
おおいに満足.......おおいに不満足
• 満足度4 全体的評価
顔から選ぶ
• 満足度5 購入可能性(%)
0
50
100
注: 分析には満足度1,2を用いた
74
コントロールがうまくいっているか
75
平均が異なる母集団を合併して
分析するには
• 異なる平均をモデル化して分析する
• 母集団を表す(ダミー)変数を独立変数に配して,
どの変数の平均に影響するかを検討する
– ダミー変数間には相関を設定しておく
• 「平均が異なる」という情報を無視して,一つの
母集団と思って分析するのは間違い
– 「平均が異なる」という情報を無視すると観測変数の
相関係数が大きくなり,分析結果はそれらしくなること
がある.しかし,それは誤りである.要注意!!
76
例
単一母集団からのデータ
と見なせる場合
平均も因果モデルも
全属性に関して共通
男女で平均は異なるが,
共通の因果モデル(共分
散構造)が成立
例:つづき
男女で因子平均が異な
るが,共通の因果モデル
(共分散構造)が成立
属性(グループ)がたくさ
んある場合
属性間で因子平均が異なるが,
共通の因果モデル(共分散構
造)が成立
77
78
実
際
の
分
析
モ
デ
ル
2